💖 Hongsi's Study/📊 통계・공간통계・공간최적화

[통계] min - max 표준화

김 홍시 2023. 4. 13.
반응형

민맥스(Min-Max) 표준화는 데이터를 0과 1 사이의 값으로 변환하는 방법입니다. 이 방법은 모든 특성(feature)을 동일한 스케일로 변환하며, 데이터의 분포를 일정하게 조정할 수 있습니다.


데이터를 민맥스 스케일링하는 방법은 각 특성의 최솟값(minimum)을 0으로, 최댓값(maximum)을 1로 지정하고, 나머지 값들을 그 범위에 맞게 비례하여 조정합니다. 따라서 식으로 표현하면 아래와 같습니다.


(x - min) / (max - min)


여기서 x는 해당 특성(feature)의 값이며, min은 해당 특성의 최솟값, max는 해당 특성의 최댓값입니다. 이 방법을 통해 모든 특성이 동일한 범위(0과 1)에 속하게 되며, 분포가 일정하게 조정됩니다.


하지만 이 방법은 이상치(outlier)가 있는 경우, 이상치의 존재로 인해 다른 데이터들이 0과 1 사이의 범위에 비해 현저하게 작아지는 문제가 발생할 수 있습니다. 따라서 이상치가 있는 경우에는 다른 표준화 방법을 고려해야 할 수 있습니다.

반응형

댓글