반응형
민맥스(Min-Max) 표준화는 데이터를 0과 1 사이의 값으로 변환하는 방법입니다. 이 방법은 모든 특성(feature)을 동일한 스케일로 변환하며, 데이터의 분포를 일정하게 조정할 수 있습니다.
데이터를 민맥스 스케일링하는 방법은 각 특성의 최솟값(minimum)을 0으로, 최댓값(maximum)을 1로 지정하고, 나머지 값들을 그 범위에 맞게 비례하여 조정합니다. 따라서 식으로 표현하면 아래와 같습니다.
(x - min) / (max - min)
여기서 x는 해당 특성(feature)의 값이며, min은 해당 특성의 최솟값, max는 해당 특성의 최댓값입니다. 이 방법을 통해 모든 특성이 동일한 범위(0과 1)에 속하게 되며, 분포가 일정하게 조정됩니다.
하지만 이 방법은 이상치(outlier)가 있는 경우, 이상치의 존재로 인해 다른 데이터들이 0과 1 사이의 범위에 비해 현저하게 작아지는 문제가 발생할 수 있습니다. 따라서 이상치가 있는 경우에는 다른 표준화 방법을 고려해야 할 수 있습니다.
반응형
'💖 Hongsi's Study > 📊 통계・공간통계・공간최적화' 카테고리의 다른 글
[통계] 다중공선성 vs. 완전공선성 (헷갈리는 통계 개념 정리) (0) | 2023.06.21 |
---|---|
[공간최적화] 다목적 최적화 문제(multi-objective optimization problem) (0) | 2023.04.23 |
[공간통계] 공간회귀 - Spatial lag model, Spatial error model (2) | 2023.02.22 |
[데이터 시각화] 데이터 별 시각화 방법 (0) | 2023.02.19 |
[자격증] 빅데이터분석기사 정보 총 정리 : 필기, 실기 / 문항 / 문제 수 / 일정 / 주의사항 (0) | 2023.02.05 |
댓글