💖 Hongsi's Study/📊 통계・공간통계・공간최적화

[통계] 거리를 측정하는 여러가지 방법들 (유클리디안/맨해튼/코사인/자카드)

김 홍시 2023. 9. 10.
반응형

거리를 측정하는 방법은 여러 가지가 있으며, 적용 분야나 목적에 따라 다르게 선택될 수 있습니다.

수학적/통계적 거리 측정 방법

  1. 유클리디안 거리(Euclidean Distance): 두 점 사이의 직선 거리를 계산하는 가장 기본적인 방법입니다. (d(x, y) = \sqrt{\sum_{i=1}^{n} (x_i - y_i)^2})
  2. 맨해튼 거리(Manhattan Distance): 각 축에 대한 차이의 절대값을 더합니다. (d(x, y) = \sum_{i=1}^{n} |x_i - y_i|)
  3. 코사인 유사도(Cosine Similarity): 두 벡터 간의 코사인 각도를 사용해 유사성을 측정합니다. 유사도를 거리로 변환할 수도 있습니다.
  4. 지오데식 거리(Geodesic Distance): 두 점을 잇는 가장 짧은 경로 상의 거리, 특히 지구의 표면 같은 곡면에서 사용됩니다.
  5. 마할라노비스 거리(Mahalanobis Distance): 데이터의 공분산 행렬을 고려하여 거리를 측정합니다.

공간적 거리 측정

  1. GPS를 사용한 거리 측정: 위도와 경도 정보를 사용하여 두 지점 간의 거리를 계산합니다.
  2. 레이더나 소나를 이용한 거리 측정: 물체까지의 거리를 물결이나 신호가 이동하는 시간을 측정하여 계산합니다.

텍스트/정보 이론적 거리

  1. 레벤슈타인 거리(Levenshtein Distance): 두 문자열을 같게 만들기 위해 필요한 최소한의 수정(삽입, 삭제, 교체) 횟수입니다.
  2. 해밍 거리(Hamming Distance): 동일한 길이를 가진 두 문자열에서 다른 위치의 개수입니다.
  3. Jaccard 유사도: 두 집합 간의 교집합과 합집합을 사용하여 유사도를 측정하며, 1에서 빼면 거리로 사용할 수 있습니다.

기타

  1. 지리적 거리: 두 지리적 위치 간의 실제 또는 추정 거리입니다.
  2. 사회적 거리: 두 개인 또는 두 집단 간의 문화적, 경제적, 사회적 차이를 표현하는 데 사용될 수 있습니다.

이렇게 다양한 방법으로 거리를 측정할 수 있으며, 분야나 목적에 따라 적절한 거리 측정 방법을 선택해야 합니다.

반응형

댓글