💖 Hongsi's Study501 [통계] 척도(scale)의 네 가지 종류 (명목 nominal/서열 ordinal/등간 interval/비율 ratio) 통계학에서 사용되는 척도(measure)는 데이터의 성질을 측정하거나 설명하기 위한 방법을 제공합니다. 주요한 척도는 다음과 같습니다: 명목 척도 (Nominal Scale) 정의: 단순히 카테고리나 라벨로 구분하는 척도입니다. 예시: 성별(남, 여), 혈액형(A, B, AB, O) 등 수학적 연산: 불가능 서열 척도 (Ordinal Scale) 정의: 카테고리 간에 순서가 있는 척도입니다. 예시: 학점(A, B, C, D, F), 설문 조사 응답(매우 만족, 만족, 보통, 불만족) 수학적 연산: 크기 비교 가능, 그러나 평균이나 표준편차 등을 계산하는 것은 무의미 등간 척도 (Interval Scale) 정의: 순서 뿐만 아니라 간격도 동일한 척도입니다. 예시: 섭씨 온도, IQ 지수 수학적 연산: 덧.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 9. 10. [통계] 거리를 측정하는 여러가지 방법들 (유클리디안/맨해튼/코사인/자카드) 거리를 측정하는 방법은 여러 가지가 있으며, 적용 분야나 목적에 따라 다르게 선택될 수 있습니다. 수학적/통계적 거리 측정 방법 유클리디안 거리(Euclidean Distance): 두 점 사이의 직선 거리를 계산하는 가장 기본적인 방법입니다. (d(x, y) = \sqrt{\sum_{i=1}^{n} (x_i - y_i)^2}) 맨해튼 거리(Manhattan Distance): 각 축에 대한 차이의 절대값을 더합니다. (d(x, y) = \sum_{i=1}^{n} |x_i - y_i|) 코사인 유사도(Cosine Similarity): 두 벡터 간의 코사인 각도를 사용해 유사성을 측정합니다. 유사도를 거리로 변환할 수도 있습니다. 지오데식 거리(Geodesic Distance): 두 점을 잇는 가장 짧은.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 9. 10. [보도자료]「인천광역시 제물포구·영종구·검단구 설치에 관한 법률안」 입법예고 보도자료 보도시점 2023. 9. 10.(일) 12:00 약 30년 만에 인천광역시 행정구역 개편 추진 -「인천광역시 제물포구·영종구·검단구 설치에 관한 법률안」 입법예고 - 중구·동구를 제물포구(내륙·원도심), 영종구(도서 지역)로 개편 - 서구를 아라뱃길을 경계로 분리하여 북쪽에 검단구 설치 □ 정부는 「인천광역시 제물포구영종구검단구 설치에 관한 법률안(이하 ‘법률안’)」을 9월 11일(월)부터 10월 23일(월)까지 42일간 입법예고 한다. ○ 법률안은 ▲ 중구 내륙 지역과 동구를 관할하는 제물포구 설치 ▲ 중구 영종도 지역을 관할하는 영종구 설치 ▲ 서구 아라뱃길 북쪽을 관할하는 검단구 설치 등을 담고 있다. □ 인천시(시장 유정복)는 생활권 불일치에 따른 주민 불편 해소, 인구·면적 조정을 .. 💖 Hongsi's Study/🏡 국토부 보도자료 2023. 9. 10. [통계] Jaccard's Coefficient Jaccard's Coefficient(또는 Jaccard Index)는 두 개의 집합이 얼마나 유사한지를 측정하기 위한 통계적 지표 중 하나입니다. 이것은 데이터 과학, 정보 검색, 패턴 인식 등 다양한 분야에서 사용됩니다. Jaccard's Coefficient는 다음과 같이 정의됩니다: J(A, B) = (A ∩ B) / (A ∪ B) 여기서: J(A, B): 두 집합 A와 B의 Jaccard's Coefficient입니다. A ∩ B: A와 B의 교집합, 즉 A와 B 모두에 속하는 원소들의 집합입니다. A ∪ B: A와 B의 합집합, 즉 A 또는 B 중 어느 하나에 속하는 모든 원소들의 집합입니다. Jaccard's Coefficient는 0과 1 사이의 값을 가지며,.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 9. 7. [통계] Metric distances / Semimetric distances / Nonmetric distances 메트릭 거리 (Metric Distances) 유클리디안 거리 (Euclidean Distance) 유클리디안 거리는 가장 기본적인 거리 측정 방법으로, 두 점 ( A )와 ( B )가 각각 ( (x_1, y_1, z_1, \ldots) )과 ( (x_2, y_2, z_2, \ldots) ) 좌표를 가질 때, 그 거리는 다음과 같이 계산됩니다. [ \text{Distance} = \sqrt{(x_2 - x_1)^2 + (y_2 - y_1)^2 + (z_2 - z_1)^2 + \ldots} ] 코드 거리 (Chord Distance) 코드 거리는 두 점 사이의 '코드'를 사용하여 거리를 측정합니다. 이는 주로 고차원 데이터나 벡터 공간에서 사용됩니다. [ \text{Chord Distance} = \sqr.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 9. 7. [도시지리] 젠트리피케이션/Ley/Smith/이론/한국 사례 젠트리피케이션(Gentrification)이란 저소득이나 노후화된 지역에 고소득층이 들어와 부동산 가격이 상승하고 지역 사회 구조가 바뀌는 현상을 의미한다. 한국에서 젠트리피케이션 현상은 여러 지역에서 관찰되고 있으며, 특히 서울 등 대도시에서 이 현상이 두드러지게 나타난다. 서울의 이태원, 홍대, 성수동 등의 지역은 젠트리피케이션의 대표적인 사례로 꼽힌다. 이러한 지역은 과거에는 비교적 저렴한 주거지나 상점, 공장, 공방 등이 주를 이루었지만, 최근에는 높은 임대료와 부동산 가격 상승으로 인해 원래의 주민이나 상인들이 지역을 떠나고, 대신에 카페, 갤러리, 고급 레스토랑 등이 들어서는 현상이 일어나고 있다. 이러한 젠트리피케이션은 부동산 가격 상승과 더불어 지역 내 사회적, 문화적 변화를 가져온다. 일.. 💖 Hongsi's Study/🌏 지리・도시・공간 2023. 9. 7. [통계] 로지스틱회귀 :: 연속형변수와 범주형 변수를 사용할 때 차이 로지스틱 회귀(logistic regression)는 일반적으로 분류 문제를 해결하기 위해 사용되는 통계 모델입니다. 연속형 변수(continuous variables)와 범주형 변수(categorical variables)는 로지스틱 회귀 모델에서 다르게 처리됩니다. 다음은 주요 차이점입니다. 연속형 변수 (Continuous Variables) 가설 공간: 연속형 변수는 실수 값을 가집니다. 이러한 변수들은 일반적으로 모델에 직접 적용될 수 있습니다. 스케일링: 연속형 변수는 여러 단위를 가질 수 있으므로, 일반적으로 스케일링(예: 표준화, 정규화 등)이 필요할 수 있습니다. 다항식 특성: 연속형 변수는 고차 다항식 특성으로 변환될 수 있어, 복잡한 관계를 모델링할 수 있습니다. 범주형 변수 (Cat.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 9. 7. [부동산] 지역주택조합 사업이란? 지역주택조합 사업이란? 서울특별시, 인천광역시 및 경기도에 거주하는 무주택자 또는 85㎡이하 주택 1채 소유자가 모여 주택법에 의하여 조합을 설립하고, 사업대상지의 토지를 확보하여 등록사업자와 협약을 맺고 공동으로 아파트 건설을 추진하는 사업입니다. 지역주택조합설립인가의 요건은? 주택건설예정 세대수의 1/2 이상(20인 이상)의 조합원이 모여 조합설립을 위한 창립총회를 개최한 후 총회 회의록, 조합장 선출동의서, 조합규약, 조합원 명부, 사업계획서 등 제반서류와 해당지역 토지에 대한 토지사용승낙서(전체 대지의 80% 이상)를 갖추어 조합설립인가 신청을 하여야 합니다. 조합원 자격은? 주택조합설립인가 신청일(투기과열지구는 조합설립인가 신청일 1년 전의 날)부터 해당 조합주택의 입주가능일까지 주택을 소유하지.. 💖 Hongsi's Study/🏠 부동산 2023. 9. 6. [공간통계] 앙상블학습 (ensemble machine learning) 앙상블 학습(Ensemble Learning)은 여러 개의 기본 모델(base models)을 결합하여 하나의 강력한 예측 모델을 만드는 머신러닝 방법이다. 이 기법은 개별 모델의 한계와 약점을 보완하며, 일반적으로 단일 모델보다 더 높은 성능을 보인다. 앙상블 학습은 분류, 회귀, 클러스터링 등 다양한 머신러닝 문제에 적용할 수 있다. 앙상블 방법에는 여러 가지 전략이 있다: 배깅(Bagging): 같은 유형의 여러 모델을 독립적으로 학습시키고, 그 예측을 투표나 평균으로 결합한다. 랜덤 포레스트(Random Forest)가 이에 해당한다. 부스팅(Boosting): 약한 모델을 순차적으로 학습시켜, 이전 모델들의 오차를 보정하는 새로운 모델을 생성한다. AdaBoost, Gradient Boostin.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 9. 4. [공간통계] 생존분석 (event-history (survival) analysis) 생존분석, 또는 이벤트 히스토리 분석(event-history analysis),은 시간이 지남에 따라 특정 이벤트(예: 사망, 결혼, 구매 등)가 발생할 확률을 분석하는 통계적 방법입니다. 이 분석은 특히 의학, 생물학, 경제학, 사회과학 등 다양한 분야에서 사용된다. 기본적인 아이디어는 '생존 함수(Survival Function)'를 통해 어떤 시점까지 특정 이벤트가 발생하지 않을 확률을 모델링하는 것이다. 생존분석은 '좌측절단(left-censoring)'과 '우측절단(right-censoring)'과 같은 데이터 절단 문제를 적절히 다룰 수 있다. 예를 들어, 연구가 시작한 시점 이전에 이미 이벤트가 발생한 경우나 연구가 끝난 시점까지 이벤트가 발생하지 않은 경우 등을 고려할 수 있다. 대표적인.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 9. 4. [공간통계] 다수준 모형 (multilevel or mixed-effect model) 다수준 모형(Multilevel or Mixed-Effect Model)은 계층적 또는 중첩된 데이터 구조를 가진 데이터에 적용되는 통계 모델이다. 이 모델은 일반적인 회귀 모델이나 일반화 선형 모델(GLM)을 확장한 형태로, 각 계층에서 발생하는 랜덤 효과를 모델링할 수 있다. 예를 들어, 학생들이 여러 학교에 속하는 데이터에서, 학생 수준과 학교 수준의 효과를 동시에 고려할 수 있다. 다수준 모형은 '고정 효과(fixed effects)'와 '랜덤 효과(random effects)' 두 가지 종류의 효과를 포함한다. 고정 효과는 전체 모집단에 일반적으로 적용되는 효과를 나타내며, 랜덤 효과는 각 계층이나 그룹 내에서만 발생하는 효과를 나타낸다. 이 모델은 교육, 의료, 심리학, 생태학 등 다양한 분야.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 9. 4. [공간통계] 범주형 자료의 상관분석 (categorical association measure) 범주형 자료의 상관분석(categorical association measure)은 두 개 이상의 범주형 변수 간의 관계를 측정하는 통계적 방법이다. 대표적인 방법에는 카이제곱(Chi-squared) 테스트, 상관비(Correlation ratio), 포아송 회귀 등이 있다. 이러한 측정 방법은 범주형 변수 간에 어떤 패턴이나 관계가 있는지를 파악하는 데 도움을 준다. 카이제곱 테스트: 이 테스트는 주로 교차표(contingency table)를 사용하여 두 범주형 변수의 독립성을 검정한다. 만약 통계적으로 유의한 결과가 나온다면, 이는 두 변수가 독립적이지 않다는 것을 의미한다. 상관비(Correlation ratio): 이는 하나의 범주형 변수와 하나의 연속형 변수 사이의 관계를 측정한다. 예를 들어.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 9. 4. 이전 1 ··· 22 23 24 25 26 27 28 ··· 42 다음 반응형