💖 Hongsi's Study/📊 통계・공간통계・공간최적화52 [공간통계] 공간회귀분석 (Spatial Regression Analysis): SAR & GWR 공간회귀분석 (Spatial Regression Analysis): SAR & GWR공간 데이터는 지리적으로 인접한 값들 간의 자기상관이 강하게 나타나는 특징이 있습니다.일반적인 회귀분석(OLS)은 공간적 의존성(spatial dependency)을 고려하지 않기 때문에 **공간적 자기상관을 반영한 공간회귀모형(Spatial Regression Models)**이 필요합니다.대표적인 공간회귀분석 기법에는 **SAR(공간자기회귀, Spatial Autoregressive Model)**과 **GWR(지리적 가중 회귀, Geographically Weighted Regression)**이 있습니다.📌 1. 공간자기회귀모형(SAR: Spatial Autoregressive Model)SAR 모델은 종속변수(.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2025. 3. 18. [공간통계] 커널 밀도 추정(Kernel Density Estimation, KDE)이란? 커널 밀도 추정(Kernel Density Estimation, KDE): 데이터의 분포를 부드럽게 추정하는 기법🔍 커널 밀도 추정(KDE)란?커널 밀도 추정(KDE, Kernel Density Estimation)은 연속형 데이터의 확률 밀도 함수를 추정하는 비모수적(non-parametric) 기법입니다.즉, 데이터가 어떤 특정한 분포(예: 정규분포)를 따른다고 가정하지 않고, 주어진 데이터로부터 부드러운 확률 밀도 함수(PDF)를 추정하는 방법입니다.📌 주요 특징히스토그램보다 부드러운 분포 곡선을 제공적절한 밴드폭(bandwidth) 선택이 중요공간 데이터 분석에서는 **핫스팟 분석(밀집 지역 탐색)**에 활용📌 KDE의 핵심 개념KDE는 각 데이터 포인트 주변에 커널 함수(kernel fun.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2025. 3. 18. [공간통계] Getis-Ord Gi*란? Getis-Ord Gi*: 공간 핫스팟(Hotspot) 분석의 핵심 지표🔥 Getis-Ord Gi*란?Getis-Ord Gi* 통계량은 **공간적 클러스터링(Hotspot & Coldspot)**을 식별하는 데 사용되는 공간 통계 기법입니다. 특정 공간 내에서 값이 유의미하게 높거나 낮은 지역을 찾고, 이를 통해 **핫스팟(Hotspot)과 콜드스팟(Coldspot)**을 분석하는 데 활용됩니다.핫스팟(Hotspot): 특정 지역 주변에서 값이 지속적으로 높게 나타나는 경우콜드스팟(Coldspot): 특정 지역 주변에서 값이 지속적으로 낮게 나타나는 경우Getis-Ord Gi*는 범죄 데이터, 부동산 시장 분석, 상업시설 밀집도 분석, 공공보건 연구 등 다양한 분야에서 공간적 패턴을 탐색하는 데 활용됩.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2025. 3. 18. [공간통계] Geary's C란? Geary’s C: 공간 자기상관 분석의 또 다른 지표🔍 Geary’s C란?Geary’s C는 **공간 자기상관(Spatial Autocorrelation)**을 측정하는 지표로, Moran’s I와 유사하지만 값들의 국지적(local) 차이를 중점적으로 분석하는 것이 특징입니다. Moran’s I가 전체적인 공간적 패턴(글로벌 자기상관)을 측정하는 반면, Geary’s C는 개별 지역 간의 차이를 강조하여 보다 세밀한 공간 패턴을 식별하는 데 유용합니다.Moran’s I vs. Geary’s CMoran’s I는 **전체적인 경향(글로벌 패턴)**을 분석Geary’s C는 **인접한 지역 간의 값 차이(로컬 패턴)**를 분석Moran’s I가 클러스터링을 강조한다면, Geary’s C는 경계(디스컨.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2025. 3. 18. [공간통계] Moran's I란? Moran’s I: 공간 자기상관 분석의 핵심 지표🔍 Moran’s I란?Moran’s I는 공간 자기상관(spatial autocorrelation)을 측정하는 대표적인 지표로, 공간 데이터에서 특정 값이 이웃한 지역과 유사한 패턴을 보이는지, 아니면 무작위로 분포하는지를 분석하는 데 사용됩니다.공간 자기상관(Spatial Autocorrelation): 지리적으로 가까운 데이터들이 유사한 특성을 가지는 경향을 의미합니다.Moran’s I 값+1에 가까울수록 강한 양의 공간 자기상관 (비슷한 값들이 클러스터링됨)0에 가까울수록 공간적 무작위성-1에 가까울수록 강한 음의 공간 자기상관 (서로 다른 값들이 인접)📌 Moran’s I 수식Moran’s I는 다음과 같은 공식으로 계산됩니다.NN: 총 관측.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2025. 3. 18. [통계 자료] 북한 주요도시 인구 시점북한북한북한북한북한남한남한남한남한남한남한남한남한시점평양청진함흥신의주원산서울부산대구인천광주대전울산세종202331586535433293609400328423603009146314741106392 출처https://kosis.kr/statHtml/statHtml.do?mode=tab&orgId=101&tblId=DT_1ZGA281&vw_cd=MT_BUKHAN&list_id=101_001_001&conn_path=MT_BUKHAN&path=%252Fbukhan%252FstatisticsList%252FstatisticsListIndex.do 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2024. 12. 24. [통계 자료] 북한, 남한 성별/연령별 인구 비교 https://kosis.kr/statHtml/statHtml.do?mode=tab&orgId=101&tblId=DT_1ZGA261&vw_cd=MT_BUKHAN&list_id=101_001_001&conn_path=MT_BUKHAN&path=%252Fbukhan%252FstatisticsList%252FstatisticsListIndex.do KOSIS kosis.kr 국가별(1)성별(1)연령별(1)2022북한계계25697258북한계0 - 4세1546129북한계5 - 9세1677314북한계10 - 14세1681520북한계15 - 19세1700350북한계20 - 24세1866562북한계25 - 29세2020915북한계30 - 34세1965423북한계35 - 39세1775358북한계40 - 44세16489.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2024. 12. 24. [통계 사이트] 전세계 국가별 통계청 사이트 링크 유럽 AlbaniaInstitute of Statistics (INSTAT)AndorraMinisteri de Finances, Servei d'EstudisAustriaStatistics AustriaBelarusThe Ministry of Statistics and Analysis of the Republic of BelarusBelgiumStatistics BelgiumBosnia and HerzegovinaFederal Office of Statistics / Agency for Statistics of Bosnia and Herzegovina The Republika Srpska Institute for StatisticsBulgariaNational Statistical Institute .. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2024. 12. 12. [통계] 면접 대비 통계 관련 기초 개념 모음 1. 기본 통계 개념1-1. 평균(mean), 중앙값(median), 최빈값(mode)의 차이와 사용 목적평균은 데이터를 모두 합산한 뒤 데이터의 개수로 나눈 값으로, 데이터의 전반적인 경향을 나타냅니다. 중앙값은 데이터를 크기 순서대로 정렬했을 때 가운데에 위치한 값으로, 극단값의 영향을 줄여 데이터의 중심 경향을 표현하는 데 유용하며, 최빈값은 가장 자주 등장하는 값으로, 주로 범주형 데이터 분석에 사용됩니다.1-2. 표준편차(standard deviation)와 분산(variance)의 차이분산은 데이터가 평균으로부터 얼마나 떨어져 있는지를 제곱해 평균 낸 값으로, 데이터 분포의 퍼짐 정도를 나타냅니다. 표준편차는 분산의 제곱근으로, 원 데이터와 동일한 단위를 가지며 데이터의 변동성을 직관적으로 이.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2024. 12. 9. [통계] p-value(유의확률)란? p-value(유의확률)는 통계적 가설검정에서 관찰된 데이터가 귀무가설(null hypothesis)이 참이라는 가정하에 나타날 확률을 의미합니다. 이는 가설검정에서 데이터가 얼마나 극단적인지를 평가하는 척도로 사용됩니다. 다음은 p-value의 주요 개념과 활용을 정리한 내용입니다:1. 귀무가설과 대립가설귀무가설 (H0H_0): 차이가 없거나 효과가 없다는 가정입니다. 예를 들어, "두 집단 간 평균 차이가 없다"는 가정입니다.대립가설 (H1H_1): 귀무가설과 반대되는 주장으로, 예를 들어 "두 집단 간 평균 차이가 있다"는 내용입니다.p-value는 귀무가설이 참일 때, 현재 관찰된 데이터 또는 그보다 극단적인 데이터가 나올 확률을 계산합니다.2. p-value의 해석p-value가 작을수록 귀무가.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2024. 12. 9. [공간통계] 통계와 공간통계의 차이? 1. 분석 대상의 본질적 차이통계정의: 통계는 데이터 세트를 정량적으로 분석하여 평균, 분산, 상관관계, 회귀계수 등과 같은 요약값을 도출하거나 예측 모델을 구축하는 데 중점을 둡니다.데이터 특성: 일반적으로 관측치 간의 순서나 위치는 고려되지 않으며, 데이터 포인트는 독립적이라고 가정합니다.예:설문조사 데이터를 사용해 소비자 만족도를 분석.학생 성적과 출석률 간의 상관관계를 분석.공간통계정의: 공간통계는 데이터를 지리적 위치와 연결하여 분석하며, 공간적 상관성(spatial correlation), 공간적 이질성(spatial heterogeneity), 그리고 데이터의 지리적 분포를 분석합니다.데이터 특성: 데이터 포인트가 지리적 위치와 연계되어 있으며, 공간적 관계와 의존성을 주요 분석 대상으로 합.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2024. 12. 9. [데이터 분석] 비즈니스 데이터 분석 절차 비즈니스 데이터 분석 절차는 데이터의 수집부터 인사이트 도출 및 의사결정 지원에 이르기까지 여러 단계를 포함합니다. 다음은 일반적인 비즈니스 데이터 분석 절차의 단계입니다:1. 문제 정의 및 목표 설정비즈니스 문제 정의: 분석의 목적과 해결하려는 비즈니스 문제를 명확히 정의합니다. 예를 들어, "고객 이탈률 감소", "매출 증가를 위한 마케팅 전략 도출", "서비스 개선 방안 도출" 등이 될 수 있습니다.목표 설정: 문제를 해결하기 위한 명확한 목표를 설정합니다. 예를 들어, "고객 이탈률 10% 감소" 또는 "월간 매출 20% 증가" 등의 구체적인 목표를 설정합니다.KPI(핵심 성과 지표) 정의: 성과를 측정할 수 있는 KPI를 설정하고, 이를 통해 분석 성과를 평가할 기준을 마련합니다.2. 데이터 수.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2024. 10. 1. 이전 1 2 3 4 5 다음 반응형