💖 Hongsi's Study/📊 통계・공간통계・공간최적화45 [공간통계] 공간군집의 탐지 (spatial cluster detection) 공간 군집의 탐지(Spatial Cluster Detection)는 특정 공간 내에서 어떤 사건이나 현상이 무작위 분포와는 다르게 특정 지역에 집중되어 있는지를 파악하는 분석 방법이다. 이는 공중보건, 범죄 분석, 생태학, 경제학 등에서 사용됩니다. 예를 들어, 특정 질병의 발생이 일정 지역에 집중되어 있는 경우, 그 원인을 파악하거나 미래 예측을 위해 공간 군집 분석이 이루어질 수 있다. 공간 군집 탐지 방법은 크게 전역(global)과 지역(local) 방법으로 나눌 수 있다. global 방법은 전체 지역에 걸쳐 군집화가 일어났는지를 살펴보며, local 방법은 특정 지역에서만 군집화가 일어났는지를 조사한다. 통계적 방법을 통해 군집을 탐지하는 가장 대표적인 방법 중 하나는 Moran의 I 지수이다.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 9. 4. [공간통계] 점패턴 분석 (spatial point pattern analysis) 점패턴 분석(Spatial Point Pattern Analysis)은 공간상에서 점이 어떻게 분포되어 있는지를 연구하는 통계적 방법이다. 이 분석은 생태학, 지리학, 공중 보건, 도시 계획 등 다양한 분야에서 응용된다. 예를 들어, 동식물의 서식지 분포, 병의 발병 패턴, 범죄 발생 위치 등을 분석할 수 있다. 기본적인 점패턴 분석은 점들이 '균일하게(uniform)', '군집화(clustering)', 또는 '규칙적(regular)'하게 분포되어 있는지를 평가합니다. 이를 위해 다양한 통계적 지표와 테스트가 사용되며, 'K-함수', 'G-함수', '최근접 이웃 분석(Nearest Neighbor Analysis)' 등이 포함된다. "균일한 분포"는 점들이 공간에 고르게 분포되어 있는 경우를 의미하며,.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 9. 4. [통계] 일반 회귀 (선형회귀) 식 일반 회귀(선형 회귀, Linear Regression)의 가장 기본적인 형태는 다음과 같은 공식으로 표현됩니다: 이 공식은 하나 또는 그 이상의 독립 변수 \( X \)를 사용하여 종속 변수 \( Y \)를 예측합니다. \( \beta \) 계수는 독립 변수의 변화가 종속 변수에 어떤 영향을 미치는지를 설명합니다. 예를 들어, \( \beta_1 \)은 \( X_1 \)이 1 단위 변할 때 \( Y \)가 \( \beta_1 \)만큼 변한다고 해석할 수 있습니다. 이 공식을 사용하여 데이터에 가장 잘 맞는 \( \beta \) 계수를 찾는 것이 선형 회귀 분석의 주된 목표입니다. 이를 위해 보통 "최소제곱법(Least Squares Method)" 같은 방법을 사용하여, 실제 값과 모델이 예측한 값의 .. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 9. 4. [통계] 로지스틱회귀에 있어 연속형변수와 범주형 변수를 사용할 때 차이 로지스틱회귀에 있어 연속형변수와 범주형 변수를 사용할 때 차이에 대해 알려줘. https://chat.openai.com/share/f60ce846-7759-4df1-9e9b-2b8e8731de3c ChatGPT 로지스틱 회귀(Logistic Regression)는 이진 분류(binary classification) 문제에서 주로 사용되는 통계적 모델입니다. 로지스틱 회귀 모델에서는 여러 개의 독립 변수를 사용할 수 있으며, 이 독립 변수들은 chat.openai.com 로지스틱 회귀(Logistic Regression)는 이진 분류(binary classification) 문제에서 주로 사용되는 통계적 모델입니다. 로지스틱 회귀 모델에서는 여러 개의 독립 변수를 사용할 수 있으며, 이 독립 변수들은 연.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 9. 4. [통계 프로그램] SAS 무료로 사용하기 :: SAS OnDemand for Academics(ODA) 버전 [Statistics Program] Use SAS free of charge: SAS OnDemand for Academic (ODA) version SAS 프로그램을 무료로 사용할 수 있는 과정을 소개한다. 1. SAS 회원가입하기 https://www.sas.com/profile/ui/#/create?fromURI=https:%2F%2Fauth.sas.com%2Fapp%2Fsasinstituteinc_ssologinsascom_1%2Fexk32x17z3ddVtwmJ2p7%2Fsso%2Fsaml%3FSAMLRequest%3DnVRLj9owEL7vr4h8h7xYQi1ASkFVqbYVBbqHXlZDMtm16tipx1lof33twFKqbqnELZp8Hn%252BvZExQy4bnrX1SK%2FzeItkg2N.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 7. 10. [통계] 다중공선성 vs. 완전공선성 (헷갈리는 통계 개념 정리) 다중공선성(Multicollinearity) 다중공선성(Multicollinearity)은 회귀분석에서 독립변수들 간에 강한 선형 관계가 존재하는 경우를 말합니다. 즉, 하나의 독립변수가 다른 독립변수로 잘 예측될 수 있는 상황을 의미합니다. 이러한 상황에서 회귀모형의 성능을 평가하거나 독립변수들의 영향력을 해석하는 것이 어려워질 수 있습니다. 다중공선성은 주로 상관계수나 분산팽창계수(VIF, Variance Inflation Factor)를 통해 평가됩니다. 상관계수가 1에 가까울수록 강한 선형 관계가 있음을 나타내며, VIF 값이 높을수록 다중공선성의 정도가 높다고 판단할 수 있습니다. 일반적으로 VIF 값이 10을 넘어가면 다중공선성의 문제가 심각하다고 판단할 수 있습니다. 다중공선성이 존재하는 경.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 6. 21. [공간최적화] 다목적 최적화 문제(multi-objective optimization problem) 공간 최적화 문제들은 일반적으로 특정한 목적함수 (objective function)를 정의하여 이를 최적화하는 구조 를 가지고 있다. 목적함수는 문제의 특성에 따라 달라 질 수 있다. 예컨대 소방서와 같은 공공 시설의 경우, 잠재적 소방 및 긴급구호의 수요지까지의 거리 또는 출동시간을 최소화시키는 것이 목적으로 정의될 수 있으며, 백화점 및 대형쇼핑 센터의 경우 최대한 많은 고객들을 확보할 수 있는 장소에 입지하는 것이 목적 이될수 있다. 이러한 목적함수는 문제에 있어 가장 중요한 단일 가치로 정의되는 것이 일반적이지만, 여러 가지의 상충하는 목적함수를 동시에 고려하는 형태로 확장될 수 있다. 본 연구의 사례처럼 비용을 최소화하는 것과 접근성을 최대화하는 것은 접근성이 좋은 지역은 지가나 임대료가 비싸.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 4. 23. [통계] min - max 표준화 민맥스(Min-Max) 표준화는 데이터를 0과 1 사이의 값으로 변환하는 방법입니다. 이 방법은 모든 특성(feature)을 동일한 스케일로 변환하며, 데이터의 분포를 일정하게 조정할 수 있습니다. 데이터를 민맥스 스케일링하는 방법은 각 특성의 최솟값(minimum)을 0으로, 최댓값(maximum)을 1로 지정하고, 나머지 값들을 그 범위에 맞게 비례하여 조정합니다. 따라서 식으로 표현하면 아래와 같습니다. (x - min) / (max - min) 여기서 x는 해당 특성(feature)의 값이며, min은 해당 특성의 최솟값, max는 해당 특성의 최댓값입니다. 이 방법을 통해 모든 특성이 동일한 범위(0과 1)에 속하게 되며, 분포가 일정하게 조정됩니다. 하지만 이 방법은 이상치(outlier)가 .. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 4. 13. [공간통계] 공간회귀 - Spatial lag model, Spatial error model 공간적 선형 회귀분석의 종류 * OLS : 비공간적, 전역적 회귀분석 * 전역적 공간회귀 - 공간적 선형 회귀 : 공간지체모형, 공간오차모형이 있음. (잔차의 공간적 자기상관을 제거 -> 예측값의 변화 & 회귀계수의 변화) - ESF 회귀분석 : 고유벡터공간필터링 (eigenvector spatial filtering) 기법에 기반한 회귀분석 * 국지적 공간회귀 : GWR (지리가중회귀). 공간단위별로 서로 다른 회귀분석 결과가 도출됨 Spatial lag model : 공간 지체 모형 Spatial error model : 공간 오차 모형 가장 널리 사용되어 온 공간적 회귀모형은 주로 공간계량경제학(spatial econometrics)에 기반한 다양한 종류의 공간자기회귀모형(spatial autore.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 2. 22. [데이터 시각화] 데이터 별 시각화 방법 수치형 데이터 시각화 - 히스토그램 - 커널밀도 추정 - 분포도 - 러그플롯 범주형 데이터 시각화 - 막대그래프 - 포인트플롯 - 박스플롯 - 바이올린플롯 - 카운트플롯 데이터 관계 시각화 - 히트맵 - 라인플롯 - 산점도 - 산점도 + 회귀선 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 2. 19. [자격증] 빅데이터분석기사 정보 총 정리 : 필기, 실기 / 문항 / 문제 수 / 일정 / 주의사항 자격 소개 관련 근거 국가기술자격법 및 동법 시행령 빅데이터분석기사 정의 빅데이터 이해를 기반으로 빅데이터 분석 기획, 빅데이터 수집·저장·처리, 빅데이터 분석 및 시각화를 수행하는 실무자를 말한다. 빅데이터분석기사의 필요성 전 세계적으로 빅데이터가 미래성장동력으로 인식돼, 각국 정부에서는 관련 기업투자를 끌어내는 등 국가·기업의 주요 전략분야로 부상하고 있다. 국가와 기업의 경쟁력 확보를 위해 빅데이터 분석 전문가의 수요는 증가하고 있으나, 수요 대비 공급 부족으로 인력 확보에 어려움이 높은 실정이다. 이에 정부차원에서 빅데이터 분석 전문가 양성과 함께 체계적으로 역량을 검증할 수 있는 국가기술자격 수요가 높은 편이다. 빅데이터분석기사의 직무 대용량의 데이터 집합으로부터 유용한 정보를 찾고 결과를 예측.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 2. 5. [통계] 로지스틱 회귀분석이란? 로지스틱 회귀분석 - 종속변수가 범주형일 때 적용 가능한 회귀분석 모형 - 데이터의 종속변수가 특정 범주에 속할 확률을 0에서 1 사이의 값으로 예측하고 예측된 확률에 따라 가능성이 더 높은 범주로 분류하는 지도학습 알고리즘 로지스틱 회귀는 주로 이진 분류 문제를 해결하기 위해 사용되는 통계 모델입니다. 이진 분류란, 두 개의 선택지 중 하나를 고르는 문제를 의미해요. 예를 들어, "이 이메일은 스팸인가, 아닌가?"나 "이 환자가 특정 병에 걸릴 확률은 높은가, 낮은가?" 같은 질문들이죠. 로지스틱 회귀는 여러 가지 정보(변수라고 부릅니다)를 고려해서 '예' 또는 '아니오'로 답하는 확률을 계산해 줍니다. 만약 의료 분야에서 로지스틱 회귀를 사용한다면, 환자의 나이, 키, 몸무게, 혈압 등 다양한 정보를.. 💖 Hongsi's Study/📊 통계・공간통계・공간최적화 2023. 2. 5. 이전 1 2 3 4 다음 반응형