💖 Hongsi's Study/📊 통계・공간통계・공간최적화

[공간통계] 선형회귀분석 (linear regression)의 4가지 기본가정과 공간회귀분석

김 홍시 2022. 10. 24.
반응형

선형회귀분석의 4가지 기본가정

선형회귀분석은 아래 네 가지의 가정을 만족해야 한다.

(1) 독변~종변 간의 선형성 : '선형' 회귀분석이므로 독립변수가 종속변수를 예측하는 데에 선형성을 만족해야 한다.

                 **오차 : 종속변수의 예측값과 실제 관측값 간의 차이**
(2) 오차의 독립성 : 오차의 분산이 독립변수 값과 무관하게 일정해야 한다.

산점도를 그리면 잔차와 독립변수 간에 아무 관련성이 없도록 점이 고르게 분포해야 한다.

더빈왓슨 검정을 수행하면 오차항이 독립성을 만족하는지 검정 가능하다. 값이 2에 가까울수록 오차항의 자기상관이 없음을 의미하고, 0에 가까울수록 양의 상관관계가, 4에 가까울소록 음의 상관관계가 있음을 의미한다. => 0 혹은 4에 가까우면 잔차들간의 상관관계가 있어 회귀식이 부적합하다.

(3) 오차의 등분산성 : 분석하는 집단들의 분산이 같아야 한다.
(4) 오차의 정규성 : 오차의 분포가 정규분포를 만족해야 한다. Q-Q plot, Kolmogorov-Smirnov검정, Shapiro-Wilk 검정 등을 활용해 정규성을 확인할 수 있다.

- 다중공선성 (multicollinearity) : 독립변수들 간에 강한 상관관계가 나타나면 안 된다.

- 유력개체 (influential cases) : 유력개체 (outlier가 회귀모델에 너무 큰 영향을 미침) 없어야 한다.

 

그러나, 공간을 다룰 때는 위의 선형회귀분석의 네 가지 가정이 위배된다.

공간 회귀분석

(1) 비선형성 (non-linearity) : 공간에서는 선형성을 띠지 않는다. OLS는 선형성을 띨 때만 사용할 수 있다.

(2) 자기상관 (autocorrelation) : 공간에서는 자기상관을 이루기 때문에 가까이 있는 것끼리는 비슷한 성질을 보인다.

(3) 이분산성 (heteroscedasticity) : 공간에서는 분산이 서로 다르다. => Koenker 통계량 이용하여 판정

(4) 비정규성 (non-normality) : 공간에서는 정규분포를 띄지 않는다. => Jarque-Bera 통계량 이용하여 판정

 

 

 

 
반응형

댓글