녕녀기의 실험일지

[ 통계 ] 국민대학교_회귀분석_다중선형회귀분석 + 회귀모형의 진단과 수정 본문

-- Data --/- 데이터 분석 -

[ 통계 ] 국민대학교_회귀분석_다중선형회귀분석 + 회귀모형의 진단과 수정

녕녀기 2024. 8. 12. 11:25
    1. 다중선형회귀분석에서는 '보정된 결정계수(adj R²)'를 사용함
      • 독립변수가 많아질수록 SSE가 낮아지나, 과적합이나 다중공선성의 문제가 있을 수 있음
      • SSE와 SST의 자유도로 나눠서 값을 보정
      • 1 - [{SSE / (n - p)} / {SST / (n - 1)}]
    2. 유의하지 않은 변수항을 제거한 Reduced Model이 유의한지 부분 F 검정으로 확인할 수 있음
      • H0 : β₂ = 0 (유의하지 않은 항이 없어도 설명력이 있다.)
      • F0 ~ F(p-r, n-p)
        (p는 β로 표현되는 독립변수의 수, r은 Reduced Model 변수의 수, n은 데이터의 수)
      • F0 = [{ SSE(R) - SSE(F) } / { df(R) - df(F) }] / [SSE(F) / df(F)]
      • 개별 t 검정과 동일
        (python statsmodels의 summary를 사용하면, 각 변수 t 분포의 p-value를 확인할 수 있음)
Comments