일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- DISTINCT
- pandas
- oracle
- 캐글
- git
- 데이터 분석
- SQL
- tablueau
- 이벤트 매개변수
- 맞춤 이벤트
- It
- Ga
- bigquery
- SQLD
- API
- 그로스해킹
- 용어 정리
- 맞춤 자바스크립트
- 상관계수
- Kaggle
- tableau
- sql 개발자
- 후기
- 크로스셀링
- Google Analytics
- segmentation
- Python
- Ecommerce
- 통계
- Funnel
Archives
- Today
- Total
녕녀기의 실험일지
[ 통계 ] 국민대학교_회귀분석_다중선형회귀분석 + 회귀모형의 진단과 수정 본문
- 다중선형회귀분석에서는 '보정된 결정계수(adj R²)'를 사용함
- 독립변수가 많아질수록 SSE가 낮아지나, 과적합이나 다중공선성의 문제가 있을 수 있음
- SSE와 SST의 자유도로 나눠서 값을 보정
- 1 - [{SSE / (n - p)} / {SST / (n - 1)}]
- 유의하지 않은 변수항을 제거한 Reduced Model이 유의한지 부분 F 검정으로 확인할 수 있음
- H0 : β₂ = 0 (유의하지 않은 항이 없어도 설명력이 있다.)
- F0 ~ F(p-r, n-p)
(p는 β로 표현되는 독립변수의 수, r은 Reduced Model 변수의 수, n은 데이터의 수) - F0 = [{ SSE(R) - SSE(F) } / { df(R) - df(F) }] / [SSE(F) / df(F)]
- 개별 t 검정과 동일
(python statsmodels의 summary를 사용하면, 각 변수 t 분포의 p-value를 확인할 수 있음)
'-- Data -- > - 데이터 분석 -' 카테고리의 다른 글
[ kaggle ] cosmetics ecommerce 분석 : 추천 시스템 구현 (0) | 2024.07.29 |
---|---|
[ kaggle ] cosmetics ecommerce 분석 : RFM 고객 세분화 분석 (0) | 2024.07.29 |
[ 통계 ] 국민대학교_회귀분석_단순선형회귀분석 (0) | 2024.07.19 |
[ 통계 ] 국민대학교_회귀분석_상관분석 (0) | 2024.07.19 |
[ 마케팅 ] 업셀링, 크로스셀링 (0) | 2024.06.03 |
Comments