일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- Python
- API
- 후기
- git
- SQL
- It
- Ga
- 캐글
- 맞춤 이벤트
- pandas
- Google Analytics
- 이벤트 매개변수
- 그로스해킹
- Kaggle
- bigquery
- SQLD
- 크로스셀링
- 용어 정리
- Ecommerce
- tablueau
- Funnel
- oracle
- 통계
- 데이터 분석
- 맞춤 자바스크립트
- sql 개발자
- segmentation
- tableau
- 상관계수
- DISTINCT
Archives
- Today
- Total
녕녀기의 실험일지
[ 통계 ] 국민대학교_회귀분석_단순선형회귀분석 본문
※ 강의 내용을 요약한 글입니다.
평소 모호했던 개념이나 몰랐던 내용을 적어놓은 글이기 때문에, 강의 내용이 전부 포함돼 있지 않습니다.
http://www.kocw.net/home/cview.do?cid=320ebed6dfe4f57a
회귀분석
회귀분석은 변수들 간의 관계를 수학적 함수형태로 표현하는 통계방법론으로써, 매우 실용적인 연구방법론 중 하나이다. 본 강의에서는 회귀분석에 대한 여러가지 주제를 다룰 것이다. 이와함
www.kocw.net
- 수학적 모형(함수)은 오차(error) 허용 유무에 따라 두 가지로 분류 가능
- 결정적 모형 : 오차가 존재하지 않음
예) E = mc² - 통계적 모형 : 변수들 간의 오차를 허용하는 모형
예) 기업의 광고비(X)와 매출액(Y) 사이의 관계
- 결정적 모형 : 오차가 존재하지 않음
- 오차항(εi)은 무작위로 샘플링되는 확률 변수( (0, σ²) )
- 종속 변수 Yi는 평균이 β0 + β1Xi이고, 분산이 σ²인 확률 변수
- 오차제곱합 S( β0, β1 ) = Σ { Yi - ( β0 + β1Xi ) }² 을 최소로 하는 β0, β1을 편미분으로 찾음
- S( β0, β1 ), β0, β1을 축으로 하는 3차원 공간에서의 편미분
- 최소제곱법 방식
- 회귀 모형에서 오차항이 서로 독립이고, 기댓값이 0이며, 분산이 σ²으로 일정하다면
- 비편향 추정량 : E( β0 hat ) = β0, E( β1 hat ) = β1
- V( β1 hat ) = σ² / SSxx
- V( β1 hat ) = σ² * [ ( 1/n ) + { ( X bar ) ² / SSxx } ]
- β0 hat, β1 hat 의 분산은 비편향 추정량 중에서 제일 작은 분산을 가짐
- 제곱합의 분할
- SST( n-1 ) = SSE( n-2 ) + SSR(1)
- SST( Σ( Yi - Y bar )² ) : 총 제곱합. Y의 관측값들이 가지는 총 변동
- SSE( Σ( Yi - Y hat )² ) : 오차 제곱합. Y의 총 변동 중 설명되지 않은 변동
- SSE( Σ( Y hat - Y bar )² ) : 회귀 제곱합. 회귀식에 의해 설명된 변동
- 결정계수 : 추정된 회귀 모형의 설명력
- R² = 설명된 변동 / 총 변동 = SSR / SST = 1 - ( SSE / SST )
- 예측 측도는 예측 잔차 제곱합(PRESS)을 사용
- Rpredicition² = 1 - ( PRESS / SST )
- 분산분석표(ANOVA)를 통해 회귀 기울기의 유의성 검정(F 검정)
- MSR : 회귀 제곱 평균
- MSE : 오차 제곱 평균
- 오차항이 정규 분포를 따르고, β1 = 0이라고 가정할 때(H0) 분석 진행
'-- Data -- > - 데이터 분석 -' 카테고리의 다른 글
[ kaggle ] cosmetics ecommerce 분석 : 추천 시스템 구현 (0) | 2024.07.29 |
---|---|
[ kaggle ] cosmetics ecommerce 분석 : RFM 고객 세분화 분석 (0) | 2024.07.29 |
[ 통계 ] 국민대학교_회귀분석_상관분석 (0) | 2024.07.19 |
[ 마케팅 ] 업셀링, 크로스셀링 (0) | 2024.06.03 |
[ kaggle ] cosmetics ecommerce 분석 : 데이터 가공 및 추출, 시각화 (0) | 2024.05.27 |
Comments