일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Python
- 이벤트 매개변수
- git
- API
- SQLD
- 후기
- 상관계수
- pandas
- 캐글
- Google Analytics
- DISTINCT
- Ecommerce
- bigquery
- 그로스해킹
- tableau
- 맞춤 이벤트
- SQL
- segmentation
- It
- sql 개발자
- Kaggle
- 용어 정리
- Ga
- Funnel
- tablueau
- 크로스셀링
- 맞춤 자바스크립트
- 통계
- oracle
- 데이터 분석
- Today
- Total
목록-- Data -- (72)
녕녀기의 실험일지
날짜OracleMySQLBigQueryTO_CHAR(DATE,'YYYY-MM-DD') | TO_DATE (DATE,'YYYY-MM-DD') DATE_FORMAT(DATE,'%Y-%m-%d') FORMAT_DATE('%Y-%m-%d', DATE) TO_DATE( DATE,'YYYY-MM-DD' ) + 'n' (n은 일 수) | ADD_MONTH(DATE, 'n') DATE_ADD(DATE, INTERVAL 'n' YEAR | MONTH | DAY)DATE_ADD(DATE, INTERVAL 'n' YEAR | MONTH | DAY) 수학OracleMySQLBigQuery POWER(x, n) (x는 제곱할 수, n은 거듭제곱) POWER(x, n) (x는 제곱할 수, n은 거듭제곱) POW(x, n) (x는..
다중선형회귀분석에서는 '보정된 결정계수(adj R²)'를 사용함독립변수가 많아질수록 SSE가 낮아지나, 과적합이나 다중공선성의 문제가 있을 수 있음SSE와 SST의 자유도로 나눠서 값을 보정1 - [{SSE / (n - p)} / {SST / (n - 1)}]유의하지 않은 변수항을 제거한 Reduced Model이 유의한지 부분 F 검정으로 확인할 수 있음H0 : β₂ = 0 (유의하지 않은 항이 없어도 설명력이 있다.)F0 ~ F(p-r, n-p)(p는 β로 표현되는 독립변수의 수, r은 Reduced Model 변수의 수, n은 데이터의 수)F0 = [{ SSE(R) - SSE(F) } / { df(R) - df(F) }] / [SSE(F) / df(F)]개별 t 검정과 동일(python statsm..

목차1. 개요2. interaction score3. 사용자 기반 협업 필터링4. 잠재 요인 협업 필터링5. 모델 비교 및 결론6. 배운 점, 어려웠던 점1. 개요kaggle에서 제공되는 'cosmetics e Commerce' 이벤트 데이터를 사용하여, 제품을 추천하는 시스템을 구현하고자 함사용자의 제품 평가 점수가 존재하지 않으므로, 사용자와 제품의 이벤트 전환율에 따른 상호작용을 임의로 계산(interaction score)interaction score와 코사인 유사도(cosine similarity)를 사용하여, 사용자 기반 협업 필터링(user based collaborative filtering) 구현interaction score와 특이값 분해(SVD)로 행렬 분해하여, 잠재 요인 협업 필..

목차1. 개요2. EDA3. Python 코드로 RFM 고객 세분화4. BigQuery로 일부 데이터 RFM 고객 세분화5.고객 세분화 기준 세우기 5-1. 통계치를 보고 임의의 구간을 나눔 5-2. 군집 기법 활용 6. 분석 / 인사이트7. 배운 점, 어려웠던 점 7-1. 배운 점 7-2. 어려웠던 점1. 개요가격 데이터가 음수인 데이터 처리 여부 결정해당 분석을 위해 Python 코드로 구현BigQuery를 통해, SQL로 RFM 쿼리 일부 구현RFM(Recency, Frequency, Monetary) 분석을 위한 기준을 정함'관심 필요 최고 충성 고객'은 '최고 충성 고객'에 준하는 서비스 제공이 필요하다고 생각2. EDAdf = csv_to_df('ecommerce_dat..