녕녀기의 실험일지

[ kaggle ] cosmetics ecommerce 분석 : 분석 개요 본문

-- Data --/- 데이터 분석 -

[ kaggle ] cosmetics ecommerce 분석 : 분석 개요

녕녀기 2024. 5. 7. 11:32

1. 문제 인식

 

  • kaggle에서 제공되는 'cosmetics e Commerce' 이벤트 데이터를 사용하여 funnel analysis 및 segmentation, 혹은 cohort analysis 연습
  • 데이터를 BigQuery에 적재 후, SQL Query 문을 이용하여 데이터 가공 및 추출
  • 가공된 데이터를 Tableau로 시각화하여 의사 결정에 기여

https://www.kaggle.com/datasets/mkechinov/ecommerce-events-history-in-cosmetics-shop?rvi=1

 

eCommerce Events History in Cosmetics Shop

This dataset contains 20M users' events from eCommerce website

www.kaggle.com

(↑자료 출처)


https://www.cmn.co.kr/mobile/sub_view.asp?news_idx=32547

 

https://www.cmn.co.kr/mobile/sub_view.asp?news_idx=32547

 

www.cmn.co.kr

 

위 자료는 2019년도 화장품 구매 행태를 설문 조사한 내용입니다.

 

화장품 구매에 있어 기능과 브랜드 이미지, 평판, 향 등이 중요 요인으로 선택됐습니다.

 

제품의 기능적 특성이 비슷하다면, 선호 브랜드에 따라 제품 구매가 이뤄질 것이라고 생각됩니다.

 

따라서 데이터에 존재하는 category_id, brand와 같은 컬럼을 통해 화장품의 종류(기초, 색조, 눈 화장용 등)와 브랜드를

 

파악할 수 있을 것으로 추정합니다.

 

(해당 데이터에서 기능이나 평판, 향과 같은 특성이나 고객의 유입 날짜는 파악할 수 없습니다.)

 

 

 

해당 플랫폼의 이벤트는 'view - cart(or remove from cart) - purchase'로 구성돼 있으며, 해당 이벤트에 대해 funnel

 

analysis를 시도합니다.

 

 

 

또한 segmentation을 진행하여 카테고리나 브랜드에 따른 단계별 전환율에 차이가 있는지 확인하겠습니다.

 

 

 

분석 기한에 여유가 있다면, cohort 분석도 진행하겠습니다.


2. 기간

  • 기간 : 2024-05-07 ~ 2024-05-27 (약 3주)
    • 분석 개요(기획) : 2024-05-07 ~ 2024-05-08(2일)
    • 데이터 적재(BigQuery) : 2024-05-09 ~ 2024-05-10(2일)
    • 데이터 가공(BigQuery, Python) 및 추출(Query) : 2024-05-11 ~ 2024-05-17(7일)
    • 시각화(Tableau) 및 인사이트 도출 : 2024-05-18 ~ 2024-05-27(10일)

(해당 기간은 진행 상황에 따라 단축될 수 있음을 알립니다.)

Comments