일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- tablueau
- DISTINCT
- Google Analytics
- 상관계수
- Ga
- 이벤트 매개변수
- 맞춤 자바스크립트
- 데이터 분석
- bigquery
- git
- 크로스셀링
- 맞춤 이벤트
- tableau
- 후기
- segmentation
- oracle
- Ecommerce
- API
- 용어 정리
- It
- SQL
- 캐글
- Python
- 그로스해킹
- Kaggle
- 통계
- SQLD
- sql 개발자
- pandas
- Funnel
- Today
- Total
녕녀기의 실험일지
[ BigQuery ] 카테고리별 page_view 수 확인 본문
본문으로
안녕하세요. 녀기입니다!
어느새 2월이 돼버렸습니다...
취직을 못한지 1년이 넘어버렸군요....
대한민국 취준생들 모두 힘내시길 바랍니다ㅠㅠ
저는 지난 주에 OPIc을 봤습니다.
아주 조졌어요(?)
제발 서류 지원할 수 있을 정도만 나왔으면 좋겠습니다!!
오랜만에 글을 써서 그런지
안 그래도 긴 저의 잡담이,
지구를 몇 바퀴를 돌려도 될 정도로 길어지고 있습니다(?)
1월 중순 쯤 Google Analytics 강의를 다 듣고
어느 정도 데이터를 모은 뒤
한 번 살펴 보기로 했었는데,
이 정도면 한 번 살펴봐도 되지 않을까 싶네요.
과연 제 블로그에서
보는 사람이 가장 많은 게시물은 어떤 분류인지,
BigQuery로 한 번 살펴보겠습니다.
바로 let's go!
카테고리별 조회수
with reg_table as
(select case
when array_to_string(regexp_extract_all(param.value.string_value, r"^\[.+\]"),"")="" then 'non-category' else array_to_string(regexp_extract_all(param.value.string_value, r"^\[.+\]"),"")
end as category,
param.value.string_value as realvalue
from `your table.events_*`, unnest(event_params) as param
where 1=1
and event_date between '20240119' and '20240204'
and param.key='page_title'
and event_name='page_view')
select category, count(realvalue) as count_category
from reg_table
group by category
order by count(realvalue) desc
쿼리문을 하나하나씩 살펴보겠습니다.
- regexp_extract_all : 정규표현식과 맞는 표현 전부를 array 타입으로 반환합니다.
제 글의 대부분은 대괄호('[ ]')로 카테고리를 가볍게 표시하기 때문에, 해당 부분을 정규표현식으로 가져옵니다. - array_to_string : array 타입을 string 타입으로 반환합니다. 두 번째 파라미터에는 array의 구분자를 입력해 줍니다.
저는 ""(구분자 없음)으로 표시했습니다. - 정규표현식과 맞지 않을 때는 'non-category'라고 표시할 수 있도록,
case 문을 사용했습니다. - 정규표현식으로 카테고리를 추출한 쿼리는 서브쿼리로 처리했습니다.
- 그 후 grouping을 해서 카테고리별 조회수를 확인했습니다.
약 17일 동안 가장 조회가 많았던 게시물은 'Tableau'가 가장 많고
'non-category'를 제외하면, 'GA(Google Analytics)'가 두 번째로 많은 것을 확인할 수 있습니다.
세 번째로 '후기'도 확인할 수 있겠네요.
Tableau나 GA는 궁금한 것이 생겨서 검색을 해 보면
한글로 된 게시글이 많이 없을 뿐더러, 영어로 된 게시물도 그리 많지 않은 것을 알 수 있습니다.
저도 공부하면서 겪은 일이지요ㅎㅎ
보통 해외에서 작성된 글이 알찬 경우가 많지만
해석이 어렵기 때문에,
한글로 된 게시물을 먼저 찾아보게 되는 것 같습니다.
그래서 제 블로그 글도 조회가 되는 것이 아닌가 추측할 수 있겠습니다.
Tableau는 다루는 회사에 들어가지 않는 이상 당분간 만져볼 일이 없을 것 같아서
GA 관련 글을 더 작성한다면,
방문자가 늘어나지 않을까 싶습니다.
제가 분야를 바꾸고 나서 취득한 자격증은 SQLD랑 빅데이터 분석기사이고,
둘 다 후기를 올렸지만,
SQLD는 카테고리를 'SQL'로 분류해서
'후기'는 전부 빅데이터 분석기사 후기입니다.
(저의 불찰이죠....)
BigQuery와 연동하기 전 17일 간의
page_view 이벤트 수 입니다.
빅분기 후기의 조회수가 30회인데,
실습하는 동안 Debug view 확인한다고 제가 게시물을 누른 것을 감안하더라도
최대 3~4배는 차이가 나지 않을까 싶습니다.
그럼 빅분기 후기 게시물만
0.7~0.9회 / day
조회가 일어난 것이죠.
빅분기 필기 접수가 3월 초에 있으니까,
아마 조만간
1일당 조회수가 오르지 않을까 예상해 봅니다.
Looker Studio도 같이 연습하고 있는데,
아직 손에 잘 안 익어서
하다가 깨달음을 얻으면 그 때 올리겠습니다.
(유레카)
그럼 저는 이만 돌아가겠습니다.
곧 알바 퇴근 해야 돼서
그럼 담에 봐용~~
뿅

'-- Data -- > - SQL -' 카테고리의 다른 글
[ Oracle ] NVL, LAG, LEAD, INTERVAL, ROW_NUMBER를 사용해 프로젝트 시작 날짜와 끝난 날짜 출력 (0) | 2024.02.21 |
---|---|
[ BigQuery ] SQL 쿼리문을 Looker Studio 연동하기 (0) | 2024.02.07 |
[ Oracle ] CHR()로 문자 나타내기 (0) | 2023.09.15 |
[ Oracle ] FETCH를 사용한 상위 3개 날짜 추출 (0) | 2023.08.16 |
[ Oracle ] 프로그래머스 코테 DISTINCT, COUNT, 상품을 구매한 회원 구하기 (0) | 2023.08.11 |