녕녀기의 실험일지

[ BigQuery ] 카테고리별 page_view 수 확인 본문

-- Data --/- SQL -

[ BigQuery ] 카테고리별 page_view 수 확인

녕녀기 2024. 2. 5. 17:18

본문으로

안녕하세요. 녀기입니다!

 

어느새 2월이 돼버렸습니다...

 

취직을 못한지 1년이 넘어버렸군요....

 

대한민국 취준생들 모두 힘내시길 바랍니다ㅠㅠ

 

저는 지난 주에 OPIc을 봤습니다.

 

아주 조졌어요(?)

 

제발 서류 지원할 수 있을 정도만 나왔으면 좋겠습니다!!


오랜만에 글을 써서 그런지

 

안 그래도 긴 저의 잡담이,

 

지구를 몇 바퀴를 돌려도 될 정도로 길어지고 있습니다(?)

 

1월 중순 쯤 Google Analytics 강의를 다 듣고

 

어느 정도 데이터를 모은 뒤

 

한 번 살펴 보기로 했었는데,

 

이 정도면 한 번 살펴봐도 되지 않을까 싶네요.

 

 

 

과연 제 블로그에서

 

보는 사람이 가장 많은 게시물은 어떤 분류인지,

 

BigQuery로 한 번 살펴보겠습니다.

 

 

 

바로 let's go!


카테고리별 조회수

with reg_table as 

(select case
      when array_to_string(regexp_extract_all(param.value.string_value, r"^\[.+\]"),"")="" then 'non-category' else array_to_string(regexp_extract_all(param.value.string_value, r"^\[.+\]"),"")
      end as category, 
      param.value.string_value as realvalue

from `your table.events_*`, unnest(event_params) as param

where 1=1
      and event_date between '20240119' and '20240204'
      and param.key='page_title'
      and event_name='page_view')

select category, count(realvalue) as count_category

from reg_table

group by category

order by count(realvalue) desc

fig 1. 카테고리별 조회수

 

쿼리문을 하나하나씩 살펴보겠습니다.

 

  • regexp_extract_all : 정규표현식과 맞는 표현 전부를 array 타입으로 반환합니다.

    제 글의 대부분은 대괄호('[  ]')로 카테고리를 가볍게 표시하기 때문에, 해당 부분을 정규표현식으로 가져옵니다. 

  • array_to_string : array 타입을 string 타입으로 반환합니다. 두 번째 파라미터에는 array의 구분자를 입력해 줍니다.

    저는 ""(구분자 없음)으로 표시했습니다.

  • 정규표현식과 맞지 않을 때는 'non-category'라고 표시할 수 있도록,

    case 문을 사용했습니다.

  • 정규표현식으로 카테고리를 추출한 쿼리는 서브쿼리로 처리했습니다.

  • 그 후 grouping을 해서 카테고리별 조회수를 확인했습니다.

 

약 17일 동안 가장 조회가 많았던 게시물은 'Tableau'가 가장 많고

 

'non-category'를 제외하면, 'GA(Google Analytics)'가 두 번째로 많은 것을 확인할 수 있습니다.

 

세 번째로 '후기'도 확인할 수 있겠네요.


Tableau나 GA는 궁금한 것이 생겨서 검색을 해 보면

 

한글로 된 게시글이 많이 없을 뿐더러, 영어로 된 게시물도 그리 많지 않은 것을 알 수 있습니다.

 

저도 공부하면서 겪은 일이지요ㅎㅎ

 

 

 

보통 해외에서 작성된 글이 알찬 경우가 많지만

 

해석이 어렵기 때문에,

 

한글로 된 게시물을 먼저 찾아보게 되는 것 같습니다.

 

그래서 제 블로그 글도 조회가 되는 것이 아닌가 추측할 수 있겠습니다.

 

 

 

Tableau는 다루는 회사에 들어가지 않는 이상 당분간 만져볼 일이 없을 것 같아서

 

GA 관련 글을 더 작성한다면,

 

방문자가 늘어나지 않을까 싶습니다.


제가 분야를 바꾸고 나서 취득한 자격증은 SQLD랑 빅데이터 분석기사이고,

 

둘 다 후기를 올렸지만,

 

SQLD는 카테고리를 'SQL'로 분류해서

 

'후기'는 전부 빅데이터 분석기사 후기입니다.

 

(저의 불찰이죠....)

 

fig 2. GA 페이지 및 화면 대시보드

 

BigQuery와 연동하기 전 17일 간의

 

page_view 이벤트 수 입니다.

 

빅분기 후기의 조회수가 30회인데,

 

실습하는 동안 Debug view 확인한다고 제가 게시물을 누른 것을 감안하더라도 

 

최대 3~4배는 차이가 나지 않을까 싶습니다.

 

그럼 빅분기 후기 게시물만

 

0.7~0.9회 / day

 

조회가 일어난 것이죠.

 

 

빅분기 필기 접수가 3월 초에 있으니까,

 

아마 조만간

 

1일당 조회수가 오르지 않을까 예상해 봅니다.


Looker Studio도 같이 연습하고 있는데,

 

아직 손에 잘 안 익어서

 

하다가 깨달음을 얻으면 그 때 올리겠습니다.

 

(유레카)

 

그럼 저는 이만 돌아가겠습니다.

 

곧 알바 퇴근 해야 돼서

 

그럼 담에 봐용~~

 

Comments