일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- SQLD
- SQL
- DISTINCT
- sql 개발자
- Funnel
- bigquery
- 후기
- 통계
- 그로스해킹
- 맞춤 자바스크립트
- 데이터 분석
- 상관계수
- Ga
- Google Analytics
- It
- oracle
- 용어 정리
- tableau
- tablueau
- pandas
- 맞춤 이벤트
- Ecommerce
- 크로스셀링
- segmentation
- Kaggle
- 이벤트 매개변수
- 캐글
- Python
- API
- git
- Today
- Total
목록pandas (4)
녕녀기의 실험일지

본문으로 안녕하세요. 녀기입니다. ㅎㅎ 이 늦은 시간에 포스팅이라니... 그것도 주말입니다.. 어쩌다 보니 python 코드를 작성하게 됐고, 모르던 것을 알게 돼서 바로 기록으로 남겨야 하기에 이렇게 포스팅을 하게 됩니다.. (인생이란...야근의 연속?ㅋㅋㅋ) 으아...!!! 바로 가 보시죠🏋️♀️ str.extract() id A 0 [헤헤] 1 [지금 시간은] 새벽 2시 2 잘 수가 없는 데이터린이[는 지금도] 3 [포]스팅 중 위와 같은 테이블 혹은 데이터 프레임이 있다고 합시다. 제가 하고 싶었던 것은 [ ](대괄호) 사이에 포함돼 있는 글자를 추출하고 싶었습니다. 첫 번째 컬럼에서는 '헤헤' 두 번째 컬럼에서는 '지금 시간은' 세 번째 컬럼에서는 '는 지금도' 네 번째 컬럼에서는 '포'라는 ..

본문으로 안녕하세요. 녀기입니다. pandas를 사용해서 데이터를 다루다 보면 오름차순이나 내림차순 등으로 정렬할 필요가 있습니다!!! 그 중에서도 제가 맨날 까먹는 그 메서드ㅋㅋㅋㅋㅋ 그것을 정리해 놓을까 합니다. 그럼 가보시죠~ sort_values() 아래와 같이 데이터프레임을 하나 만들어 봅시다. ↓ import pandas as pd tt = pd.DataFrame(data=[['f','g','c','d'], ['i','b','c','h'], ['f','j','a','b']], columns=['1', '2', '3', '4']) 위의 사진처럼 데이터프레임이 형성된 것을 확인하실 수 있을 것입니다. 이제 sort_values()를 사용해 데이터프레임을 정렬해 볼까요? 컬럼 이름이 '2'인 컬럼을..

본문으로 안녕하세요. 녀기입니다. 오늘 본명조로 글씨 처음 써보는데 까리합니다(?) (여자친구가 쓴거 보고 따라 쓴 것은 비밀입죠.) 오늘은 제가 그토록 알고 싶었던 기능을 알고 싶었기 때문에 포스팅에 들어갔습니다. 어떤 기능인지 한번 보시죠! melt() melt 메소드는 데이터프레임 피벗 해제를 할 때 사용합니다. 어떻게 사용하는지 아래를 보면서 확인해 봅시다. allLeisure.head() 제가 만든 데이터프레임 입니다. 통계 자료를 바탕으로 만든 데이터프레임인데, 평가 항목이 같이 나와 있습니다. 컬럼을 평가 항목들로 나열해 놓는 것도 데이터를 처리하는데 유용할 수도 있지만, 처음 저 데이터를 봤을 때 저 컬럼명이 무엇을 나타내는지 모를 수도 있습니다. 그래서 저는 '평가 항목'과 '응답 인원'..

본문으로 안녕하세요. 녀기입니다. 공공 데이터를 python으로 가지고 놀다가 연도별로 순서만 추가 돼서 컬럼이 형성된다는 것을 한번쯤 보셨을 것입니다. 연도를 하나씩 설정해서 받아도 되지만, python을 이용해 나눠 보려고 하다가 좋은 method를 알게 돼서 글을 쓰게 되네요ㅋㅋㅋㅋ filter() 아래 코드와 같이 데이터프레임을 하나 생성해 줍시다. df = pd.DataFrame(data=np.array([['A','B','C','D','E'], ['E','F','C','D','Z'], ['E','F','G','H','A'], ['I','J','G','H','B'], ['K','L','M','N','E']]), columns=["2016.1", "2016.2", "2017", "2018.3", ..