안녕하세요. 인문계공돌이입니다.
오늘은 인천광역시 소득 데이터를 한 파일로 합치는 작업을 해보겠습니다.
데이터
데이터는 공공데이터포털에서 제공하는 인천광역시 소득 데이터입니다
라이센스 및 데이터 설명은 위와 같습니다.
데이터 통합
인천광역시 소득 데이터를 다운받아 보면 압축 파일 안에 시간대별로 다른 파일들이 여러 개 있습니다.
압축을 푼 후 데이터를 몇 개만 살펴보겠습니다.
Jupyter notebook의 경로는 현재 있는 파일로 설정했습니다.
16년 12월 데이터의 변수들을 확인해봤습니다.
각 파일마다 변수가 동일하면 concat을 이용해서 쉽게 데이터 통합을 할 수 있습니다.
20년 6월까지 모두 변수들이 같습니다.
concat을 통해 아주 쉽게 데이터 통합을 할 수 있습니다.
먼저 빈 데이터프레임을 하나 만들어 줍니다.
현재 경로에서 '.csv' 글자가 들어가 있으면 csv 파일을 불러온 후
빈 데이터 프레임과 통합하여 new_df에 넣어주는 식으로 했습니다.
이제 이 통합된 데이터프레임을 csv로 다시 저장하면 끝입니다.
결론
빈 엑셀을 열어 하나씩 붙여넣기를 하거나 코딩으로 하지 않고 직접 통합을 하면
시간이 굉장히 오래 걸립니다.
Python을 이용하면 10초만에 끝낼 수 있으니 데이터 통합은 알아두시면 편합니다.
'Python' 카테고리의 다른 글
[주피터노트북] 한글 폰트 사용하기 (0) | 2021.08.06 |
---|---|
[독립표본T검정] 인천광역시 소득 데이터 Python 분석 (0) | 2021.08.05 |
[빈도분석] 네이버 뉴스 기사 주요 단어 빈도 python 분석 (0) | 2021.08.02 |
[크롤링] 네이버 뉴스 기사 제목 및 언론사 크롤링 python 분석 (0) | 2021.08.01 |
[로또] 로또 1등 당첨은 진짜 어려울까? (0) | 2021.07.26 |
댓글