본문 바로가기
Python

[데이터 통합] 인천광역시 소득 데이터 20200630 Python 분석

by 지식광부키우기 2021. 8. 4.

안녕하세요. 인문계공돌이입니다.

 

오늘은 인천광역시 소득 데이터를 한 파일로 합치는 작업을 해보겠습니다. 

 

 

 

데이터

 

데이터는 공공데이터포털에서 제공하는 인천광역시 소득 데이터입니다

 

 

라이센스 및 데이터 설명은 위와 같습니다.

 

 

 

데이터 통합

 

 

인천광역시 소득 데이터를 다운받아 보면 압축 파일 안에 시간대별로 다른 파일들이 여러 개 있습니다.

 

압축을 푼 후 데이터를 몇 개만 살펴보겠습니다.

 

 

Jupyter notebook의 경로는 현재 있는 파일로 설정했습니다.

 

 

16년 12월 데이터의 변수들을 확인해봤습니다.

 

각 파일마다 변수가 동일하면 concat을 이용해서 쉽게 데이터 통합을 할 수 있습니다.

 

 

20년 6월까지 모두 변수들이 같습니다.

 

 

concat을 통해 아주 쉽게 데이터 통합을 할 수 있습니다.

 

먼저 빈 데이터프레임을 하나 만들어 줍니다.

 

현재 경로에서 '.csv' 글자가 들어가 있으면 csv 파일을 불러온 후

 

빈 데이터 프레임과 통합하여 new_df에 넣어주는 식으로 했습니다. 

 

 

이제 이 통합된 데이터프레임을 csv로 다시 저장하면 끝입니다.

 

 

결론

 

빈 엑셀을 열어 하나씩 붙여넣기를 하거나 코딩으로 하지 않고 직접 통합을 하면 

 

시간이 굉장히 오래 걸립니다.

 

Python을 이용하면 10초만에 끝낼 수 있으니 데이터 통합은 알아두시면 편합니다. 

댓글