안녕하세요. 인문계공돌이입니다.
오늘은 소상공인시장진흥공단 상가(상권)정보 데이터를 가지고 우리나라에서 상권이 어디에 있는지 시각화해보겠습니다.
데이터
이번에 사용할 데이터는 공공데이터포털의 소상공인시장진흥공단 상가(상권)정보입니다.
라이센스 및 설명은 위와 같습니다.
소상공인시장진흥공단 상가(상권)정보 시각화
예시로 서울, 부산, 경기도의 상가 정보를 사용하겠습니다.
상가 개수를 보면 서울은 315555개, 부산은 136657개, 경기도는 508845개로 경기도가 가장 많습니다.
서울의 데이터를 한 번 확인해봤습니다.
서울 데이터의 변수명입니다.
부산하고 경기도도 살펴봤더니 똑같습니다.
분석을 용이하게 하기 위해 세 데이터를 하나로 합쳤습니다.
데이터 개수를 보면 잘 합쳐졌습니다.
맨 뒤의 데이터에는 경기도 상권 정보가 들어있습니다.
변수별 결측치와 데이터타입을 확인했습니다.
변수별 결측치를 확인했습니다. 지점명, 표준산업분료코드, 지번부번지, 건물부번지, 건물명, 동정보, 층정보, 호정보 변수들이 결측치가 많이 보입니다.
히트맵을 통해서 보면 어떤 변수에 결측치가 많은지 눈으로 확인할 수 있습니다.
결측값이 적은 변수들만 뽑아서 사용하겠습니다.
다시 결측치 수를 확인하면 신우편번호, 상호면에 존재합니다.
결측값이 있는 행은 제거하였습니다.
위도 경도를 통해 확인해보면 서울, 경기도, 부산에 있는 상권 지도가 그려집니다.
실제 서울, 경기도, 부산과 지도가 비슷합니다.
도로명주소를 보면 서울의 경우 서울특별시가 모두 앞에 있습니다.
따라서 서울 데이터만 뽑아내고 싶으면 시작하는 단어가 '서울'로 조건을 넣어주면 됩니다.
서울 데이터만 뽑고 상권 지도를 그려보면 위와 같습니다.
서울은 비교적 각 구마다 고르게 상권이 분포되어 있습니다.
부산도 한 번 그려봤습니다.
부산의 경우에는 상권이 있는 지역과 없는 지역이 확연히 보입니다.
서울 구별로 살펴보겠습니다.
시군구명으로 구별한 서울의 상권 분포입니다. 어느 구에서 어디쪽이 많이 상권이 없는지 더 자세히 파악할 수 있습니다.
부산도 마찬가지입니다.
경기도는 시와 구가 섞여있어 시 안에서도 구별로 색깔이 다르게 표시됩니다.
시별로 보일 수 있게 작업을 한 번 더 해줘야 겠다는 생각이 듭니다.
결론
소상공인시장진흥공단 상가(상권)정보 데이터를 가지고 시각화를 해봤습니다.
단순히 시각화를 위한 작업을 했음에도
서울, 부산, 경기도의 상권 수 차이도 알 수 있었고
어느 시군구에 상권이 밀집되어 있는지 등도 파악할 수 있었습니다.
더 자세한 분석은 다음시간에 하겠지만 시각화 만으로도 벌써 다양한 인사이트를 얻을 수 있었습니다.
'Python' 카테고리의 다른 글
[시각화] 소상공인시장진흥공단 상가(상권)정보 Python 분석 2 (0) | 2021.08.09 |
---|---|
[빈도분석] 소상공인시장진흥공단 상가(상권)정보 서울 Python 분석 (0) | 2021.08.08 |
[주피터노트북] 한글 폰트 사용하기 (0) | 2021.08.06 |
[독립표본T검정] 인천광역시 소득 데이터 Python 분석 (0) | 2021.08.05 |
[데이터 통합] 인천광역시 소득 데이터 20200630 Python 분석 (0) | 2021.08.04 |
댓글