본문 바로가기
Python

[빈도분석] 소상공인시장진흥공단 상가(상권)정보 서울 Python 분석

by 지식광부키우기 2021. 8. 8.

안녕하세요. 인문계공돌이입니다.

 

오늘은 소상공인시장진흥공단 상가(상권)정보 서울 데이터를 가지고 커피 브랜드 몇 곳의 매장 수 변화를 분석해보겠습니다.

 

 

 

데이터 

 

이번에 사용할 데이터는 공공데이터포털의 소상공인시장진흥공단 상가(상권)정보입니다.

 

 

라이센스 및 설명은 위와 같습니다.

 

 

 

서울의 커피 브랜드 매장 수 변화 

 

 

2020년 1분기부터 2021년 1분기까지의 커피 브랜드 매장 수가 어떻게 변했는지 알아보겠습니다.

 

 

분석에 쓸 데이터입니다.

 

상호명이 있어 상호명을 가지고 커피 브랜드를 수집할 예정입니다.

 

 

각 데이터프레임의 크기입니다.

 

연도 구별이 되어 있지 않기 때문에 파일을 각기 불러왔는데 하나로 합친 후 진행하겠습니다.

 

 

변수들을 확인해본 결과 모두 같습니다.

 

 

분기를 구별해주는 변수를 새로 하나 생성한다음 하나로 합쳤습니다.

 

 

새롭게 합친 데이터프레임을 보면 연도에 알맞게 들어갔습니다.

 

 

결측치 수를 확인했습니다. 

 

중요한 것은 상호명이므로 상호명이 결측이 아닌 것만 다시 할당했습니다.

 

 

상호명이 모두 있는 것으로만 추려졌습니다.

 

 

상호명에 이디야가 포함되어 있는 데이터셋만 출력해보았습니다.

 

 

상호명 이디야가 Ediya처럼 영어로 되어있을 수도 있으므로 조건에 이디야|ediya 합집합 형태로 넣었습니다.

 

54군데가 더 추가되었습니다.

 

 

혹시나 일반인이 이디야가 포함되어 있는 상호를 쓸 수 있으므로 상권업종소분류명을 추가로 살펴봤습니다.

 

한식/백반/한정식과 패스트푸드가 껴있습니다. 

 

 

체크한 결과 이디야커피가 맞았습니다.

 

이 두 커피점만 상권업종중분류명을 한식과 패스트푸드로 해야 할 이유가 있었다고 생각합니다.

 

씨지브이 안에 있는 곳은 충분히 그렇게 분류될 수 있다고 여겨집니다.  

 

이디야커피가 맞으므로 데이터를 제거하면 안됩니다.

 

이디야, 투썸플레이스, 메가커피 세 브랜드를 해보겠습니다.

 

 

지금까지 한 것을 토대로 ediya 데이터셋을 만들어주었습니다.

 

 

스타벅스 역시 공백, 인쇄종합이 있었습니다.

 

 

체크해보니 모두 스타벅스가 맞았습니다.

 

 

스타벅스 데이터셋을 만들었습니다.

 

 

메가커피도 확인해본 결과 메가커피가 맞았습니다.

 

 

메가커피 데이터셋을 만들었습니다. 

 

 

세 개의 데이터셋을 합치고 인덱스도 초기화 시켰습니다.

 

 

변수, 결측치 수, 데이터 타입을 살펴봤습니다.

 

 

이디야의 분기별 매장수는 어떻게 변했는지 살펴보겠습니다.

 

 

2020년 1분기 때 가장 많았고 2020년 2분기 때 가장 적었다가 증감을 보이고 있습니다.

 

 

연도로 하면 헷갈리니 분기로 변수명을 변경했습니다.

 

각 브랜드별로 분기마다 매장 수가 어떠한지 파악할 수 있습니다.

 

 

브랜드를 인덱스에서 변수로 넣었습니다.

 

 

브랜드마다 분기별로 매장수가 어떻게 변하는지 한 그래프에 다 넣었습니다.

 

메가커피는 매 분기마다 그 수가 계속 증가하고 있습니다.

 

 

스타벅스는 2020년 2분기에 서울에서 이디야 매장 수를 초월했고

 

메가커피 매장 수는 계속 증가하지만 2020년 4분기에서 2021년 1분기까지 주춤하고 있습니다.

 

서울에서 스타벅스는 2020년 2분기 이후 매장 수 부문에서 이디야를 이기고 있습니다.

 

매장이 줄어들었다는 것은 폐장을 했다는 의미있데 이디야와 스타벅스는 그랬지만

 

메가커피는 폐장도 했지만 더 많은 곳에 지점이 생겼는지 

 

아니면 폐장 없이 지점이 더 많이 생긴 것인지 분석해봐도 재밌을 듯 합니다.

 

 

뉴스에서 가맹점이 5년 사이에 급격히 증가했다고 하는데 분기별로만 봐도 이를 확인할 수 있었습니다.

댓글