본문 바로가기

Python61

[EDA] 경기도 일자리 청년통장선발정보 Python 분석 2 안녕하세요. 인문계공돌이입니다. 경기도 일자리 청년통장 선발정보 데이터를 가지고 여러 가지 분석을 해보려고 하는데 오늘은 사용하지 않을 변수를 구별해보겠습니다. 데이터 사용할 데이터는 경기지역경제포털의 경기도 일자리 청년통장선발정보입니다. 설명은 위와 같습니다. 경기도 일자리 청년통장선발정보 EDA 변수 제외 결측치 제거를 해서 총 50개의 변수와 79232의 값들이 있습니다. 이제 분석에 필요한 변수만 뽑아보겠습니다. 선발정보번호입니다. 숫자에 의미가 있는 것이 아니므로 제외해야 합니다. ERNM_AMOUNT, BSNS_INCOME_AMOUNT, PRPRTY_INCOME_AMOUNT, ETC_INCOME_AMOUNT, REAL_INCOME_AMOUNT, MXMM_INCOME_RCOGN_AMOUNT 모두.. 2021. 8. 12.
[EDA] 경기도 일자리 청년통장선발정보 Python 분석 1 안녕하세요. 인문계공돌이입니다. 경기도 일자리 청년통장 선발정보 데이터를 가지고 여러 가지 분석을 해보려고 하는데 오늘은 결측치 처리부터 해보겠습니다. 데이터 사용할 데이터는 경기지역경제포털의 경기도 일자리 청년통장선발정보입니다. 설명은 위와 같습니다. 경기도 일자리 청년통장선발정보 EDA 결측치 처리 경기도 일자리 청년통장선발정보 데이터를 확인했습니다. 약 9만 5천개의 데이터가 있습니다. 결측값이 있는지 확인하는데 절반 정도 아예 데이터가 없는 변수도 있습니다. 결측값이 있는 변수만 확인해보겠습니다. 총 개수가 9만 5천개 쯤 되는데 4만개 이상의 결측값이 존재한다면 그 변수는 없애주겠습니다. 결측치 수가 애매한 변수들만 살펴보겠습니다. PROPER_STTUS_NM는 적격상태명입니다. 최종적으로 예측.. 2021. 8. 11.
[시각화] 소상공인시장진흥공단 상가(상권)정보 Python 분석 3 안녕하세요. 인문계공돌이입니다. 오늘은 소상공인시장진흥공단 상가(상권)정보 데이터를 가지고 커피 브랜드 분기별 비교를 해보겠습니다. 데이터 사용할 데이터는 공공데이터포털의 소상공인시장진흥공단 상가(상권)정보입니다. 라이센스 및 설명은 위와 같습니다. 이디야, 스타벅스, 메가커피 분기 증감 시각화 이디야, 스타벅스, 메가커피만 따로 추출한 데이터셋을 이용하겠습니다. 2021년도 1분기 이디야, 스타벅스, 메가커피를 합친 총 매장이 어느 구가 많은가 보면 강남구, 송파구, 중구, 서초구... 순입니다. 행정구역별로 브랜드 매장수 데이터셋을 만들었습니다. 2021년 1분기 때 세 브랜드를 합친 총 매장수가 많은 순서대로 10개 구를 선정했습니다. 강남구부터 성북구까지입니다. 커피 매장 수가 제일 많은 곳은 강.. 2021. 8. 10.
[시각화] 소상공인시장진흥공단 상가(상권)정보 Python 분석 2 안녕하세요. 인문계공돌이입니다. 오늘은 소상공인시장진흥공단 상가(상권)정보 데이터를 가지고 커피 브랜드 몇 곳을 시각화해보겠습니다. 데이터 사용할 데이터는 공공데이터포털의 소상공인시장진흥공단 상가(상권)정보입니다. 라이센스 및 설명은 위와 같습니다. 이디야, 스타벅스, 메가커피 시각화 저번 빈도분석에서 이디야, 스타벅스, 메가커피만 따로 데이터셋을 만들었습니다. 세 데이터셋을 합친 후 csv 파일로 저장했었는데 시각화를 위해 사용하겠습니다. 연도 변수명만 분기로 변경하였습니다. 결측치 수를 확인한 결과 상호명과 경도, 위도에서 보이지 않으니 그대로 사용하겠습니다. 지도 데이터 시각화를 위해 folium를 사용합니다. 커피 브랜드 데이터셋의 위도와 경도의 평균을 중심점으로 잡고 zoom_start를 10 .. 2021. 8. 9.