전체 글347 [EDA] 경기도 일자리 청년통장선발정보 Python 분석 1 안녕하세요. 인문계공돌이입니다. 경기도 일자리 청년통장 선발정보 데이터를 가지고 여러 가지 분석을 해보려고 하는데 오늘은 결측치 처리부터 해보겠습니다. 데이터 사용할 데이터는 경기지역경제포털의 경기도 일자리 청년통장선발정보입니다. 설명은 위와 같습니다. 경기도 일자리 청년통장선발정보 EDA 결측치 처리 경기도 일자리 청년통장선발정보 데이터를 확인했습니다. 약 9만 5천개의 데이터가 있습니다. 결측값이 있는지 확인하는데 절반 정도 아예 데이터가 없는 변수도 있습니다. 결측값이 있는 변수만 확인해보겠습니다. 총 개수가 9만 5천개 쯤 되는데 4만개 이상의 결측값이 존재한다면 그 변수는 없애주겠습니다. 결측치 수가 애매한 변수들만 살펴보겠습니다. PROPER_STTUS_NM는 적격상태명입니다. 최종적으로 예측.. 2021. 8. 11. [시각화] 소상공인시장진흥공단 상가(상권)정보 Python 분석 3 안녕하세요. 인문계공돌이입니다. 오늘은 소상공인시장진흥공단 상가(상권)정보 데이터를 가지고 커피 브랜드 분기별 비교를 해보겠습니다. 데이터 사용할 데이터는 공공데이터포털의 소상공인시장진흥공단 상가(상권)정보입니다. 라이센스 및 설명은 위와 같습니다. 이디야, 스타벅스, 메가커피 분기 증감 시각화 이디야, 스타벅스, 메가커피만 따로 추출한 데이터셋을 이용하겠습니다. 2021년도 1분기 이디야, 스타벅스, 메가커피를 합친 총 매장이 어느 구가 많은가 보면 강남구, 송파구, 중구, 서초구... 순입니다. 행정구역별로 브랜드 매장수 데이터셋을 만들었습니다. 2021년 1분기 때 세 브랜드를 합친 총 매장수가 많은 순서대로 10개 구를 선정했습니다. 강남구부터 성북구까지입니다. 커피 매장 수가 제일 많은 곳은 강.. 2021. 8. 10. [시각화] 소상공인시장진흥공단 상가(상권)정보 Python 분석 2 안녕하세요. 인문계공돌이입니다. 오늘은 소상공인시장진흥공단 상가(상권)정보 데이터를 가지고 커피 브랜드 몇 곳을 시각화해보겠습니다. 데이터 사용할 데이터는 공공데이터포털의 소상공인시장진흥공단 상가(상권)정보입니다. 라이센스 및 설명은 위와 같습니다. 이디야, 스타벅스, 메가커피 시각화 저번 빈도분석에서 이디야, 스타벅스, 메가커피만 따로 데이터셋을 만들었습니다. 세 데이터셋을 합친 후 csv 파일로 저장했었는데 시각화를 위해 사용하겠습니다. 연도 변수명만 분기로 변경하였습니다. 결측치 수를 확인한 결과 상호명과 경도, 위도에서 보이지 않으니 그대로 사용하겠습니다. 지도 데이터 시각화를 위해 folium를 사용합니다. 커피 브랜드 데이터셋의 위도와 경도의 평균을 중심점으로 잡고 zoom_start를 10 .. 2021. 8. 9. [빈도분석] 소상공인시장진흥공단 상가(상권)정보 서울 Python 분석 안녕하세요. 인문계공돌이입니다. 오늘은 소상공인시장진흥공단 상가(상권)정보 서울 데이터를 가지고 커피 브랜드 몇 곳의 매장 수 변화를 분석해보겠습니다. 데이터 이번에 사용할 데이터는 공공데이터포털의 소상공인시장진흥공단 상가(상권)정보입니다. 라이센스 및 설명은 위와 같습니다. 서울의 커피 브랜드 매장 수 변화 2020년 1분기부터 2021년 1분기까지의 커피 브랜드 매장 수가 어떻게 변했는지 알아보겠습니다. 분석에 쓸 데이터입니다. 상호명이 있어 상호명을 가지고 커피 브랜드를 수집할 예정입니다. 각 데이터프레임의 크기입니다. 연도 구별이 되어 있지 않기 때문에 파일을 각기 불러왔는데 하나로 합친 후 진행하겠습니다. 변수들을 확인해본 결과 모두 같습니다. 분기를 구별해주는 변수를 새로 하나 생성한다음 하나.. 2021. 8. 8. 이전 1 ··· 26 27 28 29 30 31 32 ··· 87 다음