본문 바로가기

Python61

Pandas 고급 데이터 set 만들기 df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']}, index=[0, 1, 2, 3]) df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'], 'B': ['B4', 'B5', 'B6', 'B7'], 'C': ['C4', 'C5', 'C6', 'C7'], 'D': ['D4', 'D5', 'D6', 'D7']}, index=[4, 5, 6, 7]) df3 = pd.DataFrame({'A': ['A8', 'A9', 'A10', 'A11'], 'B'.. 2019. 9. 25.
서울시 구별 병원 현황 분석 - pandas로 데이터 파악 및 전처리 하기 ▶ pandas import import pandas as pd ▶ csv 파일 불러오기 HOS_Seoul = pd.read_csv('10_to_18_number_hos.csv', encoding='utf-8') HOS_Seoul.head() csv 파일을 읽고 head 명령을 통해 앞 5줄만 불러왔습니다. csv 파일을 읽을 때는 디렉터리가 같아야 한다는 점 반드시 명심하시길 바랍니다. ▶ 열 인덱스 HOS_Seoul.columns 열 인덱스로 기관명, 소계, ... 등이 있는 것을 확인합니다. ▶ 첫 번째 열 인덱스 HOS_Seoul.columns[0] 첫 번째 열 인덱스만 나타냅니다. ▶ 기관명을 구별로 바꾸기 HOS_Seoul.rename(columns={HOS_Seoul.columns[0] : .. 2019. 9. 24.
서울시 구별 병원 현황 분석 - csv 데이터 변환하기 오늘은 다운로드한 txt 파일을 Excel csv데이터로 변환하는 방법을 알아보겠습니다. 다운로드한 txt 파일을 열어보면 위의 그림과 같습니다. 메모장 파일을 Excel csv로 바꿔보겠습니다. 데이터 메뉴로 들어가서 텍스트를 클릭합니다. 본인의 경로에서 해당 데이터를 클릭한 다음 구분 기호로 분리됨을 클릭하고 다음으로 넘어갑니다. 구분 기호는 탭만 체크합니다. 쉼표도 하는 일이 더 많지만 이 데이터는 1000 단위 숫자 구별로 쉼표가 들어가 있기 때문에 쉼표도 클릭하면 기준이 맞지 않게 됩니다. 본인의 데이터가 어떻게 되어있는지에 따라 다릅니다. 꼭 확인하고 구분 기호를 체크해주세요!! 열 데이터 서식을 일반으로 해준다음 마침을 클릭합니다. 기본으로 설정되어 있는대로 하고 확인을 클릭합니다. 다음과 .. 2019. 9. 23.
서울시 구별 병원 현황 분석 - 데이터 구하기 파이썬으로 데이터 주무르기(저자 민형기) 1장 서울시 구별 CCTV 현황 분석을 응용하여 병원으로 연습해보겠습니다. 1-1 병원 현황과 인구 현황 데이터 구하기 서울시의 병원 현황은 서울 열린 데이터 광장에서 얻을 수 있습니다. 서울 열린 데이터 광장에서 보건을 클릭한 후 들어갑니다. [보건] 서울시 의료기관 (구별) 통계를 클릭합니다. 기간을 연도로 설정하고 2010~2018로 적용한 뒤 csv를 누르면 다운로드가 진행됩니다. 다음으로 서울 인구 데이터를 구해보겠습니다. 다시 서울 공공데이터 메인화면으로 돌아와서 인구/가구를 클릭합니다. [인구/가구] 서울시 주민등록인구 (구별) 통계를 클릭합니다. 아까와 마찬가지로 기간을 연도로 해서 2010~2018을 설정한 뒤 csv를 누르면 다운로드됩니다. 위의.. 2019. 9. 20.