서울글로벌센터 월별 상담실적 SPSS 분석 (1)
안녕하세요. 인문계공돌이입니다. 오늘은 서울글로벌센터 월별 상담실적 데이터를 가지고 SPSS를 이용해서 여러 분석을 해보겠습니다. 데이터 출처 데이터는 서울 열린데이터 광장에서 가져왔으며, 이 데이터를 고른 이유는 딱히 없습니다. 자쥬이용이 허락된 데이터입니다. CSV 형식으로 데이터를 다운 받았습니다. 데이터 설명 데이터는 위와 같습니다. 변수로 년월, 기관유형, 전화, 방문, 이메일, 게시판, 화상상담, 이동상담, 합계가 있습니다. 데이터를 보고 기관유형별로 전화, 방문, 이메일 차이를 알아보고 싶다는 생각이 가장 먼저 들었습니다. 기관유형은 범주형 변수이고 전화, 방문, 이메일은 연속형 변수이므로 분산분석(ANOVA)를 이용해 분석해 보겠습니다. 변수 변환 데이터는 2019년 7월부터 2021년 5..
2021. 6. 25.
같은 인덱스 다른 값 리스트로 묶어주고 한 행으로 재배치하기
같은 인덱스 다른 값 리스트로 묶어주는 코드입니다. import pandas as pd # 예시용 데이터프레임 생성 df = pd.DataFrame({"id" : [2011, 2011, 2012, 2012, 2013, 2013, 2013], "value" : ['a', 'b', 'c', 'd', 'e', 'f', 'g']}) # id를 인덱스로 설정 df = df.set_index('id') # id 별로 다른 값을 묶어서 리스트로 만든 후에 행 재배열 df.groupby('id').agg(lambda x: x.tolist())
2020. 11. 12.