안녕하세요. 인문계공돌이입니다.
오늘은 서울시 생필품 농수축산물 가격 정보 데이터를 가지고 분산분석 중 일원배치 분산분석을 해보겠습니다.
데이터
데이터는 서울 열린데이터 광장에서 제공하는 서울시 생필품 농수축산물 가격 정보입니다.
라이센스 및 다른 정보들은 위와 같습니다.
연구가설
서울시 생필품 농수축산물 가격 정보 데이터 중 자치구에 따라 이마트 닭고기의 가격은 차이가 있는지 알아보겠습니다.
귀무가설 : 자치구에 따른 이마트 닭고기의 가격은 차이가 없을 것이다.
대립가설 : 자치구에 따른 이마트 닭고기의 가격은 차이가 있을 것이다.
원하는 연구 데이터 추출
원본 데이터에서 중 원하는 데이터만 추출하기 위해 Python을 사용하였습니다.
시장/마트 이름 변수에서 이마트가 들어가 있으면 마트란 새로운 변수에 이마트로 넣어주었습니다.
닭고기만 케이스를 선택해주겠습니다.
메뉴에서 데이터 > 케이스 선택을 클릭합니다.
조건을 만족하는 케이스에 체크하고 조건을 클릭합니다.
품목이름 = '닭고기' | 품목이름 = '닭고기(육계)' | 품목이름 = '닭고기(토종닭)' | 품목이름 = '닭고기(중간)'
조건을 넣어주었습니다.
그냥 닭고기에도 비고를 보면 토종닭이 포함되어 있는 경우도 있어서 모두 넣어주었습니다.
계속, 확인을 눌러 최종적으로 마무리합니다.
잘 분리되었는지 확인해보겠습니다.
메뉴에서 분석 > 기술통계량 > 빈도분석을 클릭합니다.
변수에 자치구이름과 품목이름을 넣었습니다.
데이터가 잘 필터링 되었습니다.
데이터 정제
자치구별로 닭고기 가격 분포를 확인하겠습니다.
메뉴에서 그래프 > 도표 작성기를 클릭합니다.
갤러리에서 상자도표를 선택하고 맨 왼쪽의 그림을 클릭합니다.
도표 미리 보기에 뜨면 X축에는 자치구이름을 Y축에는 가격원을 드래그한 후 확인을 클릭합니다,
각 자치구별로 Boxplot이 그려졌습니다. 강남구는 가격이 높게 형성되어 있습니다.
강동구도 이상치와 섞였지만 상자 자체는 높은 가격대에 포진하고 있습니다,
도봉구, 영등포구, 은평구의 이상치는 분포를 보면 그 구에서는 나올 수 없는 값인데
유독 저 지역의 이마트만 더 비싸게 파는 것일 수도 있으니 다른 품목으로 확인을 한 번 더 해봤습니다.
달걀 10개로 해봤는데 그 지역 이마트가 비싸게 파는 것은 아니었습니다.
이상치라 여기고 지워주겠습니다.
강동구와 중랑구는 상자 분포 자체가 작아 제거하지 않고 남겨 두었습니다.
강동구와 중랑구는 닭고기마다 가격차이가 왜 큰지 분석해봐도 재밌을 듯 합니다.
일원배치 분산분석
메뉴에서 분석 > 평균 비교 > 일원배치 분산분석을 클릭합니다.
종속변수에 가격원을 요일에 자치구이름숫자를 넣었습니다.
자치구명은 문자이길래 자동 코딩변경을 통해 숫자로 변경하였습니다.
사후분석을 클릭합니다.
Scheffe와 Games-Howell에 체크하고 계속을 클릭합니다.
이번에는 옵션을 클릭하고 기술통계, 분산 동질성 검정, Welch를 체크하고 계속을 눌러줍니다.
최종적으로 확인 버튼을 눌러줍니다.
자치구별로 평균과 함께 표쥰편차, 표준오차, 최소값, 최대값 등을 확인합니다.
Levene 통계량은 38.656이고 유의확률이 0.000이므로 0.05보다 작습니다.
'등분산이 가정되지 않음'을 기준으로 봐야 합니다.
Welch 통계량은 79.924이고 유의확률이 0.000이므로 0.05보다 작습니다.
따라서 요인별 각 집단 평균은 통계적으로 다른 집단이 적어도 한 개 있다고 할 수 있습니다.
'등분산이 가정되어 있지 않음'을 기준으로 하므로, 사후 검정으로 'Games-Howell'을 보겠습니다.
자치구별로의 닭고기 가격의 평균 차이는
강남구 : 구로구 외에 전부 다
구로구 : 강남구 외에 전부 다
도봉구 : 강남구, 구로구, 양천구, 은평구
성동구 : 강남구, 구로구, 양천구, 은평구
양천구 : 은평구 외에 전부 다
영등포구 : 강남구, 구로구, 양천구, 은평구
은평구 : 양천구 이외에 전부 다
중구 : 강남구, 구로구, 양천구, 은평구
중랑구 : 강남구, 구로구, 양천구, 은평구
에서 평균의 차이가 있는 것으로 나타났습니다.
특히, 강남구와 은평구의 차이가 4373.739로 평균차이가 가장 크게 나타났습니다.
결론
자치구별 이마트 닭고기의 가격은 유의한 차이가 있는 것으로 나타났습니다.
특히 강남구와 구로구는 다른 곳에 비해 이마트 닭고기가 비싼 것으로 판단되었습니다.
위에 잠깐 달걀(10개)를 boxplot으로 그려봤는데 영등포구를 제외하고 가격 차이가 날지 궁금합니다.
홈플러스나 다른 마트로 바꿔서 해도 재밌을 것 같습니다.
'SPSS' 카테고리의 다른 글
[상관분석] 도로교통공단 일자별 시군구별 교통사고 건수 20191231 SPSS 분석 (0) | 2021.07.06 |
---|---|
[분산분석] 서울시 생필품 농수축산물 가격 정보 SPSS 분석 2 (0) | 2021.07.05 |
[독립표본 T 검정] 서울시 생필품 농수축산물 가격 정보 SPSS 분석 (0) | 2021.07.02 |
[카이제곱 검정] 서울특별시 사회복지시설 목록 SPSS 분석 (0) | 2021.06.30 |
[카이제곱 검정] 경기도 일자리 청년통장소득재산 SPSS 분석 (0) | 2021.06.29 |
댓글