안녕하세요. 인문계공돌이입니다.
저번에 인천광역시 소득 데이터를 가지고 독립표본 T 검정을 해봤는데 이를 Python으로 똑같이 해보겠습니다.
데이터
데이터는 공공데이터포털에서 제공하는 인천광역시 소득 데이터입니다.
라이센스 및 데이터 설명은 위와 같습니다.
연구가설
연구가설을 복기하겠습니다.
귀무가설 : 성별에 따라 평균소득은 유의한 차이가 없다.
대립가설 : 성별에 따라 평균소득은 유의한 차이가 있다.
독립표본 T 검정
분석에 필요한 라이브러리를 불러왔습니다.
통합된 데이터를 가지고 분석해보겠습니다.
첫 행부터 평균소득이 결측치입니다.
평균소득이 결측치인 행은 제외하였습니다.
남성과 여성의 평균소득 값을 각각 group_men, group_women 변수에 할당했습니다.
Levene의 등분산 검정의 유의확률이 .000이므로 등분산이 가정되지 않습니다.
SPSS에서도 Levene의 등분산 검정의 유의확률이 .000으로 등분산이 가정되지 않음으로 해석 했습니다.
등분산이 가정되지 않음으로 구해야 하므로 equal_var = False입니다.
결과를 보면 t 값은 4.3326, 유의확률은 1.47e-0.5이므로 거의 0입니다.
Python과 SPSS 모두 동일한 결과를 얻을 수 있습니다.
결론
SPSS, R뿐만 아니라 Python으로도 통계 분석이 가능합니다.
SPSS는 표로 잘 볼 수 있고 R과 Python은 빠르고 전처리를 하기 쉬우니 각각의 장단점을 이용하여
다양한 소프트웨어로 분석해보는 것을 추천드립니다.
'Python' 카테고리의 다른 글
[시각화] 소상공인시장진흥공단 상가(상권)정보 Python 분석 (0) | 2021.08.07 |
---|---|
[주피터노트북] 한글 폰트 사용하기 (0) | 2021.08.06 |
[데이터 통합] 인천광역시 소득 데이터 20200630 Python 분석 (0) | 2021.08.04 |
[빈도분석] 네이버 뉴스 기사 주요 단어 빈도 python 분석 (0) | 2021.08.02 |
[크롤링] 네이버 뉴스 기사 제목 및 언론사 크롤링 python 분석 (0) | 2021.08.01 |
댓글