본문 바로가기
Python

[독립표본T검정] 인천광역시 소득 데이터 Python 분석

by 지식광부키우기 2021. 8. 5.

안녕하세요. 인문계공돌이입니다.

 

저번에 인천광역시 소득 데이터를 가지고 독립표본 T 검정을 해봤는데 이를 Python으로 똑같이 해보겠습니다.

 

 

 

데이터

 

데이터는 공공데이터포털에서 제공하는 인천광역시 소득 데이터입니다.

 

 

라이센스 및 데이터 설명은 위와 같습니다.

 

 

 

연구가설

 

연구가설을 복기하겠습니다.  

 

귀무가설 : 성별에 따라 평균소득은 유의한 차이가 없다.

 

대립가설 : 성별에 따라 평균소득은 유의한 차이가 있다.

 

 

 

독립표본 T 검정

 

 

분석에 필요한 라이브러리를 불러왔습니다.

 

 

통합된 데이터를 가지고 분석해보겠습니다.

 

첫 행부터 평균소득이 결측치입니다.

 

 

평균소득이 결측치인 행은 제외하였습니다.

 

 

남성과 여성의 평균소득 값을 각각 group_men, group_women 변수에 할당했습니다.

 

 

Levene의 등분산 검정의 유의확률이 .000이므로 등분산이 가정되지 않습니다.

 

 

SPSS에서도 Levene의 등분산 검정의 유의확률이 .000으로 등분산이 가정되지 않음으로 해석 했습니다.

 

 

등분산이 가정되지 않음으로 구해야 하므로 equal_var = False입니다.

 

결과를 보면 t 값은 4.3326, 유의확률은 1.47e-0.5이므로 거의 0입니다.

 

Python과 SPSS 모두 동일한 결과를 얻을 수 있습니다.

 

 

 

결론

 

SPSS, R뿐만 아니라 Python으로도 통계 분석이 가능합니다.

 

SPSS는 표로 잘 볼 수 있고 R과 Python은 빠르고 전처리를 하기 쉬우니 각각의 장단점을 이용하여

 

다양한 소프트웨어로 분석해보는 것을 추천드립니다. 

댓글