본문 바로가기
SPSS

[카이제곱 검정] 경기도 일자리 청년통장소득재산 SPSS 분석

by 지식광부키우기 2021. 6. 29.

안녕하세요. 인문계공돌이입니다.

 

오늘은 경기도 일자리 청년통장소득재산 데이터를 가지고 카이제곱 검정을 해보겠습니다. 

 

 

 

데이터

 

데이터는 경기지역경제포털에서 제공하는 경기도 일자리 청년통장소득재산입니다.

 

 

라이센스 및 다른 정보들은 위와 같습니다. 

 

 

 

연구가설

 

경기도 일자리 청년통장소득재산 데이터 중 성별과 저축목적간의 관계가 있는지 알아보겠습니다. 

 

귀무가설 : 성별과 저축목적은 관계가 없을 것이다. 즉, 남녀별 저축목적 차이는 없다. 

 

대립가설 : 성별과 저축목적은 관계가 있을 것이다. 즉, 남녀별 저축목적 차이가 있다. 

 

성별은 남과 여

 

저축목적은 결혼자금, 기타 꿈을 위한 준비자금, 대출금상환, 본인 및 자녀의 교육 훈련비, 주거자금, 창업자금으로 구성되어 있습니다.

 

 

 

데이터 클리닝

 

먼저 데이터 클리닝을 진행한 후 카이제곱 검정을 진행하겠습니다.

 

 

데이터를 살펴보니 중복 값이 껴있습니다. 

 

여러 번 수정을 해서 중복 값이 생겼습니다. 

 

최종적으로 수정한 데이터만 남게 중복 값을 제거해주겠습니다.

 

 

메뉴에서 데이터 > 중복 케이스 식별을 클릭합니다.

 

 

일치하는 케이스 정의 기준에 청년통장정보번호를 넣었고 

 

마지막 케이스를 쓸 것이므로 마지막 케이스를 기본으로에 체크했습니다.

 

굳이 일치하는 케이스를 파일 위로 이동시킬 필요가 없을 것 같아 해제를 한 후 확인 버튼을 클릭합니다.

 

 

마지막에 PrimaryLast가 생기면서 쓰지 않을 중복 값은 0, 쓸 중복 값은 1로 구분이 되었습니다.

 

이제 1 값만 케이스 선택해서 사용하겠습니다.

 

 

메뉴에서 데이터 > 케이스 선택을 클릭합니다.

 

 

조건을 만족하는 케이스에 체크하고 조건을 클릭합니다.

 

 

PrimaryLast = 1 조건을 걸어주고 계속을 클릭합니다.

 

 

확인 버튼을 클릭합니다. 

 

 

중복 값이 필터링 되었습니다. 

 

이번에는 빈도 분석으로 값이 제대로 들어있나 확인해보겠습니다.

 

 

메뉴에서 분석 > 기술통계량 > 빈도분석을 클릭합니다.

 

 

변수에 성별코드, 저축목적명을 넣고 확인을 클릭합니다.

 

 

빈도표를 보면 무응답이 껴있습니다. 

 

 

위와 같은 데이터가 중간중간에 있었습니다. 

 

모두 제거하겠습니다. 

 

 

빈도표에서 무응답이 제거되었음을 확인했습니다.

 

 

 

카이제곱 검정

 

이제부터 정제한 데이터를 가지고 카이제곱 검정을 해보겠습니다.

 

 

데이터는 위와 같고 SVINGS_PURPS_NM과 SEX 변수를 사용하겠습니다. 

 

 

메뉴에서 분석 > 기술통계량 > 교차분석을 클릭합니다.

 

 

성별코드를 행에 저축목적명을 열에 넣어줬습니다. 

 

우측의 통계량을 클릭합니다.

 

 

카이제곱에 체크 표시하고 계속을 클릭합니다.

 

 

이번에는 셀을 클릭합니다.

 

 

퍼센트로도 볼 수 있도록 행에 체크 표시 하고 계속을 클릭합니다.

 

 

마지막으로 확인을 누르면 끝입니다.

 

 

결측 값 없이 89363개의 데이터를 사용하였습니다.

 

카이제곱 검정 표를 보면 Pearson 카이제곱의 값은 922.914, 자유도는 5, 점근 유의확률(양측검정)은 0.000으로 

 

유의 수준 0.05보다 작습니다. 

 

따라서 귀무가설을 기각하고 대립가설을 채택합니다.

 

즉, 대립가설인 '성별과 저축목적은 관계가 있을 것이다.'가 채택됩니다.

 

 

성별코드 * 저축목적명 교차표를 보면

 

전체적으로 여성이 49719, 남성이 39644로 여성의 비율이 높습니다.

 

여성은 주거자금, 대출금상환, 결혼자금, 기타 꿈을 위한 준비자금, 본인 및 자녀의 교육/훈련비, 창업자금 순으로 높은 빈도를 보였고

 

남성은 주거자금, 대출금상환, 기타 꿈을 위한 준비자금, 결혼자금, 본인 및 자녀의 교육/훈련비, 창업자금 순으로 높은 빈도를 보였습니다. 

 

 

 

결론

 

경기도 일자리 청년통장의 경우 성별과 저축목적은 관계가 있는 것으로 나타났습니다. 

 

데이터 클리닝을 하지 않고 카이제곱 검정을 하면 결과가 왜곡될 수 있습니다.

 

분석 보다도 더 중요한 것은 데이터를 정제하는 일입니다.

 

항상 많은 시간을 들여 데이터를 정제한 후 분석을 하시길 바랍니다.

 

성별로만 분석을 진행했는데 변수에 보면 결혼 상태부터 차량 유무까지 더 있습니다.

 

추가적으로 분석하면 더 재밌을 것 같습니다.

댓글