본문 바로가기
SPSS

서울글로벌센터 월별 상담실적 SPSS 분석 (1)

by 지식광부키우기 2021. 6. 25.

안녕하세요. 인문계공돌이입니다.

 

오늘은 서울글로벌센터 월별 상담실적 데이터를 가지고 SPSS를 이용해서 여러 분석을 해보겠습니다.

 

 

 

데이터 출처 

 

 

데이터는 서울 열린데이터 광장에서 가져왔으며, 이 데이터를 고른 이유는 딱히 없습니다. 

 

자쥬이용이 허락된 데이터입니다.

 

CSV 형식으로 데이터를 다운 받았습니다.

 

 

 

데이터 설명

 

 

데이터는 위와 같습니다. 변수로 년월, 기관유형, 전화, 방문, 이메일, 게시판, 화상상담, 이동상담, 합계가 있습니다.

 

데이터를 보고 기관유형별로 전화, 방문, 이메일 차이를 알아보고 싶다는 생각이 가장 먼저 들었습니다. 

 

기관유형은 범주형 변수이고 전화, 방문, 이메일은 연속형 변수이므로 분산분석(ANOVA)를 이용해 분석해 보겠습니다.

 

 

 

변수 변환

 

데이터는 2019년 7월부터 2021년 5월까지 있습니다.

 

기간 내의 기관유형별로 평균의 차이가 있는지 알아보겠습니다.

 

 

기관유형은 변수 유형이 문자로 되어 있으므로 분석을 위해서 숫자로 만들어 주겠습니다.

 

 

메뉴 변환 > 자동 코딩변경을 클릭합니다.

 

 

새로운 변수로 기관유형변경을 넣어주고 확인을 클릭합니다.

 

 

위와 같이 기관유형변경 변수가 새로 생기면서 각 유형마다 번호를 붙여줍니다.

 

 

자동 코딩변경이 편한 것은 변수 보기에서 어떤 숫자가 어떤 값을 나타내는 지까지 다 입력된다는 점입니다.

 

이제 본격적으로 분산분석을 해보겠습니다.

 

 

 

서울글로벌센터 월별 상담실적 분산분석

 

가설검증을 위한 귀무가설과 대립가설은 다음과 같습니다.

 

귀무가설 : 기관유형 간 전화, 방문, 이메일 건수는 차이가 없다. 

 

대립가설 : 기관유형 간 전화, 방문, 이메일 건수는 차이가 있다. 

 

 

메뉴 평균 비교 > 일원배치 분산분석을 클릭합니다.

 

 

종속변수에 전화, 방문, 이메일 변수를 넣었고 요인으로는 기관유형변경 변수를 넣어주었습니다.

 

추가적인 설정을 위해 우측의 사후분석을 클릭합니다.

 

 

사후분석 창이 뜨면 Scheffe와 Duncan을 체크하고 계속을 클릭합니다.

 

 

옵션에서는 기술통계 및 분산 동질성 검정에 체크를 했습니다.

 

이제 확인을 눌러주세요.

 

 

일원배치 분산분석에 대한 출력결과가 뜹니다.

 

전화에 대해서만 분석을 해보겠습니다.

 

 

분산의 동질성 검정 결과 전화는 각 집단의 분산이 동일하다는 귀무가설이 기각되었습니다.

 

각 집단들의 분산은 동일하지 않습니다.

 

문제는 여기서 발생합니다.

 

ANOVA에서도 등분산 조건이 있는데 이를 만족하지 않은 것이기 때문입니다.

 

이럴 때는 이분산이므로 이에 맞게 분석 방법을 바꿔줘야 합니다.

 

등분산이 아닌 경우에 사용하는 방법으로 바꿔주겠습니다.

 

 

다시 일원배치 분산분석으로 돌아와서 옵션을 클릭합니다.

 

 

옵션의 통계량에서 Welch를 체크해줍니다.

 

등분산이 아닌 경우의 ANOVA에서 사용하기 위함입니다.

 

 

사후분석으로도 다시 넘어가서 등분산을 가정하지 않음의 Games-Howell을 체크해주세요.

 

다시 보고서를 보면 유의확률이 .000으로 나타났으므로

 

적어도 두 집단 간의 차이가 있을 것이라는 일원배치 분산분석의 대립가설이 채택됩니다.

 

처음부터 분산 동질성 검정과 Welch를 체크해주고

 

사후분석에서 등분산 가정과 가정하지 않을 때의 방법론을 체크해 두면 훨씬 편합니다.

 

 

 

다음 포스팅에서는 집단 간 건수에서 어떤 차이가 있는지 살펴보겠습니다.

댓글