본문 바로가기
SPSS

[정규분포 검토] 지역별 지역화폐 사용량 및 지역별 소상공인 분포 SPSS 분석

by 지식광부키우기 2021. 7. 28.

안녕하세요. 인문계공돌이입니다.

 

오늘은 지역별 지역화폐 사용량 및 지역별 소상공인 분포 데이터를 가지고 정규분포 검토을 해보겠습니다. 

 

 

 

데이터

 

데이터는 경기지역경제포털에서 제공하는 지역별 지역화폐 사용량 및 지역별 소상공인 분포 데이터입니다. 

 

 

라이센스 및 다른 정보들은 위와 같습니다. 

 

 

 

정규분포 검토

 

 

메뉴에서 분석 > 기술통계량 > 기술통계를 클릭합니다.

 

 

변수에 상가수를 넣은 후 옵션을 클릭합니다.

 

 

분포에서 첨도, 왜도를 선택합니다.

 

계속을 클릭합니다.

 

 

확인을 클릭합니다.

 

 

왜도와 첨도 값을 보면 모두 왜도는 절대값이 3을 넘고 첨도 역시 절대값이 8을 넘어 기준을 만족하지 못합니다.

 

변수는 정규분포를 이루지 못하고 있습니다.

 

이번엔 로그를 취해서 다시 한 번 보겠습니다.

 

 

메뉴에서 변환 > 변수 계산을 클릭합니다.

 

 

대상변수에 상가수자연로그를 넣고 숫자표현식에 Ln(상가수)를 씁니다.

 

Ln은 함수 집단 산술에서 함수 및 특수변수 Ln을 찾거나 직접 입력하시면 됩니다.

 

 

데이터를 보면 숫자가 매우 작아졌습니다.

 

 

상가수와 상가수자연로그를 동시에 넣고 확인을 누릅니다.

 

 

기술통계량을 보면 자연로그를 취한 상가수는 왜도가 0.595, 첨도는 -0.328로 본래 6.932와 84.547보다 숫자가 훨씬 작아졌습니다.

 

이 수치는 정규분포 기준인 |왜도| < 3과 |첨도| < 8을 만족합니다.

 

 

 

결론

 

왜도와 첨도를 통해 정규분포를 이루는지 검토했습니다.

 

왜도의 절대값이 3미만이고 첨도의 절대값이 8미만이면 기준을 만족합니다. 

 

만약 그렇지 않다면 루트나 로그 변환을 해줄 필요가 있습니다.

댓글