안녕하세요. 인문계공돌이입니다.
경기도 일자리 청년통장 선발정보 데이터를 가지고 여러 가지 분석을 해보려고 하는데 오늘은 범주형 변수 분석을 해보겠습니다.
데이터
사용할 데이터는 경기지역경제포털의 경기도 일자리 청년통장선발정보입니다.
설명은 위와 같습니다.
경기도 일자리 청년통장선발정보 EDA 범주형 변수
변수들의 데이터 타입이 object인 것만 보겠습니다.
범주형 변수는 총 9개입니다.
하나씩 자세히 살펴보면 위와 같습니다.
저번에 언급한대로 경기에 직장을 두고 있으면 Y, 아니면 N 값을 가진 변수를 생성했습니다.
원래 있던 변수였지만 결측치가 많아서 삭제했고 제가 따로 만들었습니다.
주소 변수는 삭제했습니다.
가구특성해당여부가 아닐 경우 선발이 더 됩니다.
여자일 경우 선발이 더 됩니다.
경기도 거주기간이 3년 이상일 경우 선발이 더 됩니다.
근무처가 경기도일 경우 선발이 더 됩니다.
근로기간은 짧을 경우 선발이 더 됩니다.
적격의 경우 선발이 더 됩니다.
저축목적의 경우 주거자금이면 선발이 더 되지만 목적이 선발에 크게 영향을 미칠 것 같지 않습니다.
생산직의 경우 선발이 더 됩니다.
결론
범주형 변수 분석이 끝났습니다.
적격상태명은 지원대상여부랑 거의 비슷하기 때문에 예측에 제외해야 될 것 같습니다.
다음엔 연속형 변수 분석을 해보겠습니다.
'Python' 카테고리의 다른 글
[이슈사항] 로또 크롤링 (0) | 2021.08.15 |
---|---|
[이슈사항] 경기도 일자리 청년통장선발정보 Python 분석 4 (0) | 2021.08.14 |
[EDA] 경기도 일자리 청년통장선발정보 Python 분석 2 (0) | 2021.08.12 |
[EDA] 경기도 일자리 청년통장선발정보 Python 분석 1 (0) | 2021.08.11 |
[시각화] 소상공인시장진흥공단 상가(상권)정보 Python 분석 3 (1) | 2021.08.10 |
댓글