전체 글344 정규분포 - 개념 정규분포 정규분포의 그래프는 종 모양의 곡선입니다. 종 모양의 곡선을 분포로 가지는 연속형 확률변수 $X$를 정규 확률변수라 합니다. 정규 확률변수 $X$의 밀도 함수는 $n(x;\mu, \sigma)$로 표시합니다. 즉, 평균 $\mu$와 표준편차 $\sigma$에 의해 결정됩니다. 모양은 평균 $\mu$를 중심으로 좌우대칭의 종 모양, 퍼짐은 표준편차에 의해 달라집니다. 정규분포 확률밀도함수 $n(x;\mu, \sigma) = \frac {1}{\sqrt {2\pi}\sigma} e^{-\frac {1}{2\sigma^{2}}(x-\mu)^{2}}$, $-\infty 2019. 9. 11. Chap02 통계 학습(3) 오늘은 저번 시간에 이어서 왜 더 현실적이고 유연한 모델을 쓰면 안 되는 지를 설명드리겠습니다. ● 예측 정확성과 모델 해석 가능성 사이의 상충관계 1. 회귀 분석같은 단순한 방법은 모델 해석을 더 쉽게 할 수 있다(추론 부분에서 더 뛰어남.) 예를 들어 선형 모델에서 $\beta_{j}$는 다른 모든 변수를 일정하게 유지했을 때 $\mathbf {X_{j}}$의 한 단위 증가에 대한 Y의 평균 증가입니다. 2. 예측에만 관심이 있어 첫번째 이유와 관련이 없어도 복잡한 모델 대신 간단한 모델로 더 정확한 예측을 할 가능성이 있습니다. 직관적으로 보이지는 않지만 더 유연한 모델이 오히려 적합시키기 어렵다는 사실과 관련됩니다. ● 나쁜 추정 비선형회귀 방법은 매우 유연하지만 f에 대해 나쁜 추정을 할 수 있.. 2019. 9. 11. Chap02 통계 학습(2) (통계학을 공부하다 보면 오히려 한국어로 번역하는 것보다 영어로 쓰는 게 의미 파악을 훨씬 쉽게 할 수 있습니다. 그러나 영어를 싫어하는 분도 계신 점을 고려하여 둘 모두 쓰겠습니다.) ● f를 추정하는 2가지 이유 1. 예측(Prediction) 2. 추론(Inference) ● 예측 f의 좋은 추정치를 만들 수 있고 $\varepsilon$의 분산이 너무 크지 않다면 새로운 값 X에 대한 Y의 값을 정확히 예측할 수 있습니다. ● 추론 Y와 X들의 관계에 대해 궁금해할 수 있습니다. ex) 어떤 특정 X가 실제로 Y에 영향을 미칠까?, 부정일까 긍정일까, 단순한 선형일까 아니면 더 복잡할까? 등등이 있습니다. ● f를 추정하는 방법에 대해 알아보겠습니다. 훈련 데이터(Training data)를 얻었.. 2019. 9. 6. API with Python(feat.공공데이터포털)(3) - Python으로 데이터 불러오기 데이터 확인까지 끝났으니 이제부터는 Python으로 데이터를 불러오는 연습을 해보겠습니다. import requests url = "http://apis.data.go.kr/1400000/service/cultureInfoService/mntInfoOpenAPI?searchWrd=북한산&ServiceKey=본인의서비스키붙여넣기" print(url) 전에 이 부분을 보라고 했던 것이 기억이 나시나요? (참조: https://bizzengine.tistory.com/25) API with Python(feat.공공데이터포털)(2) - API데이터 확인하기 python으로 데이터를 불러오기 전에 참고문서를 보면서 내용을 확인합니다. 참고문서를 다운 받습니다. 서비스 인증키 활용을 봐둡니다. 서비스 개요에서 메.. 2019. 9. 6. 이전 1 ··· 77 78 79 80 81 82 83 ··· 86 다음