ISLR27 Chap02 통계 학습(3) 오늘은 저번 시간에 이어서 왜 더 현실적이고 유연한 모델을 쓰면 안 되는 지를 설명드리겠습니다. ● 예측 정확성과 모델 해석 가능성 사이의 상충관계 1. 회귀 분석같은 단순한 방법은 모델 해석을 더 쉽게 할 수 있다(추론 부분에서 더 뛰어남.) 예를 들어 선형 모델에서 $\beta_{j}$는 다른 모든 변수를 일정하게 유지했을 때 $\mathbf {X_{j}}$의 한 단위 증가에 대한 Y의 평균 증가입니다. 2. 예측에만 관심이 있어 첫번째 이유와 관련이 없어도 복잡한 모델 대신 간단한 모델로 더 정확한 예측을 할 가능성이 있습니다. 직관적으로 보이지는 않지만 더 유연한 모델이 오히려 적합시키기 어렵다는 사실과 관련됩니다. ● 나쁜 추정 비선형회귀 방법은 매우 유연하지만 f에 대해 나쁜 추정을 할 수 있.. 2019. 9. 11. Chap02 통계 학습(2) (통계학을 공부하다 보면 오히려 한국어로 번역하는 것보다 영어로 쓰는 게 의미 파악을 훨씬 쉽게 할 수 있습니다. 그러나 영어를 싫어하는 분도 계신 점을 고려하여 둘 모두 쓰겠습니다.) ● f를 추정하는 2가지 이유 1. 예측(Prediction) 2. 추론(Inference) ● 예측 f의 좋은 추정치를 만들 수 있고 $\varepsilon$의 분산이 너무 크지 않다면 새로운 값 X에 대한 Y의 값을 정확히 예측할 수 있습니다. ● 추론 Y와 X들의 관계에 대해 궁금해할 수 있습니다. ex) 어떤 특정 X가 실제로 Y에 영향을 미칠까?, 부정일까 긍정일까, 단순한 선형일까 아니면 더 복잡할까? 등등이 있습니다. ● f를 추정하는 방법에 대해 알아보겠습니다. 훈련 데이터(Training data)를 얻었.. 2019. 9. 6. Chap02 통계 학습(1) ● 통계 학습(Statistical Learning)이란? 우리가 관찰한 $Y_{i}$ 그리고 $X_{i} = (X_{i1}, ..., X_{ip})$ for $i = 1, ..., n$을 가정할 때 Y와 적어도 하나의 X와 관계가 있지 않을까 생각합니다. 이러한 생각을 모델로 표현해보면 $\mathbf{Y_{i}} = f(\mathbf{X_{i}}) + \mathbf{\varepsilon_{i}}$ 여기서 f는 알지 못하는 함수이고 $\varepsilon$은 평균이 0인 우연오차(random error)입니다. 간단한 예시를 보면 ● 다양한 값의 표준 편차 f를 추정하는데 어려움은 $\varepsilon's$의 표준 편차 때문입니다. ● 다양한 f 추정 ● 실생활에서의 통계 학습(Statistical .. 2019. 9. 5. 이전 1 ··· 4 5 6 7 다음