본문 바로가기

variance2

Chap02 모델정확도 평가하기(2) 오늘은 저번 시간에 이어서 학습하겠습니다. ● The Classification Setting 회귀 문제에서 MSE를 통계 학습 모델의 정확도를 평가하는 데 사용했습니다. 분류 문제에서는 error rate를 사용합니다. $Error Rate = \sum_{i=1}^{n}I(y_{i} \neq \hat {y_{i}})/n$ $I(y_{i} \neq \hat {y_{i}})$은 지시 함수(indicator function)입니다. 만약 $(y_{i} \neq \hat {y_{i}})$이 맞다면 1 그렇지 않다면 0 값을 가집니다. 따라서 error rate는 잘못된 분류 또는 오분류의 비율을 나타냅니다 ● Bayes Error Rate 베이즈 오차율은 가장 낮은 가능성의 오차율을 나타내는데, 데이터의 't.. 2019. 9. 17.
Chap02 모델정확도 평가하기(1) ● 적합도(fit) 측정 회귀 문제를 가정해봅니다. 정확도를 평가하는 일반적인 방법은 mean squared error(MSE)입니다. $MSE = \frac {1}{n}\sum_{i=1}^{n}(y_{i}-\hat {y_{i}})^{2}$ $\hat {y_{i}}$은 훈련 데이터에서 뽑아낸 예측 값입니다. ● 문제점 1. 트레이닝 데이터를 기반으로 MSE를 최소화하는 모델을 디자인합니다. 예를 들어 선형 회귀를 사용하면 MSE가 최소화되는 선을 선택합니다. 2. 우리가 진정으로 봐야 할 것은 새로운 데이터에 잘 맞아떨어지는가입니다. 새로운 데이터는 "Test Data"라고 부릅니다. 3. Training MSE를 가장 작게 만드는 방법이라도 TEST MSE까지 가장 작다는 보장은 없습니다. ● Trai.. 2019. 9. 16.