LOOCV
이 방법은 Validation Set 접근법과 유사하지만 단점들을 해결하려고 시도합니다.
제시된 각 모델들에 대해 :
사이즈가 n인 data set으로 나눕니다. training data set (blue) 사이즈는 n-1이고 validation data set (beige) 사이즈는 1입니다.
Training data을 사용하여 모델에 적용합니다.
Validate data를 사용한 Validate model을 만든 뒤 대응하는 MSE를 계산합니다.
이 과정을 n번 반복합니다.
이 모델델의 MSE는 다음과 같이 계산됩니다.
$CV_{(n)} = \frac{1}{n}\sum^{n}_{i=1}MSE_{i}$
LOOCV vs the Validation Set Approach
LOOCV는 덜 편향적입니다. (less bias) :
n - 1 obs를 포함한 training data를 사용하여 통계 학습 method에 반복적으로 적합시킵니다.
LOOCV는 덜 가변적인 MSE를 생산합니다. :
The validation approach 경우 반복적으로 적용할 때 다른 MSE를 생성합니다. 나누는 과정에서의 무작위성 때문입니다.
반면에 LOOCV를 여러번 수행하는 일은 항상 똑같은 결과를 낳습니다. 매번 1 obs에 근거하여 나누기 때문입니다.
LOOCV는 계산 집약적입니다. (단점) :
각 모델을 n번이나 적합시켜야합니다.
'ISLR' 카테고리의 다른 글
Chap 06 선형 모델 선택 및 정규화 - 최소 제곱법 보완 (0) | 2019.10.01 |
---|---|
Ch05 Resampling Methods - k-fold Cross Validation (0) | 2019.09.30 |
Ch05 Resampling Methods - The Validation Set (0) | 2019.09.26 |
Ch04 분류분석(3) - LDA & QDA (0) | 2019.09.25 |
Ch04 분류분석(2) (0) | 2019.09.24 |
댓글