Random Forest1 Chap 08 Bagging and Random Forests : Random Forests Random Forests 랜덤 포레스트는 매우 효율적인 통계 학습 방법입니다. Bagging의 아이디어를 토대로 하지만 더 좋은 방안입니다. The trees를 de-correlate 하기 때문입니다. 작동하는 방식은 다음과 같습니다. Bootstrapped training sample의 결정 트리들을 만드는데 이때, 트리에서 분할을 고려하여 전체 p predictors의 집합으로부터 임의적 샘플의 m predictors가 split candidates로 선택됩니다. 보통 $m \approx \sqrt{p}$ 왜 분할 시 모든 predictors 대신에 랜덤 샘플의 m predictors를 고려해야 할까요? 데이터셋에서 다른 적당히 강력한 predictor 사이에 매우 강력한 predictor가 있다고.. 2019. 10. 14. 이전 1 다음