bootstrapping1 Chap 08 Bagging and Random Forests : Bagging 문제점 결정 트리는 높은 분산을 갖습니다. 즉, training data를 두 파트로 랜덤 하게 나누고 각각 결정 트리를 적합시키면 둘의 결과는 꽤 다르게 나옵니다. 낮은 분산을 갖는 모델을 만드는 것이 목표입니다. 이 문제를 해결하기 위해 bagging을 사용합니다. (bagging은 bootstrap aggregating에서 추린 말입니다.) Bootstrapping? 같은 사이즈의 관측된 데이터셋을 Resampling합니다. Resampling 된 데이터셋은 원래의 데이터셋에서 중복 가능한 random sampling을 통해 만들어졌습니다. Bagging? Bagging은 아래의 두 개의 방법을 기반으로 한 매우 강력한 아이디어입니다. Averaging : 분산을 줄입니다. Bootstrapping.. 2019. 10. 11. 이전 1 다음