Roc2 Evaluation Metrics and Scoring 평가 지표와 측정 주어진 데이터셋에 대한 지도 학습 모델의 성능을 재는 방법은 많습니다. 실전에서는 애플리케이션에 따라 평가 지표가 적합하지 않을 수 있습니다. 모델을 선택하고 하이퍼파라미터를 튜닝할 때 올바른 지표를 선택하는 것이 중요합니다. 최종 목표를 기억하라 문제 해결 전략 휴리스틱 통계학 (추정, 가설 검정 등) 최적화 (이론 기반) 머신 러닝 (데이터 기반) 평가 지표를 선택할 때 머신러닝 애플리케이션의 최종 목표를 기억해야 합니다. 실제로 정확한 예측을 만드는 것뿐 아니라 큰 의사 결정 프로세스의 일부로 사용하는 데 더 중점을 둬야할 지 모릅니다. 머신러닝 평가 지표를 선택하기 전에 비즈니스 지표라고 부르는 애플리케이션의 고차원적인 목표를 생각해야 합니다. 모델을 선택할 때, 비즈니스 지표에.. 2019. 12. 16. Uncertainty Estimates from Classifiers & Summary and Outlook 불확실성 추정 어떤 테스트 포인트에 대해 분류기가 예측한 클래스가 무엇인지 뿐만 아니라 정확한 클래스임을 얼마나 확신하는지가 중요할 때가 많습니다. 실제 애플리케이션에서는 오류의 종류에 따라 전혀 다른 결과를 만듭니다. 예를 들어 암을 진료하는 의료 애플리케이션을 생각해보겠습니다. 거짓 양성 예측은 환자에게 추가 진료를 요구하겠지만 거짓 음성 예측은 심각한 질병을 치료하지 못하게 만들 수 있습니다. 대부분의 분류 클래스는 불확실성을 추정할 수 있는 함수를 제공합니다. 아이리스 데이터셋 아이리스 데이터셋을 사용합니다. 세 개의 클래스를 가진 150개의 데이터 포인트로 이루어져 있습니다 (각 클래스당 50개). 4개의 입력 변수가 있습니다. (다중 클래스 분류) 입력 변수는 꽃잎의 길이, 꽃잎의 폭, 꽃받침.. 2019. 11. 15. 이전 1 다음