데이터 나누기 & 정확도
데이터 학습 데이터와 평가 데이터로 나누기 전체 데이터의 2/3로 모델을 학습시키고, 나머지 1/3로 모델의 성능을 평가한다. def split_data(data, prob): """데이터를 [prob, 1 - prob] 비율로 나눔""" results = [], [] for row in data: results[0 if random.random() < prob else 1].append(row) return results 대부분의 경우 입력 변수로 행렬 x, 출력 변수로 벡터 y, 학습 데이터와 평가 데이터에 x와 y가 제대로 쌍을 이뤄야한다. def train_test_split(x, y, test_pct): data = list(zip(x, y)) # 데이터 포인트 하나에 해당하는 값들 train,..
2019. 8. 27.