4.6 요약

주어진 문제와 훈련할 데이터를 정의합니다. 이 데이터를 수집하고 필요하면 레이블을 태깅합니다.
성공을 어떻게 측정할지 선택하세요. 검증 데이터에서 모니터링할 지표는 무엇인가요?
평가 방법을 결정하세요. 홀드아웃 검증이나 K-겹 교차 검증인가요? 검증에 사용해야 할 데이터의 양은 얼마나 되나요?
단순한 랜덤 선택 모델보다 나은 통계적 검정력이 있는 첫 번째 모델을 만듭니다.
과대적합된 모델을 만듭니다.
검증 데이터의 성능에 기초하여 모델에 규제를 적용하고 하이퍼파라미터를 튜닝합니다. 머신 러닝 연구의 대부분은 이 단계에 집중됩니다. 하지만 큰 그림을 놓치지 마세요.