[정보통신기술용어해설] |
Overfitting 과적합, 오버피팅 | (2024-10-21) |
1. 과적합 (Overfitting, 오버피팅) ㅇ 학습 데이터에만 지나치게 최적화되어, 새로운 데이터에 대한 일반화 성능이 저하되는 현상 ㅇ (원인) - 모델 복잡도 : 지나치게 깊은 신경망, 너무 많은 파라미터 등 - 불충분한 데이터 : 학습 데이터가 적거나, 데이터가 충분히 다양하지 않은 경우 - 노이즈 학습 : 학습 데이터에 포함된 오류나 노이즈 마저도 모델이 과도하게 학습 - 과도한 학습 횟수 : 학습을 너무 오래 진행하여 모델이 데이터에 과적합하는 등 ㅇ (해결 방법) - 정규화 (Regularization) : 모델 복잡도 억제를 위한 L1, L2 정규화 또는 드롭아웃 (Dropout) - 교차 검증 (Cross-validation) : 데이터를 여러 부분으로 나누어 검증 - 조기 종료 (Early Stopping) : 검증 데이터의 성능이 나빠지기 시작하면 학습 중단 - 충분한 데이터 확보, 단순한 모델 사용 등