Article 2. 분석 모형 진단 4112
Section 1. 분석 모형 평가
Paragraph 1. 데이터 분석 모형의 오류
데이터 분석 모형 구축 시 발생할 수 있는 오류에는 일반화 오류와 학습 오류가 있다.
구분 | 설명 |
---|---|
일반화 오류 (Generalization Error) |
• 분석 모형을 만들 때 주어진 데이터 집합의 특성을 지나치게 반영하여 발생하는 오류 • 주어진 데이터 집합은 모집단 일부분임에도 불구하고 그것이 가지고 있는 주변적인 특성, 단순 잡음 등을 모두 묘사하기 때문에 일반화 오류가 발생 • 과대 적합(Over-fitting) 되었다고 함 |
학습 오류 (Training Error) |
• 주어진 데이터 집합에 부차적인 특성과 잡음이 있다는 점을 고려하여 그것의 특성을 덜 반영하도록 분석 모형을 만들어 생기는 오류 • 학습 오류가 지나치게 자주 발생하는 모형은 과대 적합에 반대되는 개념으로 과소 적합(Under-fitting) 되었다고 함 |