본문 바로가기
정보관리기술사/인공지능

오버피팅과 언더피팅 - "오분언편"

by 두음달인 2022. 10. 31.
반응형

 

토픽 개념에 대해 서술할 때 

핵심 키워드들이 들어가야 고득점이 가능한데,

오버피팅과 언더피팅 관련한 핵심 키워드들에 분산(Variance)와 편차(Bias)가 있습니다.

 

어떤 관계가 있을까요?

 

오버피팅은 분산이 높고 언더피팅은 편차가 높다고 보시면 됩니다.

 

개념을 다시한번 살펴보면

 

오버피팅

 

Training Set에 편중되어 Training Set에서의 오차는 작게 나타나지만,
실제 Test Set에서는 오차가 커지는 과적합 현상

 

언더피팅

 

데이터 수집 시 단편화된 방법으로 인한 학습으로 적정 수준의 학습이 부족하여
실제 성능이 떨어지는 현상

 

예전에 올렸던 개념도를 살펴보면 쉽게 이해가 되실겁니다.

 

 

언더피팅은 단편화된 데이터만 갖고 진행하는 것이어서 편향이 높은 반면

오버피팅은 테스트용 데이터에 너무 집착하는 경향으로 분산이 높습니다.

 

오버피팅, 언더피팅 관련 문제 풀이 시

3단락에 아래와 같은 분산,편향, 오버피팅과 언더피팅의 Tradeoff 관련 내용을 기술하시면

정말 ~ 좋습니다.

 

간략히 작성할 수 있고, 핵심을 파고드는 국민형 그림으로

이런 도식화를 할 수 있도록 꾸준히 연습 하시길 권고드립니다.

 

오버피팅과 언더피팅의 트레이드 오프 개념도

 

 

감사합니다.

반응형

댓글