머신러닝 - Classification 모델 평가 기준

글 수 34

조회 수 1082 추천 수 0 2019.08.26 20:32:41

깊은바다 *.68.247.186 http://aidev.co.kr/8253

머신러닝의 평가 기준에 대해서 잘 설명한 글입니다. 모델을 평가할 때 보통 정확도(accuracy)를 많이 사용합니다. 데이터의 전체 개수에서 맞게 판단한 개수의 비율입니다. 예를 들어, 100개 중 99개가 일치한다면 99%의 정확도입니다.

하지만 데이터의 클래스가 한쪽으로 편중되어 있을 경우 문제가 발생합니다. 100개 중 1개가 암이고 99개가 정상인 데이터가 있습니다. 다음과 같은 2개의 모델이 있다고 생각해보겠습니다.

< 모델A >
- 99개 정상 데이터 : 모두 맞힘
- 1개 암 데이터 : 틀림
- 정확도 : 99%

< 모델B >
- 99개 정상 데이터 : 98개 맞힘/1개 틀림
- 1개 암 데이터 : 맞힘
- 정확도 : 99%

같은 99%의 정확도이지만 암 데이터를 맞힌 모델B가 더 뛰어나다고 볼 수 있습니다. 이렇게 정확도로 판단하기 어려운 상황이 많이 발생합니다. 그럴 경우 정밀도(precision)나 검출율(recall) 같은 다른 평가 방법을 적용하는 것이 좋습니다.

List of Articles

제목	글쓴이	날짜	조회 수
똑똑한 인공지능 뒤에 진땀나는 노동 있더라 - 데이터 레이블링	깊은바다	2021-02-08	996
결정 트리, 랜덤 포레스트, 그래디언트 부스팅 설명	깊은바다	2020-10-20	1942
유튜브와 넷플릭스의 추천 알고리즘	깊은바다	2020-05-08	1207
구글 Teachable Machine 머신러닝 무료 서비스 공개	깊은바다	2019-11-22	1534
Classification 모델 평가 기준 - Accuracy / Precision / Recall	깊은바다	2019-08-26	1082
머신러닝의 역사	깊은바다	2019-08-10	739
넘파이와 데이터 표현 - A Visual Intro to NumPy and Data Representation	깊은바다	2019-07-11	528
머신러닝으로 IDE 자동완성을 추천하는 인공지능 - Kite	깊은바다	2019-01-30	1157
머신러닝 경진대회 - 카카오 아레나	깊은바다	2018-11-07	158014
빅데이터, 더 나은 데이터	깊은바다	2018-06-27	763
유튜브의 완벽한 피드	깊은바다	2018-06-24	872
선형회귀분석을 통한 머신러닝의 기본 개념 이해	깊은바다	2018-06-14	2896
영화 추천 파이썬 예제 [1]	깊은바다	2018-03-16	6694
머신러닝 용어집 by Google [1]	LegenDUST	2018-03-16	8183
구글 머신러닝 단기집중과정 [2]	깊은바다	2018-03-01	1534

쓰기

첫 페이지 1 2 3 끝 페이지