머신러닝 - Classification 모델 평가 기준

글 수 35

조회 수 892 추천 수 0 2019.08.26 20:32:41

깊은바다 *.68.247.186 http://aidev.co.kr/8253

머신러닝의 평가 기준에 대해서 잘 설명한 글입니다. 모델을 평가할 때 보통 정확도(accuracy)를 많이 사용합니다. 데이터의 전체 개수에서 맞게 판단한 개수의 비율입니다. 예를 들어, 100개 중 99개가 일치한다면 99%의 정확도입니다.

하지만 데이터의 클래스가 한쪽으로 편중되어 있을 경우 문제가 발생합니다. 100개 중 1개가 암이고 99개가 정상인 데이터가 있습니다. 다음과 같은 2개의 모델이 있다고 생각해보겠습니다.

< 모델A >
- 99개 정상 데이터 : 모두 맞힘
- 1개 암 데이터 : 틀림
- 정확도 : 99%

< 모델B >
- 99개 정상 데이터 : 98개 맞힘/1개 틀림
- 1개 암 데이터 : 맞힘
- 정확도 : 99%

같은 99%의 정확도이지만 암 데이터를 맞힌 모델B가 더 뛰어나다고 볼 수 있습니다. 이렇게 정확도로 판단하기 어려운 상황이 많이 발생합니다. 그럴 경우 정밀도(precision)나 검출율(recall) 같은 다른 평가 방법을 적용하는 것이 좋습니다.

List of Articles

제목	글쓴이	날짜	조회 수
빅데이터에 대한 간략한 소개	깊은바다	2016-03-21	462
빅데이터를 이용한 맛집 추천 - 다이닝코드 [1]	깊은바다	2016-03-21	5728
추천 시스템에서 사용하는 협업 필터링 알고리즘	깊은바다	2016-03-21	2112
머신 러닝에 대한 소개 기사	깊은바다	2016-03-24	214
AiRS - 네이버 인공지능 기반 뉴스 추천 시스템	깊은바다	2017-02-28	377
결정 트리 학습 알고리즘 소개	깊은바다	2017-02-28	1410
경사 하강법 개요	깊은바다	2017-03-08	3376
쉽게 설명한 구글의 페이지 랭크 알고리즘	깊은바다	2017-03-09	1478
머신러닝 개념 이해 및 예제	깊은바다	2017-03-09	11885
이항 분류를 위한 로지스틱 회귀	깊은바다	2017-03-09	414
서포트 벡터 머신(SVM)에 대한 소개	깊은바다	2017-03-24	739
넷플릭스 맞춤 추천의 비법	깊은바다	2017-04-02	617
추천 시스템 분석 – 어떻게 아마존과 넷플릭스가 당신의 취향을 예상하는가?	깊은바다	2017-04-07	2502
학습과정과 데이터셋 이야기	깊은바다	2017-04-11	701
머신 러닝에 대한 시각적 입문 [2]	LegenDUST	2017-09-06	617

쓰기

첫 페이지 1 2 3 끝 페이지