레플리
글 수 35


BZywyNkfMed3I83mkbGGZVVMsb4.png

 

https://brunch.co.kr/@chris-song/54

 

 

 

머신러닝의 평가 기준에 대해서 잘 설명한 글입니다. 모델을 평가할 때 보통 정확도(accuracy)를 많이 사용합니다. 데이터의 전체 개수에서 맞게 판단한 개수의 비율입니다. 예를 들어, 100개 중 99개가 일치한다면 99%의 정확도입니다.

 

하지만 데이터의 클래스가 한쪽으로 편중되어 있을 경우 문제가 발생합니다. 100개 중 1개가 암이고 99개가 정상인 데이터가 있습니다. 다음과 같은 2개의 모델이 있다고 생각해보겠습니다.

 

< 모델A >
- 99개 정상 데이터 : 모두 맞힘
- 1개 암 데이터 : 틀림
- 정확도 : 99%

 

< 모델B > 
- 99개 정상 데이터 : 98개 맞힘/1개 틀림
- 1개 암 데이터 : 맞힘 
- 정확도 : 99%

 

 

 

같은 99%의 정확도이지만 암 데이터를 맞힌 모델B가 더 뛰어나다고 볼 수 있습니다. 이렇게 정확도로 판단하기 어려운 상황이 많이 발생합니다. 그럴 경우 정밀도(precision)나 검출율(recall) 같은 다른 평가 방법을 적용하는 것이 좋습니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
머신러닝으로 IDE 자동완성을 추천하는 인공지능 - Kite 깊은바다 2019-01-30 971
머신러닝에 대한 간단한 설명 깊은바다 2017-09-16 932
Classification 모델 평가 기준 - Accuracy / Precision / Recall 깊은바다 2019-08-26 892
우버 엔지니어가 알려주는 머신러닝 이야기 깊은바다 2017-10-11 821
똑똑한 인공지능 뒤에 진땀나는 노동 있더라 - 데이터 레이블링 깊은바다 2021-02-08 784
서포트 벡터 머신(SVM)에 대한 소개 file 깊은바다 2017-03-24 739
고성능 컴퓨팅 자원 이용자 모집 file encase 2022-05-31 733
학습과정과 데이터셋 이야기 깊은바다 2017-04-11 701
유튜브의 완벽한 피드 깊은바다 2018-06-24 684
머신 러닝에 대한 시각적 입문 [2] LegenDUST 2017-09-06 617
넷플릭스 맞춤 추천의 비법 file 깊은바다 2017-04-02 617
빅데이터, 더 나은 데이터 깊은바다 2018-06-27 576
머신러닝의 역사 깊은바다 2019-08-10 553
teachable machine file [1] LegenDUST 2017-10-14 551
빅데이터에 대한 간략한 소개 file 깊은바다 2016-03-21 462