레플리
글 수 35


 

 

 

결정 트리(Decision Tree)는 대표적인 머신러닝 기법입니다. 각 특징을 조건으로 구분하여 트리 모양으로 분기 후 정답을 맞춥니다. 트리를 만들기 위해서는 정보 획득(Information Gain)을 계산해야 합니다. 어떤 특징을 어느 부분에서 구분해야 데이터가 가장 잘 나누어지는지 판단합니다. 정보 획득 방법에는 엔트로피나 지니 계수가 대표적입니다.

 

이런 트리 하나만으로는 정확도가 그리 높지 않습니다. 그래서 여러 개의 트리를 조합하는 앙상블을 적용합니다. 앙상블 방식은 크게 배깅(Bagging)과 부스팅(Boosting)이 있습니다. 배깅은 여러개의 분류기를 만들고 그 결과를 취합하여(가방에 모아서) 가장 높은 항목을 선택합니다. 부스팅은 하나의 트리를 가지고 지속적으로 성능을 높이는(부스팅) 방법입니다.

 

보통 결정 트리를 기반으로 앙상블을 많이 하는 편입니다. 배깅은 랜덤 포레스트(Random Forest), 부스팅은 그래디언트 부스팅(Gradient Boosting)이 유명합니다. 캐글에서 많이 쓰이는 XGBoost는 그래디언트 부스팅의 단점을 보완한 모델입니다.

 

 

 

< 의사결정나무(Decision Tree) >
https://ratsgo.github.io/machine%20learning/2017/03/26/tree/

 

< Random Forest >
https://dailyheumsi.tistory.com/114

 

< 그래디언트 부스트(Gradient Boost) >
https://bkshin.tistory.com/…/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB…

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
빅데이터에 대한 간략한 소개 file 깊은바다 2016-03-21 462
빅데이터를 이용한 맛집 추천 - 다이닝코드 [1] 깊은바다 2016-03-21 5729
추천 시스템에서 사용하는 협업 필터링 알고리즘 file 깊은바다 2016-03-21 2112
머신 러닝에 대한 소개 기사 깊은바다 2016-03-24 214
AiRS - 네이버 인공지능 기반 뉴스 추천 시스템 깊은바다 2017-02-28 377
결정 트리 학습 알고리즘 소개 file 깊은바다 2017-02-28 1410
경사 하강법 개요 file 깊은바다 2017-03-08 3377
쉽게 설명한 구글의 페이지 랭크 알고리즘 file 깊은바다 2017-03-09 1479
머신러닝 개념 이해 및 예제 file 깊은바다 2017-03-09 11886
이항 분류를 위한 로지스틱 회귀 file 깊은바다 2017-03-09 414
서포트 벡터 머신(SVM)에 대한 소개 file 깊은바다 2017-03-24 739
넷플릭스 맞춤 추천의 비법 file 깊은바다 2017-04-02 617
추천 시스템 분석 – 어떻게 아마존과 넷플릭스가 당신의 취향을 예상하는가? 깊은바다 2017-04-07 2503
학습과정과 데이터셋 이야기 깊은바다 2017-04-11 701
머신 러닝에 대한 시각적 입문 [2] LegenDUST 2017-09-06 617