레플리
글 수 35


 

 

 

결정 트리(Decision Tree)는 대표적인 머신러닝 기법입니다. 각 특징을 조건으로 구분하여 트리 모양으로 분기 후 정답을 맞춥니다. 트리를 만들기 위해서는 정보 획득(Information Gain)을 계산해야 합니다. 어떤 특징을 어느 부분에서 구분해야 데이터가 가장 잘 나누어지는지 판단합니다. 정보 획득 방법에는 엔트로피나 지니 계수가 대표적입니다.

 

이런 트리 하나만으로는 정확도가 그리 높지 않습니다. 그래서 여러 개의 트리를 조합하는 앙상블을 적용합니다. 앙상블 방식은 크게 배깅(Bagging)과 부스팅(Boosting)이 있습니다. 배깅은 여러개의 분류기를 만들고 그 결과를 취합하여(가방에 모아서) 가장 높은 항목을 선택합니다. 부스팅은 하나의 트리를 가지고 지속적으로 성능을 높이는(부스팅) 방법입니다.

 

보통 결정 트리를 기반으로 앙상블을 많이 하는 편입니다. 배깅은 랜덤 포레스트(Random Forest), 부스팅은 그래디언트 부스팅(Gradient Boosting)이 유명합니다. 캐글에서 많이 쓰이는 XGBoost는 그래디언트 부스팅의 단점을 보완한 모델입니다.

 

 

 

< 의사결정나무(Decision Tree) >
https://ratsgo.github.io/machine%20learning/2017/03/26/tree/

 

< Random Forest >
https://dailyheumsi.tistory.com/114

 

< 그래디언트 부스트(Gradient Boost) >
https://bkshin.tistory.com/…/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB…

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
머신 러닝에 대한 소개 기사 깊은바다 2016-03-24 214
넘파이와 데이터 표현 - A Visual Intro to NumPy and Data Representation 깊은바다 2019-07-11 345
AiRS - 네이버 인공지능 기반 뉴스 추천 시스템 깊은바다 2017-02-28 377
이항 분류를 위한 로지스틱 회귀 file 깊은바다 2017-03-09 414
어떻게 하면 데이터 사이언티스트가 될 수 있나요? 깊은바다 2017-09-12 419
빅데이터에 대한 간략한 소개 file 깊은바다 2016-03-21 462
teachable machine file [1] LegenDUST 2017-10-14 551
머신러닝의 역사 깊은바다 2019-08-10 553
빅데이터, 더 나은 데이터 깊은바다 2018-06-27 576
넷플릭스 맞춤 추천의 비법 file 깊은바다 2017-04-02 617
머신 러닝에 대한 시각적 입문 [2] LegenDUST 2017-09-06 617
유튜브의 완벽한 피드 깊은바다 2018-06-24 684
학습과정과 데이터셋 이야기 깊은바다 2017-04-11 701
고성능 컴퓨팅 자원 이용자 모집 file encase 2022-05-31 733
서포트 벡터 머신(SVM)에 대한 소개 file 깊은바다 2017-03-24 739