레플리
글 수 35


 

 

 

결정 트리(Decision Tree)는 대표적인 머신러닝 기법입니다. 각 특징을 조건으로 구분하여 트리 모양으로 분기 후 정답을 맞춥니다. 트리를 만들기 위해서는 정보 획득(Information Gain)을 계산해야 합니다. 어떤 특징을 어느 부분에서 구분해야 데이터가 가장 잘 나누어지는지 판단합니다. 정보 획득 방법에는 엔트로피나 지니 계수가 대표적입니다.

 

이런 트리 하나만으로는 정확도가 그리 높지 않습니다. 그래서 여러 개의 트리를 조합하는 앙상블을 적용합니다. 앙상블 방식은 크게 배깅(Bagging)과 부스팅(Boosting)이 있습니다. 배깅은 여러개의 분류기를 만들고 그 결과를 취합하여(가방에 모아서) 가장 높은 항목을 선택합니다. 부스팅은 하나의 트리를 가지고 지속적으로 성능을 높이는(부스팅) 방법입니다.

 

보통 결정 트리를 기반으로 앙상블을 많이 하는 편입니다. 배깅은 랜덤 포레스트(Random Forest), 부스팅은 그래디언트 부스팅(Gradient Boosting)이 유명합니다. 캐글에서 많이 쓰이는 XGBoost는 그래디언트 부스팅의 단점을 보완한 모델입니다.

 

 

 

< 의사결정나무(Decision Tree) >
https://ratsgo.github.io/machine%20learning/2017/03/26/tree/

 

< Random Forest >
https://dailyheumsi.tistory.com/114

 

< 그래디언트 부스트(Gradient Boost) >
https://bkshin.tistory.com/…/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB…

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
고성능 컴퓨팅 자원 이용자 모집 file encase 2022-05-31 730
똑똑한 인공지능 뒤에 진땀나는 노동 있더라 - 데이터 레이블링 깊은바다 2021-02-08 784
결정 트리, 랜덤 포레스트, 그래디언트 부스팅 설명 깊은바다 2020-10-20 1628
유튜브와 넷플릭스의 추천 알고리즘 깊은바다 2020-05-08 993
구글 Teachable Machine 머신러닝 무료 서비스 공개 깊은바다 2019-11-22 1340
Classification 모델 평가 기준 - Accuracy / Precision / Recall 깊은바다 2019-08-26 892
머신러닝의 역사 깊은바다 2019-08-10 553
넘파이와 데이터 표현 - A Visual Intro to NumPy and Data Representation 깊은바다 2019-07-11 345
머신러닝으로 IDE 자동완성을 추천하는 인공지능 - Kite 깊은바다 2019-01-30 968
머신러닝 경진대회 - 카카오 아레나 깊은바다 2018-11-07 156444
빅데이터, 더 나은 데이터 깊은바다 2018-06-27 576
유튜브의 완벽한 피드 깊은바다 2018-06-24 684
선형회귀분석을 통한 머신러닝의 기본 개념 이해 깊은바다 2018-06-14 2646
영화 추천 파이썬 예제 [1] 깊은바다 2018-03-16 6474
머신러닝 용어집 by Google [1] LegenDUST 2018-03-16 7924