레플리
글 수 126

머신러닝 탐구생활

조회 수 401 추천 수 0 2019.01.31 19:18:42


196097539.jpg

 

http://www.yes24.com/24/goods/63830327

 

< 목차 >

- 1. 파이썬과 머신러닝 그리고 캐글
- 2. 산탄데르 제품 추천 경진대회
- 3. 텐서플로 음성 인식 경진대회 
- 4. 포르토 세구로 안전 운전자 예측 경진대회 
- 5. 스테이트 팜 산만한 운전자 감지 경진대회

 

 

 

캐글(Kaggle)은 2010년 설립된 데이터 분석대회 플랫폼입니다. 기업들이 상금을 걸고 자사의 데이터셋과 문제를 공개하면, 많은 사람들이 여기에 참여하여 가장 정확도가 높은 모델을 경쟁합니다. 최근에는 구글에 인수되기도 했습니다.

 

실제로 캐글에 도전하는 것은 쉽지 않습니다. 이 책은 제품 추천, 음성인식, 보험갱신 예측, 사진으로 운전자 상태 감지 등 4가지 예제를 다루고 있습니다. 데이터 전처리, 피처 엔지니어링, 모델 구축, 학습 및 테스트 등 전체 파이프라인 과정을 보여줍니다. 또한 높은 순위를 차지한 모델의 소스코드도 함께 분석하여 어떤 기술들을 적용했는지 배울 수 있습니다.

 

 

 

다만 초보자가 보기에는 조금 무리가 있습니다. 보통 입문서는 MNIST 같이 load_data()만 하면 자동으로 훈련셋, 테스트셋이 나오는 예제만 다룹니다. 하지만 실제로는 전처리와 피처 엔지니어링이 가장 어렵습니다. 복잡한 코딩 능력이 필요해서 프로그래밍 스킬이 부족한 분들은 많은 어려움이 있습니다. 초등학교 때부터 20년 넘게 코딩을 했던 저도 눈으로만 책을 읽어서 그런지 모든 코드를 이해하지는 못했습니다.

 

머신러닝의 프로세스를 바닥부터 깊게 경험하고 싶으신 분들에게는 적극 추천드립니다. 캐글에 있는 문제들을 자신만의 모델로 도전해보는 것이 실력을 키우는데 가장 좋은 방법이라고 생각합니다.

List of Articles
제목 글쓴이 날짜 조회 수sort
수학 없이 배우는 데이터 과학과 알고리즘 file 깊은바다 2019-01-10 71305
밑바닥부터 시작하는 딥러닝 file [3] 깊은바다 2018-05-01 1308
인공지능을 만드는 법 - 게임 AI file [2] 깊은바다 2017-12-03 1000
머신러닝 실무 프로젝트 file 깊은바다 2019-10-18 919
처음 배우는 데이터 과학 file 깊은바다 2018-07-02 919
PyTorch를 활용한 강화학습/심층강화학습 실전 입문 file 깊은바다 2019-03-17 816
매출 올리는 데이터 사이언티스트 file Dfinite 2022-07-31 802
인공지능을 위한 수학 file 깊은바다 2019-07-29 769
집단지성 프로그래밍 file 깊은바다 2017-08-29 685
파이썬과 자연어처리 file 깊은바다 2018-01-03 650
EBS 수학과 함께하는 AI 기초 file 깊은바다 2020-09-15 644
텐서플로와 머신러닝으로 시작하는 자연어 처리 file 깊은바다 2019-02-28 627
AI 메이커스, 인공지능 전쟁의 최전선 file 깊은바다 2022-06-04 604
처음 배우는 딥러닝 수학 file 깊은바다 2018-09-25 603
파이썬과 케라스를 이용한 딥러닝/강화학습 주식투자 file 깊은바다 2018-07-13 593