글 수 108

머신러닝 탐구생활

조회 수 265 추천 수 0 2019.01.31 19:18:42


196097539.jpg

 

http://www.yes24.com/24/goods/63830327

 

< 목차 >

- 1. 파이썬과 머신러닝 그리고 캐글
- 2. 산탄데르 제품 추천 경진대회
- 3. 텐서플로 음성 인식 경진대회 
- 4. 포르토 세구로 안전 운전자 예측 경진대회 
- 5. 스테이트 팜 산만한 운전자 감지 경진대회

 

 

 

캐글(Kaggle)은 2010년 설립된 데이터 분석대회 플랫폼입니다. 기업들이 상금을 걸고 자사의 데이터셋과 문제를 공개하면, 많은 사람들이 여기에 참여하여 가장 정확도가 높은 모델을 경쟁합니다. 최근에는 구글에 인수되기도 했습니다.

 

실제로 캐글에 도전하는 것은 쉽지 않습니다. 이 책은 제품 추천, 음성인식, 보험갱신 예측, 사진으로 운전자 상태 감지 등 4가지 예제를 다루고 있습니다. 데이터 전처리, 피처 엔지니어링, 모델 구축, 학습 및 테스트 등 전체 파이프라인 과정을 보여줍니다. 또한 높은 순위를 차지한 모델의 소스코드도 함께 분석하여 어떤 기술들을 적용했는지 배울 수 있습니다.

 

 

 

다만 초보자가 보기에는 조금 무리가 있습니다. 보통 입문서는 MNIST 같이 load_data()만 하면 자동으로 훈련셋, 테스트셋이 나오는 예제만 다룹니다. 하지만 실제로는 전처리와 피처 엔지니어링이 가장 어렵습니다. 복잡한 코딩 능력이 필요해서 프로그래밍 스킬이 부족한 분들은 많은 어려움이 있습니다. 초등학교 때부터 20년 넘게 코딩을 했던 저도 눈으로만 책을 읽어서 그런지 모든 코드를 이해하지는 못했습니다.

 

머신러닝의 프로세스를 바닥부터 깊게 경험하고 싶으신 분들에게는 적극 추천드립니다. 캐글에 있는 문제들을 자신만의 모델로 도전해보는 것이 실력을 키우는데 가장 좋은 방법이라고 생각합니다.

List of Articles
제목 글쓴이 날짜 조회 수
자연어 텍스트 처리를 통한 검색 시스템 구축 file 깊은바다 2019-06-30 197
만화로 쉽게 배우는 선형대수 file 깊은바다 2019-06-29 199
21세기를 위한 21가지 제언 file 깊은바다 2019-06-23 83
수학의 아름다움 - 자연어처리 알고리즘 file 깊은바다 2019-06-04 259
로봇 설계자 신시아 브리질 file 깊은바다 2019-05-26 116
머신러닝 비즈니스 - 애저 머신러닝 스튜디오 file 깊은바다 2019-04-30 144
자연어 처리 쿡북 with 파이썬 file 깊은바다 2019-04-15 276
PyTorch를 활용한 강화학습/심층강화학습 실전 입문 file 깊은바다 2019-03-17 316
텐서플로와 머신러닝으로 시작하는 자연어 처리 file 깊은바다 2019-02-28 413
대학에 가는 AI VS 교과서를 못 읽는 아이들 file 깊은바다 2019-02-28 198
머신러닝 탐구생활 file 깊은바다 2019-01-31 265
수학 없이 배우는 데이터 과학과 알고리즘 file 깊은바다 2019-01-10 222
가장 빨리 만나는 챗봇 프로그래밍 with Bot Framework file 깊은바다 2018-12-24 219
케라스 창시자에게 배우는 딥러닝 file 깊은바다 2018-11-25 292
핸즈온 머신러닝 file 깊은바다 2018-11-08 382