레플리
글 수 126

생활 속 문제를 통해 배워보는 머신 러닝

조회 수 230 추천 수 0 2018.06.09 17:58:59


x9791161750859_1.jpg

 

http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9791161750859&orderClick=LEA&Kc=#N

 

< 목차 >

- 1. 파이썬 머신 러닝 에코시스템 
- 2. 저렴한 아파트 찾기 앱 구축하기 
- 3. 저렴한 항공료 찾기 앱구축하기 
- 4. 로지스틱 회귀를 이용해 IPO 시장 예측하기 
- 5. 맞춤형 뉴스피드 만들기 
- 6. 콘텐츠 입소문 예측하기 
- 7. 머신 러닝으로 주식 시장 예측하기 
- 8. 이미지 유사도 엔진 구축하기 
- 9. 챗봇 구축하기 
- 10. 추천 엔진 구축하기 
 

 

 

여러 가지 실제 문제들을 머신러닝을 통해 구현하는 방법을 알려주고 있습니다. 보통 다른 책들에서는 이미 만들어진 데이터셋을 가지고 학습을 수행하는게 대부분입니다.

 

하지만 여기서는 실제 웹에서 크롤링을 한 다음 빠져있는 항목을 수정하고 문자열에서 필요한 정보만 추출하는 등 데이터를 정제하는 것부터 자세히 다루고 있습니다. 또한 실제 서비스로 연결하는 방법까지 보여주기 때문에 머신러닝을 어떻게 활용할지 이해하는데 큰 도움이 됩니다.

 

 

 

예를 들어, 개인화된 뉴스피드 만들기를 보면 뉴스 사이트에서 내가 선택한 기사들을 모아서 다운로드한 후 필요한 항목만 뽑아서 테이블을 생성합니다. 그리고 TD-IDF로 단어를 벡터화하고 SVM으로 내가 좋아하는 기사인지 학습을 합니다.

 

그 다음 뉴스 사이트 RSS를 받아 구글 드라이브 문서에 자동으로 저장을 하도록 합니다. 마지막으로 일정 시간마다 뉴스를 가져와 학습한 모델로 분류한 다음 이메일로 추천 기사를 보내는 것까지 보여줍니다.

 

챗봇을 구현하는 부분도 재미있었습니다. 유명한 챗봇인 Cleverbot의 대화를 모아놓은 사이트에서 대화 로그를 크롤링 합니다. 그리고 역시 TD-IDF로 단어를 벡터로 변경하고 코사인 유사도를 사용해서 유저의 입력과 가장 비슷한 문장을 찾아 거기에 맞는 답변을 출력합니다.

 

 

 

이 책의 단점이라면 이론적인 설명이 부족하다는 것입니다. 하지만 어자피 초보자를 목표로 한 것이 아니라 머신러닝을 어떻게 적용할 수 있을지에 초점을 맞춘 것이라 크게 문제가 되지는 않을 것 같습니다.

List of Articles
제목 글쓴이 날짜 조회 수sort
수학 없이 배우는 데이터 과학과 알고리즘 file 깊은바다 2019-01-10 71286
밑바닥부터 시작하는 딥러닝 file [3] 깊은바다 2018-05-01 1308
인공지능을 만드는 법 - 게임 AI file [2] 깊은바다 2017-12-03 1000
머신러닝 실무 프로젝트 file 깊은바다 2019-10-18 919
처음 배우는 데이터 과학 file 깊은바다 2018-07-02 919
PyTorch를 활용한 강화학습/심층강화학습 실전 입문 file 깊은바다 2019-03-17 811
매출 올리는 데이터 사이언티스트 file Dfinite 2022-07-31 801
인공지능을 위한 수학 file 깊은바다 2019-07-29 768
집단지성 프로그래밍 file 깊은바다 2017-08-29 685
파이썬과 자연어처리 file 깊은바다 2018-01-03 650
EBS 수학과 함께하는 AI 기초 file 깊은바다 2020-09-15 643
텐서플로와 머신러닝으로 시작하는 자연어 처리 file 깊은바다 2019-02-28 627
처음 배우는 딥러닝 수학 file 깊은바다 2018-09-25 603
AI 메이커스, 인공지능 전쟁의 최전선 file 깊은바다 2022-06-04 601
파이썬과 케라스를 이용한 딥러닝/강화학습 주식투자 file 깊은바다 2018-07-13 593