레플리
글 수 126

잡아라! 텍스트 마이닝 with 파이썬

조회 수 437 추천 수 0 2019.07.12 20:00:53


800.jpg

 

http://www.yes24.com/Product/Goods/72231434

 

< 목차 >

- 1. 텍스트 마이닝이란
- 2. 데이터 사전 처리를 위한 기초 파이썬 코딩
- 3. 텍스트 데이터
- 4. 텍스트 마이닝 기법
- 5. 텍스트 크롤링
- 6. 실전: 트위터 메시지 분석

- 7. 실전: 소셜커머스 후기 분석

 

 

 

알파고 이전 2010년대 초반에는 빅데이터가 가장 큰 화두였습니다. 동시에 실질적인 기술인 데이터 마이닝 역시 각광을 받았습니다. 그중 텍스트 마이닝은 자연어와 관련된 데이터에서 정보를 추출하는 것을 뜻합니다.

 

일반적으로 데이터 마이닝은 방대한 자료속에 숨겨진 의미를 정제하여 알기 쉽게 보여줍니다. 이를 통해 분석이나 의사결정에 활용하는 것이 주요한 목적입니다. 반면에 머신러닝과 딥러닝은 실제 서비스에 접목하는데 주안점을 둡니다. 그래서 빅데이터보다 다양한 곳에 쓰일 수 있다는 것이 장점입니다.

 

 

 

이전에도 텍스트 마이닝에 대한 책이 있었지만, R이나 자바로 되어 있었습니다. 파이썬을 기반으로 한 도서는 이번이 처음이 아닐까 합니다. 두께도 200 페이지 정도로 얇고 설명도 쉬운 편이라, 무난하게 읽을 수 있습니다.

 

앞부분은 정규표현식이나 형태소분석 같은 전처리 방법을 알려줍니다. 그다음 워드클라우드, 군집, 토픽모델링, 감정분석, 연관어분석 정도를 다루고 있습니다. 특히 실전 예제에서 크롤링부터 실제 분석까지 한 번에 보여주기 때문에 전체적인 과정을 이해하실 수 있습니다.

 

다만 구체적인 알고리즘이나 소스코드에 대한 설명이 너무 부실합니다. 주석마저 거의 없어서 프로그래밍에 대한 지식이 없다면 해석하기가 약간 어려울 수 있습니다. 그래도 자연어처리에 관심있는 분들은 재미있게 읽으실 듯 합니다.

List of Articles
제목 글쓴이 날짜 조회 수
잡아라! 텍스트 마이닝 with 파이썬 file 깊은바다 2019-07-12 437
채용담당자가 공개하는 AI면접 합격 기술 file 깊은바다 2019-07-08 461
AI 마인드 file 깊은바다 2019-07-07 493
자연어 텍스트 처리를 통한 검색 시스템 구축 file 깊은바다 2019-06-30 375
만화로 쉽게 배우는 선형대수 file 깊은바다 2019-06-29 453
21세기를 위한 21가지 제언 file 깊은바다 2019-06-23 136
수학의 아름다움 - 자연어처리 알고리즘 file 깊은바다 2019-06-04 520
로봇 설계자 신시아 브리질 file 깊은바다 2019-05-26 217
머신러닝 비즈니스 - 애저 머신러닝 스튜디오 file 깊은바다 2019-04-30 251
자연어 처리 쿡북 with 파이썬 file 깊은바다 2019-04-15 443
PyTorch를 활용한 강화학습/심층강화학습 실전 입문 file 깊은바다 2019-03-17 809
텐서플로와 머신러닝으로 시작하는 자연어 처리 file 깊은바다 2019-02-28 627
대학에 가는 AI VS 교과서를 못 읽는 아이들 file 깊은바다 2019-02-28 279
머신러닝 탐구생활 file 깊은바다 2019-01-31 401
수학 없이 배우는 데이터 과학과 알고리즘 file 깊은바다 2019-01-10 71259