레플리
글 수 126

한국어 임베딩

조회 수 583 추천 수 0 2019.12.11 21:05:41


800.jpg

 

http://www.yes24.com/Product/Goods/78569687

 

< 목차 >

- 1. 서론
- 2. 벡터가 어떻게 의미를 가지게 되는가
- 3. 한국어 전처리
- 4. 단어 수준 임베딩
- 5. 문장 수준 임베딩
- 6. 임베딩 파인 튜닝
 

 

 

자연어처리 블로그(ratsgo.github.io)로 유명한 이기창님의 책입니다. 딥러닝에서 텍스트 기반 모델의 가장 큰 차이점은 바로 임베딩입니다. 문장을 신경망이 이해하는 벡터로 변환하여 끼워 넣는(embed) 역할을 합니다.

 

이 책에서는 크게 다음과 같은 부분으로 구성되어 있습니다. 첫째, Word2Vec, FastText, GloVe 같은 단어수준 임베딩. 둘째, Doc2Vec, ELMo, BERT 같은 문장수준 임베딩. 셋째, 사전훈련 모델을 사용하여 다른 문제에 파인튜닝하는 방법.

 

우선 이전 도서들과 달리 최신 모델들을 보여준다는 점에서 상당히 좋았습니다. 저자가 국문학과 출신이라 그런지 문장도 깔끔하고 읽기가 편했습니다. 하지만 일반적인 개념을 다룬 앞부분에 비해, 뒤로 갈수록 설명이 조금 부족한 편입니다.

 

예를 들어, <밑바닥부터 시작하는 딥러닝2>에서는 Word2Vec만 77페이지입니다. 반면에 여기서는 10페이지에 불과합니다. 물론 많은 주제를 다루기 때문에 어쩔 수 없다고 생각합니다. 다만 초보자가 처음 접하기엔 어렵다고 봅니다. 딥러닝 자연어처리에 익숙한 분들이 이론적으로 정리하기에 좋을 듯 합니다.

List of Articles
제목 글쓴이 날짜 조회 수sort
한국어 임베딩 file 깊은바다 2019-12-11 583
파이썬을 이용한 머신러닝, 딥러닝 실전 앱 개발 file [2] 깊은바다 2019-08-12 577
텍스트 마이닝 file 깊은바다 2018-03-20 549
텐서플로로 시작하는 딥러닝 file 깊은바다 2017-09-19 546
핸즈온 머신러닝 file 깊은바다 2018-11-08 536
자연어 처리와 컴퓨터 언어학 file 깊은바다 2019-12-30 534
기초부터 시작하는 강화학습/신경망 알고리즘 file 깊은바다 2020-10-18 533
수학의 아름다움 - 자연어처리 알고리즘 file 깊은바다 2019-06-04 520
누구나 쉽게 배우는 챗봇 서비스 file [1] 깊은바다 2018-07-10 509
밑바닥부터 시작하는 딥러닝 2 file [2] 깊은바다 2019-09-07 499
골빈해커의 3분 딥러닝 텐서플로맛 file [6] 깊은바다 2018-02-02 496
AI 마인드 file 깊은바다 2019-07-07 495
파이썬을 이용한 머신러닝, 딥러닝 실전 개발 입문 file 깊은바다 2018-04-22 483
파이썬 자연어 처리의 이론과 실제 file 깊은바다 2018-10-09 479
케라스로 구현하는 딥러닝과 강화학습 file [3] 깊은바다 2018-03-29 478