- AI Dev - 인공지능 개발자 모임
- 정보공유
- 챗봇 딥러닝
글 수 293
http://hero4earth.com/blog/projects/2018/01/21/naver_movie_review/
네이버 영화 리뷰를 감정 분석하는 방법을 설명한 글입니다. TF-IDF로 단어를 처리하고 나이브 베이즈를 쓴 것과 워드 임베딩을 하고 여러가지 머신러닝 기법을 사용한 것을 보여주고 있습니다.
나름의 감동도 있고 배우들의 연기가 good -> 10 (POS)
이런걸 돈주고 본 내자신이 후회스럽다 -> 1(NEG)
종합 평점은 4점 드립니다 -> 4(NEU)
위와 같이 자연어로 된 감상평과 0~10점 사이의 점수로 된 데이터가 있습니다. 수치는 긍정, 부정, 중립의 3단계로 변환하여 학습을 하였습니다. 새로운 문장이 들어왔을때 그에 대한 감정을 판단하는 것이 목표입니다.
보통 word2vec으로 임베딩을 하고 입력으로 단어들의 집합을 넣는데, 여기서는 doc2vec을 통해 문장을 하나의 벡터로 변환하여 사용하였습니다. 그리고 CNN으로 되어있는 것은 fully connected만 사용한 것으로 보이니 참고하시기 바랍니다.