레플리
글 수 285

네이버 영화 리뷰 감정 분석

조회 수 3293 추천 수 0 2018.09.07 14:46:51


http://hero4earth.com/blog/projects/2018/01/21/naver_movie_review/

 

 

 

네이버 영화 리뷰를 감정 분석하는 방법을 설명한 글입니다. TF-IDF로 단어를 처리하고 나이브 베이즈를 쓴 것과 워드 임베딩을 하고 여러가지 머신러닝 기법을 사용한 것을 보여주고 있습니다.

 

나름의 감동도 있고 배우들의 연기가 good -> 10 (POS)
이런걸 돈주고 본 내자신이 후회스럽다 -> 1(NEG)
종합 평점은 4점 드립니다 -> 4(NEU)

 

위와 같이 자연어로 된 감상평과 0~10점 사이의 점수로 된 데이터가 있습니다. 수치는 긍정, 부정, 중립의 3단계로 변환하여 학습을 하였습니다. 새로운 문장이 들어왔을때 그에 대한 감정을 판단하는 것이 목표입니다.

 

 

 

보통 word2vec으로 임베딩을 하고 입력으로 단어들의 집합을 넣는데, 여기서는 doc2vec을 통해 문장을 하나의 벡터로 변환하여 사용하였습니다. 그리고 CNN으로 되어있는 것은 fully connected만 사용한 것으로 보이니 참고하시기 바랍니다.

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
소설을 생성하는 NarrativeKoGPT2 file 깊은바다 2020-06-19 2199
주석을 프로그램으로 변환하는 GPT 모델 깊은바다 2020-06-21 481
KoGPT2를 파인튜닝하여 만든 챗봇 깊은바다 2020-06-23 3535
오픈소스 한국어 딥러닝 챗봇 - Kochat 깊은바다 2020-07-03 2503
GPT2에서 문장 생성 시 단어를 확률에 따라 선택하는 방법 깊은바다 2020-07-16 2210
GPT3로 하는 리액트 프로그래밍 file 깊은바다 2020-07-19 770
네이버 뉴스 댓글로 사전훈련한 구어체 모델 - KcBERT 깊은바다 2020-07-20 816
GPT3 튜링 테스트 깊은바다 2020-07-23 669
GPT3가 상식을 가지고 있을까 깊은바다 2020-07-24 742
KoGPT2, KoBERT, KoELECTRA로 만든 심리상담 챗봇 file 깊은바다 2020-08-05 6375
한국어로 대화하는 생성 모델의 학습을 위한 여정 - Transformer와 GPT2 깊은바다 2020-08-13 3566
그림으로 아주 쉽게 설명한, The Illustrated GPT-2 깊은바다 2020-08-15 2789
GPT-3의 다섯 가지 한계 깊은바다 2020-08-23 1054
GPT3 유료화 가격 공개 file 깊은바다 2020-09-04 1749
GPT-3 패러다임을 바꿀 미친 성능의 인공지능 등장 및 활용 사례 10가지 깊은바다 2020-09-14 799