레플리
글 수 283

네이버 영화 리뷰 감정 분석

조회 수 3292 추천 수 0 2018.09.07 14:46:51


http://hero4earth.com/blog/projects/2018/01/21/naver_movie_review/

 

 

 

네이버 영화 리뷰를 감정 분석하는 방법을 설명한 글입니다. TF-IDF로 단어를 처리하고 나이브 베이즈를 쓴 것과 워드 임베딩을 하고 여러가지 머신러닝 기법을 사용한 것을 보여주고 있습니다.

 

나름의 감동도 있고 배우들의 연기가 good -> 10 (POS)
이런걸 돈주고 본 내자신이 후회스럽다 -> 1(NEG)
종합 평점은 4점 드립니다 -> 4(NEU)

 

위와 같이 자연어로 된 감상평과 0~10점 사이의 점수로 된 데이터가 있습니다. 수치는 긍정, 부정, 중립의 3단계로 변환하여 학습을 하였습니다. 새로운 문장이 들어왔을때 그에 대한 감정을 판단하는 것이 목표입니다.

 

 

 

보통 word2vec으로 임베딩을 하고 입력으로 단어들의 집합을 넣는데, 여기서는 doc2vec을 통해 문장을 하나의 벡터로 변환하여 사용하였습니다. 그리고 CNN으로 되어있는 것은 fully connected만 사용한 것으로 보이니 참고하시기 바랍니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
딥러닝을 이용한 자연어 처리 입문 - 위키독스 깊은바다 2018-09-21 1108
다이나믹 메모리 네트워크 정리 file 깊은바다 2018-09-29 1135
WizardLM의 Evol-instruct로 직접 한글 데이터셋을 만든 모델 file 깊은바다 2023-06-19 1141
딥러닝 질의응답 시스템인 cdQA-suite 깊은바다 2020-03-08 1144
유저 피드백을 받아 지속적으로 학습을 하는 챗봇 - BlenderBot 3 file 깊은바다 2022-08-06 1154
커뮤니케이션과 AI - Multi-channel CNN을 이용한 한국어 감성분석 깊은바다 2018-11-22 1156
퓨샷(few-shot) 러닝에 최적화된 GPT3 모델 file 깊은바다 2020-05-30 1156
LLM의 새로운 기법 - Merge와 DPO file 깊은바다 2024-01-02 1160
쉽게 씌어진 Word2Vec [2] 깊은바다 2017-12-25 1178
딥러닝 기반 자연어 언어모델 BERT - Colab 실습 코드 포함 file 깊은바다 2019-09-02 1179
최신 자연어처리 모델 소개 file 깊은바다 2022-07-11 1180
스캐터랩의 오픈도메인 챗봇 루다 육아일기 - 모델의 구조 및 동작방식 file 깊은바다 2020-12-30 1191
메타, GPT-3와 동급인 175B의 초거대모델 무료 공개 깊은바다 2022-05-04 1191
Word2Vec 테스트 사이트 file 깊은바다 2019-01-13 1197
LLM 챗봇의 특징 2가지 - RAG와 Function 깊은바다 2023-07-06 1210