레플리
글 수 282

딥러닝을 사용한 감성분석기 개발

조회 수 1658 추천 수 0 2018.02.22 00:36:39


senti_data.png

 

http://hugman.re.kr/blog/sentiment_analysis/

 

 

 

위의 표처럼 호텔 리뷰 문장을 '긍정/부정/중립/객관'으로 분류하는 방법을 다룬 글입니다. 딥러닝의 RNN을 사용하여 학습을 하였습니다. 보통은 단어 단위로 하는데 여기서는 간단하게 하기 위해서 한글자 캐릭터 단위로 처리하였습니다. 

 

사실 감정분석이나 문서분류는 거의 비슷하다고 할 수 있습니다. '긍정/부정'으로 나누느냐 '정치/사회/경제' 등의 카테고리로 나누느냐의 차이일 뿐입니다.

 

 

 

이렇게 문서를 분류하는 가장 간단한 방법은 특정 키워드가 몇 번 반복되는지 계산하는 것입니다. 예를 들어, '특별/최적'같은 단어가 나오면 긍정의 점수를, '낙후/곰팡이' 같은 단어가 나오면 부정의 점수를 올리고 최종 계산결과로 판단을 합니다. 하지만 사람이 일일이 특징이 되는 단어를 결정해야하기 때문에 구현이 힘들다는 단점이 있습니다.

 

두번째는 나이브 베이즈 같은 통계적 방법을 사용하는 것입니다. 특징 단어를 확률에 기반해서 자동으로 처리하기 때문에 더 쉽고 정확하게 분류할 수 있습니다.

 

세번째는 딥러닝으로 학습을 하는 것입니다. 통계적 방법과 달리 단어의 위치 같은 문맥 정보를 고려하기 때문에 문장의 의미에 맞게 보다 확실하게 판단할 수 있다는 장점이 있습니다. 

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
부적절한 문장을 판단해주는 딥러닝 모델 - Ask Delphi file 깊은바다 2021-11-08 399
문장을 벡터로 변환하는 방법들 깊은바다 2021-09-16 926
네이버의 초거대모델인 HyperCLOVA 논문 file 깊은바다 2021-09-13 556
챗봇의 슬롯 채우기(Slot Filling)와 DST(Dialogue State Tracking) file 깊은바다 2021-08-19 1455
죽은 약혼자를 챗봇으로 살려낸 남자 - Project December 깊은바다 2021-07-27 559
인터넷 검색을 하고 장기기억을 저장하는 페이스북의 챗봇 - Blenderbot 2 file 깊은바다 2021-07-19 653
GPT-3 데모 사이트 - gpt3demo.com 깊은바다 2021-07-13 3701
6B 파라미터의 GPT-J_6B 오픈소스 모델 깊은바다 2021-07-01 3095
GPT-3를 활용하여 주석을 코드로 바꿔주는 GitHub Copilot 깊은바다 2021-06-30 356
구글의 딥러닝 대화 모델 - LaMDA 깊은바다 2021-06-13 587
일상대화 딥러닝 모델들을 쉽게 실행할 수 있는 Openchat 깊은바다 2021-06-01 569
GPT-3를 사용하여 코딩을 하는 MS의 파워FX 깊은바다 2021-06-01 249
텍스트 스타일을 바꾸는 딥러닝 기술 깊은바다 2021-06-01 436
KoGPT2 v2.0 공개 깊은바다 2021-05-03 1589
이루다 같은 챗봇은 어떤 원리로 작동하는 걸까? 깊은바다 2021-04-03 1691