레플리
글 수 283

딥러닝을 사용한 감성분석기 개발

조회 수 1658 추천 수 0 2018.02.22 00:36:39


senti_data.png

 

http://hugman.re.kr/blog/sentiment_analysis/

 

 

 

위의 표처럼 호텔 리뷰 문장을 '긍정/부정/중립/객관'으로 분류하는 방법을 다룬 글입니다. 딥러닝의 RNN을 사용하여 학습을 하였습니다. 보통은 단어 단위로 하는데 여기서는 간단하게 하기 위해서 한글자 캐릭터 단위로 처리하였습니다. 

 

사실 감정분석이나 문서분류는 거의 비슷하다고 할 수 있습니다. '긍정/부정'으로 나누느냐 '정치/사회/경제' 등의 카테고리로 나누느냐의 차이일 뿐입니다.

 

 

 

이렇게 문서를 분류하는 가장 간단한 방법은 특정 키워드가 몇 번 반복되는지 계산하는 것입니다. 예를 들어, '특별/최적'같은 단어가 나오면 긍정의 점수를, '낙후/곰팡이' 같은 단어가 나오면 부정의 점수를 올리고 최종 계산결과로 판단을 합니다. 하지만 사람이 일일이 특징이 되는 단어를 결정해야하기 때문에 구현이 힘들다는 단점이 있습니다.

 

두번째는 나이브 베이즈 같은 통계적 방법을 사용하는 것입니다. 특징 단어를 확률에 기반해서 자동으로 처리하기 때문에 더 쉽고 정확하게 분류할 수 있습니다.

 

세번째는 딥러닝으로 학습을 하는 것입니다. 통계적 방법과 달리 단어의 위치 같은 문맥 정보를 고려하기 때문에 문장의 의미에 맞게 보다 확실하게 판단할 수 있다는 장점이 있습니다. 

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
5배 싸진 클로바X의 경량화 모델 - HCX-DASH file 깊은바다 2024-04-26 39
클로바X의 사용량 제한 - QPM과 TPM 깊은바다 2024-04-01 108
Pi를 만든 Inflection AI, MS로 대거 이직한 이유 깊은바다 2024-03-25 119
LLaMA나 Mistral이 계속 무료로 유지될 수 있을까 깊은바다 2024-03-05 246
GPT-3.5와 클로바X 가격 비교 file 깊은바다 2024-02-25 293
OpenAI, 성능은 높아지고 가격은 싸진 새로운 모델 공개 file 깊은바다 2024-01-26 331
AI 휴대용 기기 R1을 만든 Rabbit의 대표 Jesse Lyu 깊은바다 2024-01-12 259
화면을 보고 스마트폰 앱 사용방법을 배우는 모델 - AppAgent file 깊은바다 2024-01-08 303
LLM의 새로운 기법 - Merge와 DPO file 깊은바다 2024-01-02 1176
업스테이지 SOLAR 10.7B에서 사용한 DUS 모델 확장 방법 file 깊은바다 2023-12-27 471
죽은 아들의 AI 아바타를 만든 중국의 부모 file 깊은바다 2023-12-21 186
Private sLLM - 어떻게 만들고 어떻게 배포할까? file 깊은바다 2023-12-18 397
GPT-4가 내 여자친구보다 나를 더 잘 알까? file 깊은바다 2023-12-12 168
FSM과 생성 에이전트의 차이점 깊은바다 2023-11-22 190
RAG를 사용한 페르소나 챗봇 - ChatHaruhi file 깊은바다 2023-10-17 719