레플리
글 수 283

딥러닝을 사용한 감성분석기 개발

조회 수 1658 추천 수 0 2018.02.22 00:36:39


senti_data.png

 

http://hugman.re.kr/blog/sentiment_analysis/

 

 

 

위의 표처럼 호텔 리뷰 문장을 '긍정/부정/중립/객관'으로 분류하는 방법을 다룬 글입니다. 딥러닝의 RNN을 사용하여 학습을 하였습니다. 보통은 단어 단위로 하는데 여기서는 간단하게 하기 위해서 한글자 캐릭터 단위로 처리하였습니다. 

 

사실 감정분석이나 문서분류는 거의 비슷하다고 할 수 있습니다. '긍정/부정'으로 나누느냐 '정치/사회/경제' 등의 카테고리로 나누느냐의 차이일 뿐입니다.

 

 

 

이렇게 문서를 분류하는 가장 간단한 방법은 특정 키워드가 몇 번 반복되는지 계산하는 것입니다. 예를 들어, '특별/최적'같은 단어가 나오면 긍정의 점수를, '낙후/곰팡이' 같은 단어가 나오면 부정의 점수를 올리고 최종 계산결과로 판단을 합니다. 하지만 사람이 일일이 특징이 되는 단어를 결정해야하기 때문에 구현이 힘들다는 단점이 있습니다.

 

두번째는 나이브 베이즈 같은 통계적 방법을 사용하는 것입니다. 특징 단어를 확률에 기반해서 자동으로 처리하기 때문에 더 쉽고 정확하게 분류할 수 있습니다.

 

세번째는 딥러닝으로 학습을 하는 것입니다. 통계적 방법과 달리 단어의 위치 같은 문맥 정보를 고려하기 때문에 문장의 의미에 맞게 보다 확실하게 판단할 수 있다는 장점이 있습니다. 

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
DALL-E를 능가하는 OpenAI의 GLIDE 깊은바다 2021-12-27 836
GPT-3를 강화학습으로 업그레이드한 InstructGPT file 깊은바다 2022-01-30 2563
프로그램을 작성하는 딥마인드의 알파코드 file 깊은바다 2022-02-04 1005
구글의 대화기반 초거대모델 LaMDA, 논문 공개 file 깊은바다 2022-02-08 1359
네이버의 초거대모델인 하이퍼클로바 사용 후기 깊은바다 2022-02-14 3170
하이퍼클로바 활용예 및 사용가이드 file 깊은바다 2022-03-05 3569
교육용 챗봇의 미래!? 구글 람다 (LaMDA) 깊은바다 2022-03-11 1361
초거대모델의 파인튜닝 방법 - P-tuning과 LoRA file 깊은바다 2022-04-05 12065
GPT-3보다 3배 더 큰 구글의 초거대모델, PaLM file 깊은바다 2022-04-07 1407
메타, GPT-3와 동급인 175B의 초거대모델 무료 공개 깊은바다 2022-05-04 1189
글자, 사진, 영상을 동시에 처리하는 딥마인드의 딥러닝 모델 - Flamingo file 깊은바다 2022-05-10 1428
구글의 초거대모델 PaLM의 추론과 상식 능력 file 깊은바다 2022-05-20 838
러시아의 구글 얀덱스, 100B 초거대모델 무료 공개 깊은바다 2022-06-26 806
최신 자연어처리 모델 소개 file 깊은바다 2022-07-11 1180
유저 피드백을 받아 지속적으로 학습을 하는 챗봇 - BlenderBot 3 file 깊은바다 2022-08-06 1154