레플리
글 수 284

딥러닝을 사용한 감성분석기 개발

조회 수 1658 추천 수 0 2018.02.22 00:36:39


senti_data.png

 

http://hugman.re.kr/blog/sentiment_analysis/

 

 

 

위의 표처럼 호텔 리뷰 문장을 '긍정/부정/중립/객관'으로 분류하는 방법을 다룬 글입니다. 딥러닝의 RNN을 사용하여 학습을 하였습니다. 보통은 단어 단위로 하는데 여기서는 간단하게 하기 위해서 한글자 캐릭터 단위로 처리하였습니다. 

 

사실 감정분석이나 문서분류는 거의 비슷하다고 할 수 있습니다. '긍정/부정'으로 나누느냐 '정치/사회/경제' 등의 카테고리로 나누느냐의 차이일 뿐입니다.

 

 

 

이렇게 문서를 분류하는 가장 간단한 방법은 특정 키워드가 몇 번 반복되는지 계산하는 것입니다. 예를 들어, '특별/최적'같은 단어가 나오면 긍정의 점수를, '낙후/곰팡이' 같은 단어가 나오면 부정의 점수를 올리고 최종 계산결과로 판단을 합니다. 하지만 사람이 일일이 특징이 되는 단어를 결정해야하기 때문에 구현이 힘들다는 단점이 있습니다.

 

두번째는 나이브 베이즈 같은 통계적 방법을 사용하는 것입니다. 특징 단어를 확률에 기반해서 자동으로 처리하기 때문에 더 쉽고 정확하게 분류할 수 있습니다.

 

세번째는 딥러닝으로 학습을 하는 것입니다. 통계적 방법과 달리 단어의 위치 같은 문맥 정보를 고려하기 때문에 문장의 의미에 맞게 보다 확실하게 판단할 수 있다는 장점이 있습니다. 

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
장문의 대답을 평가하는 자연어처리 벤치마크 - TuringAdvice 깊은바다 2020-04-17 215
ChatGPT 영어회화 깊은바다 2023-03-09 218
카카오브레인 김일두 대표님의 글 - 생성AI가 비즈니스를 어떻게 혁신할까 깊은바다 2023-06-15 218
딥러닝을 이용한 지역 컨텍스트 검색 깊은바다 2018-08-10 222
페이지링크와 ChatGPT 대화를 동시에 지원하는 검색엔진 - You.com 깊은바다 2022-12-27 236
하이퍼클로바 기반의 심리상담 챗봇 개발 경험 깊은바다 2023-02-17 238
테드 창, ChatGPT는 엄청나게 효율이 높은 손실 압축임 깊은바다 2023-02-13 238
LLaMA나 Mistral이 계속 무료로 유지될 수 있을까 깊은바다 2024-03-05 246
GPT-3를 사용하여 코딩을 하는 MS의 파워FX 깊은바다 2021-06-01 249
ChatGPT로 폴 그레이엄 에세이 검색해서 대답 file 깊은바다 2023-03-03 251
세콰이어캐피탈에서 전망하는 LLM의 미래 깊은바다 2023-06-19 251
ChatGPT, 타임지 표지 장식 깊은바다 2023-02-17 255
카카오미니의 명령어 분류 방법 깊은바다 2020-10-23 260
AI 휴대용 기기 R1을 만든 Rabbit의 대표 Jesse Lyu 깊은바다 2024-01-12 260
생성 에이전트를 ChatGPT 프롬프트만으로 구현 file 깊은바다 2023-04-20 265