레플리
글 수 72

SentiWordNet과 감성분석

조회 수 1456 추천 수 0 2018.06.04 15:14:52


 

http://bab2min.tistory.com/573

 

 

 

자연어로 감성 분석을 하기 위해 가장 단순한 방법은 각 단어가 긍정인지 부정인지 판단하여 계산하는 것입니다. 이를 위해서는 감성 정보가 레이블 되어 있는 단어 사전이 필요합니다. 영어에서는 SentiWordNet이 가장 유명한데 어떻게 만들었는지 설명하는 글입니다.

 

원래 WordNet이라는 동의어/반의어 사전이 있는데 이를 사용했다고 합니다. 일부 단어를 사람이 긍정, 부정을 설정하고 이 단어들의 동의어와 반의어 정보로 레이블된 단어의 수를 늘립니다.

 

하지만 이것만 가지고는 전체 단어로 확장하기가 어렵습니다. 동의어와 반의어로 연결이 안되는 단어들이 많기 때문입니다. 그래서 레이블된 단어의 주석을 분류기로 학습하고 다시 전체 단어를 주석으로 분류하여 감성 단어사전을 생성하였습니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
노가다 없이 한국어 뉴스/댓글 데이터 분석하기 깊은바다 2018-10-30 3094
자연어(NLP) 처리 기초 정리 깊은바다 2018-10-22 5766
무엇이든 물어보세요, 지식그래프 : 카카오미니와 검색 적용 소개 깊은바다 2018-09-27 663
우리말 자연어처리 기술 - 과거와 현재 깊은바다 2018-08-28 860
엑소브레인의 질의응답 기능 file 깊은바다 2018-08-18 526
엑소브레인 강연 자료 깊은바다 2018-07-19 423
C++로 만든 형태소 분석기 - KIWI 깊은바다 2018-07-02 1132
간편한 토픽 모델링 툴 Tomoto Gui 깊은바다 2018-06-14 1448
클로바 Interaction Model의 이해 및 설계/제작 노하우 - 자연어처리 방법 깊은바다 2018-06-06 641
SentiWordNet과 감성분석 깊은바다 2018-06-04 1456
한국어 오픈소스 자연어처리 라이브러리 - Koshort 깊은바다 2018-05-20 2937
기계번역기의 발전과 역사 깊은바다 2018-05-10 476
소셜 미디어 감성분석을 통한 주가 예측 깊은바다 2018-04-28 1159
노가다 없는 텍스트 분석을 위한 한국어 NLP 깊은바다 2018-04-26 3902
한국어 채팅 데이터로 머신러닝 하기 깊은바다 2018-04-25 6086