레플리
글 수 72

SentiWordNet과 감성분석

조회 수 1456 추천 수 0 2018.06.04 15:14:52


 

http://bab2min.tistory.com/573

 

 

 

자연어로 감성 분석을 하기 위해 가장 단순한 방법은 각 단어가 긍정인지 부정인지 판단하여 계산하는 것입니다. 이를 위해서는 감성 정보가 레이블 되어 있는 단어 사전이 필요합니다. 영어에서는 SentiWordNet이 가장 유명한데 어떻게 만들었는지 설명하는 글입니다.

 

원래 WordNet이라는 동의어/반의어 사전이 있는데 이를 사용했다고 합니다. 일부 단어를 사람이 긍정, 부정을 설정하고 이 단어들의 동의어와 반의어 정보로 레이블된 단어의 수를 늘립니다.

 

하지만 이것만 가지고는 전체 단어로 확장하기가 어렵습니다. 동의어와 반의어로 연결이 안되는 단어들이 많기 때문입니다. 그래서 레이블된 단어의 주석을 분류기로 학습하고 다시 전체 단어를 주석으로 분류하여 감성 단어사전을 생성하였습니다.

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
자연어로 빅데이터 분석 - 왓슨 애널리틱스 깊은바다 2016-03-21 732
사진을 문장으로 변환하는 구글의 새로운 기술 file 깊은바다 2016-03-25 835
자연어처리와 형태소분석의 기초 깊은바다 2016-03-31 1215
차원이 다른 구글 번역기의 도래 깊은바다 2017-02-28 427
구글 신경망 번역의 원리 깊은바다 2017-02-28 1984
네이버 번역앱 파파고 개발자 인터뷰 file 깊은바다 2017-02-28 1421
국민대 강승식 교수의 형태소 분석기 깊은바다 2017-03-24 1285
마르코프 체인을 사용한 자동 문장 생성 file 깊은바다 2017-04-05 8980
자바 형태소 분석기 open-korean-txt 깊은바다 2017-04-11 5436
형태소 분석의 이해 깊은바다 2017-05-01 1798
마르코프 체인으로 만든 p봇 깊은바다 2017-05-01 895
빠르고 성능 좋은 형태소분석기 MeCab-Ko 깊은바다 2017-05-02 4422
KoNLPy - 파이썬 한국어 NLP 깊은바다 2017-06-14 1693
문서의 카테고리를 분류할 수 있는 나이브 베이즈 알고리즘 깊은바다 2017-08-31 1881
문서에서 핵심 단어를 찾는 TF-IDF 알고리즘 file 깊은바다 2017-09-07 4258