레플리
글 수 72

SentiWordNet과 감성분석

조회 수 1456 추천 수 0 2018.06.04 15:14:52


 

http://bab2min.tistory.com/573

 

 

 

자연어로 감성 분석을 하기 위해 가장 단순한 방법은 각 단어가 긍정인지 부정인지 판단하여 계산하는 것입니다. 이를 위해서는 감성 정보가 레이블 되어 있는 단어 사전이 필요합니다. 영어에서는 SentiWordNet이 가장 유명한데 어떻게 만들었는지 설명하는 글입니다.

 

원래 WordNet이라는 동의어/반의어 사전이 있는데 이를 사용했다고 합니다. 일부 단어를 사람이 긍정, 부정을 설정하고 이 단어들의 동의어와 반의어 정보로 레이블된 단어의 수를 늘립니다.

 

하지만 이것만 가지고는 전체 단어로 확장하기가 어렵습니다. 동의어와 반의어로 연결이 안되는 단어들이 많기 때문입니다. 그래서 레이블된 단어의 주석을 분류기로 학습하고 다시 전체 단어를 주석으로 분류하여 감성 단어사전을 생성하였습니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
파이썬과 커뮤니티와 한국어 오픈데이터 - KoNLPy의 탄생배경 깊은바다 2019-11-11 942
검색을 통해 지식그래프를 바로 생성하는 알고리즘 file 깊은바다 2019-08-02 3052
NLTK 개발자들이 직접 쓴 자연어처리 책의 공개 버전 깊은바다 2019-07-02 1259
WordPiece와 BPE(Byte Pair Encoding) 깊은바다 2019-06-17 4735
스마트 스피커에서의 음악 재생 발화 오류 교정 file 깊은바다 2019-03-28 407
한국어 MRC 연구를 위한 표준 데이터셋(KorQuAD) 소개 및 B2B를 위한 MRC 연구 사례 깊은바다 2019-03-10 967
메이템 가상비서 앱 자연어처리 모듈 개발 file [1] 깊은바다 2019-01-31 828
토론하는 인공지능 - IBM Project Debater file 깊은바다 2019-01-16 579
인공지능이 법률 문서를 검토한다면? 깊은바다 2019-01-09 795
TextRank 기법을 이용한 핵심 어구 추출 및 텍스트 요약 file 깊은바다 2018-12-28 3228
한국어 자연어처리 데이터셋 - KorQuAD 깊은바다 2018-12-21 4724
자연어 관련 데이터셋 사이트 - AI 오픈 이노베이션 허브 file 깊은바다 2018-12-03 1451
네이버 검색과 개인화 깊은바다 2018-11-20 619
NUGU Knowledge Base - 지식베이스 깊은바다 2018-11-10 1031
텍스트 분석을 자동으로 해주는 서비스 - KoALA 깊은바다 2018-10-31 2087