- AI Dev - 인공지능 개발자 모임
- 정보공유
- 자연어처리
글 수 73
http://blog.naver.com/anthouse28/221082691132
소셜 미디어에 올린 사람들의 글을 분석해서 주가를 예측하는 방법을 설명하였습니다. 구체적인 방법은 다음과 같습니다.
1. 주식 사이트에서 각 종목별로 게시판의 글을 크롤링
2. 감성 단어 사전에 따라 긍정/부정 단어의 개수를 검사
3. 감성 단어 개수로 게시판의 글을 긍정/부정으로 분류
4. 긍정의 글이 많으면 주가상승, 부정의 글이 많으면 주가하락
그런데 위와 같이 단어의 개수로만 판단하면 정확한 결과를 얻기가 어렵다는 단점이 있습니다.
예를 들어, '멋지게 망했네'와 같은 문장은 멋지게(긍정) / 망했네(부정)의 단어가 섞어있지만 전체적으로는 부정적인 글이라 할 수 있습니다. 단어의 순서에 따라 문맥을 고려하는 방법이 더 효과적일 것 같습니다.