레플리
글 수 72


99B503405D39FB6E05.png

 

https://bab2min.tistory.com/552

 

 

 

구글 검색의 핵심 알고리즘은 PageRank입니다. 링크를 많이 받은 페이지의 점수를 높게 부여하는게 기본 원리입니다. 이와 비슷한 방법을 텍스트에 적용한 TextRank를 설명하고 있습니다.

 

좌우로 일정 영역에 같이 위치하고 있으면 링크가 연결되어 있다고 판단합니다. 이렇게 단어 또는 문장 단위로 그래프를 연결하고 중요도를 계산합니다. 키워드나 문장요약에 활용할 수 있습니다.

 

저도 해봤는데 성능이 그렇게 좋지는 않습니다. 특히 '난, 같이, 것' 등의 기본 단어들이 걸려지지 않는게 가장 큰 문제입니다. TF-IDF를 함께 사용하여 다른 문서에서도 빈번하게 쓰이는 단어를 제거해주는 것이 좋을 듯 합니다.

List of Articles
제목 글쓴이 날짜sort 조회 수
개인 성격 분석(Watson Personality Insights) 데모 file 깊은바다 2017-10-02 2812
공공 인공지능 오픈 API·DATA 서비스 포털 깊은바다 2017-11-29 1381
한글 NLP with Python - KoNLPy 사용법 [2] 깊은바다 2017-12-08 4028
파이썬으로 3줄 요약기 만들기 깊은바다 2018-01-19 10815
머신러닝으로 쏟아지는 유저 CS 답변하기 깊은바다 2018-01-26 681
네이버 사용자를 만족시켜라 - 의도파악과 의미검색 깊은바다 2018-01-28 2664
단어 간 유사도 파악 방법 깊은바다 2018-02-01 2855
자연어처리의 개념 깊은바다 2018-03-24 1930
왓슨 컴퓨터의 인공지능 소개 깊은바다 2018-03-25 836
엑소브레인 자연어 질의응답 기술 file 깊은바다 2018-03-25 627
음성인식 방법과 카카오i의 음성형엔진 깊은바다 2018-04-09 661
나이브 베이즈로 스팸 분류 깊은바다 2018-04-15 911
한국어 채팅 데이터로 머신러닝 하기 깊은바다 2018-04-25 6087
노가다 없는 텍스트 분석을 위한 한국어 NLP 깊은바다 2018-04-26 3903
소셜 미디어 감성분석을 통한 주가 예측 깊은바다 2018-04-28 1159