레플리
글 수 72


99B503405D39FB6E05.png

 

https://bab2min.tistory.com/552

 

 

 

구글 검색의 핵심 알고리즘은 PageRank입니다. 링크를 많이 받은 페이지의 점수를 높게 부여하는게 기본 원리입니다. 이와 비슷한 방법을 텍스트에 적용한 TextRank를 설명하고 있습니다.

 

좌우로 일정 영역에 같이 위치하고 있으면 링크가 연결되어 있다고 판단합니다. 이렇게 단어 또는 문장 단위로 그래프를 연결하고 중요도를 계산합니다. 키워드나 문장요약에 활용할 수 있습니다.

 

저도 해봤는데 성능이 그렇게 좋지는 않습니다. 특히 '난, 같이, 것' 등의 기본 단어들이 걸려지지 않는게 가장 큰 문제입니다. TF-IDF를 함께 사용하여 다른 문서에서도 빈번하게 쓰이는 단어를 제거해주는 것이 좋을 듯 합니다.

List of Articles
제목 글쓴이 날짜 조회 수sort
음성인식 방법과 카카오i의 음성형엔진 깊은바다 2018-04-09 661
무엇이든 물어보세요, 지식그래프 : 카카오미니와 검색 적용 소개 깊은바다 2018-09-27 663
머신러닝으로 쏟아지는 유저 CS 답변하기 깊은바다 2018-01-26 681
자연어처리 벤치마크 GLUE의 한글 버전인 KLUE 공개 file 깊은바다 2021-05-22 690
자연어로 빅데이터 분석 - 왓슨 애널리틱스 깊은바다 2016-03-21 732
인공지능이 법률 문서를 검토한다면? 깊은바다 2019-01-09 795
메이템 가상비서 앱 자연어처리 모듈 개발 file [1] 깊은바다 2019-01-31 828
사진을 문장으로 변환하는 구글의 새로운 기술 file 깊은바다 2016-03-25 835
왓슨 컴퓨터의 인공지능 소개 깊은바다 2018-03-25 836
우리말 자연어처리 기술 - 과거와 현재 깊은바다 2018-08-28 860
마르코프 체인으로 만든 p봇 깊은바다 2017-05-01 895
나이브 베이즈로 스팸 분류 깊은바다 2018-04-15 911
Machine Learning for Kids로 감정분석 깊은바다 2020-02-09 932
파이썬과 커뮤니티와 한국어 오픈데이터 - KoNLPy의 탄생배경 깊은바다 2019-11-11 942
한국어 MRC 연구를 위한 표준 데이터셋(KorQuAD) 소개 및 B2B를 위한 MRC 연구 사례 깊은바다 2019-03-10 967