레플리
글 수 72

간편한 토픽 모델링 툴 Tomoto Gui

조회 수 1451 추천 수 0 2018.06.14 15:26:16


99EF1B395B1B49A318

 

http://bab2min.tistory.com/602

 

 

 

클러스터링(clustering)은 데이터를 유사한 그룹으로 묶는 비지도학습 알고리즘입니다. 토픽 모델링(topic modeling)은 클러스터링과 비슷하지만 주로 텍스트 데이터에 적용하며 단어들의 출현 확률을 통계적인 방법으로 계산합니다. 예를 들어, 호텔 리뷰 데이터를 '와이파이, 무료', '가격', '위치, 접근성' 등 핵심 단어들의 집합으로 구분할 수 있습니다.

 

이런 토픽 모델링을 윈도우에서 GUI 메뉴로 간편하게 처리할 수 있는 프로그램입니다. LDA, DMR, HDP 등의 모델링 방법을 지원합니다. 다양한 기능이 있고 쉽게 사용할 수 있어 간단히 테스트 해보기에 좋을 듯 합니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
세종 말뭉치보다 9배 더 큰 한글 코퍼스 공개 - 모두의 말뭉치 file 깊은바다 2020-08-27 3158
노가다 없이 한국어 뉴스/댓글 데이터 분석하기 깊은바다 2018-10-30 3094
검색을 통해 지식그래프를 바로 생성하는 알고리즘 file 깊은바다 2019-08-02 3052
한국어 오픈소스 자연어처리 라이브러리 - Koshort 깊은바다 2018-05-20 2938
단어 간 유사도 파악 방법 깊은바다 2018-02-01 2855
개인 성격 분석(Watson Personality Insights) 데모 file 깊은바다 2017-10-02 2812
네이버 사용자를 만족시켜라 - 의도파악과 의미검색 깊은바다 2018-01-28 2664
텍스트 분석을 자동으로 해주는 서비스 - KoALA 깊은바다 2018-10-31 2088
구글 신경망 번역의 원리 깊은바다 2017-02-28 1984
자연어처리의 개념 깊은바다 2018-03-24 1930
문서의 카테고리를 분류할 수 있는 나이브 베이즈 알고리즘 깊은바다 2017-08-31 1881
형태소 분석의 이해 깊은바다 2017-05-01 1798
KoNLPy - 파이썬 한국어 NLP 깊은바다 2017-06-14 1693
파이썬 한국어 말뭉치 패키지 - Korpora file 깊은바다 2020-09-12 1513
SentiWordNet과 감성분석 깊은바다 2018-06-04 1456