레플리
글 수 72

간편한 토픽 모델링 툴 Tomoto Gui

조회 수 1442 추천 수 0 2018.06.14 15:26:16


99EF1B395B1B49A318

 

http://bab2min.tistory.com/602

 

 

 

클러스터링(clustering)은 데이터를 유사한 그룹으로 묶는 비지도학습 알고리즘입니다. 토픽 모델링(topic modeling)은 클러스터링과 비슷하지만 주로 텍스트 데이터에 적용하며 단어들의 출현 확률을 통계적인 방법으로 계산합니다. 예를 들어, 호텔 리뷰 데이터를 '와이파이, 무료', '가격', '위치, 접근성' 등 핵심 단어들의 집합으로 구분할 수 있습니다.

 

이런 토픽 모델링을 윈도우에서 GUI 메뉴로 간편하게 처리할 수 있는 프로그램입니다. LDA, DMR, HDP 등의 모델링 방법을 지원합니다. 다양한 기능이 있고 쉽게 사용할 수 있어 간단히 테스트 해보기에 좋을 듯 합니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
노가다 없이 한국어 뉴스/댓글 데이터 분석하기 깊은바다 2018-10-30 3094
자연어(NLP) 처리 기초 정리 깊은바다 2018-10-22 5766
무엇이든 물어보세요, 지식그래프 : 카카오미니와 검색 적용 소개 깊은바다 2018-09-27 663
우리말 자연어처리 기술 - 과거와 현재 깊은바다 2018-08-28 860
엑소브레인의 질의응답 기능 file 깊은바다 2018-08-18 526
엑소브레인 강연 자료 깊은바다 2018-07-19 423
C++로 만든 형태소 분석기 - KIWI 깊은바다 2018-07-02 1130
간편한 토픽 모델링 툴 Tomoto Gui 깊은바다 2018-06-14 1442
클로바 Interaction Model의 이해 및 설계/제작 노하우 - 자연어처리 방법 깊은바다 2018-06-06 640
SentiWordNet과 감성분석 깊은바다 2018-06-04 1456
한국어 오픈소스 자연어처리 라이브러리 - Koshort 깊은바다 2018-05-20 2937
기계번역기의 발전과 역사 깊은바다 2018-05-10 476
소셜 미디어 감성분석을 통한 주가 예측 깊은바다 2018-04-28 1158
노가다 없는 텍스트 분석을 위한 한국어 NLP 깊은바다 2018-04-26 3902
한국어 채팅 데이터로 머신러닝 하기 깊은바다 2018-04-25 6086