레플리
글 수 72

간편한 토픽 모델링 툴 Tomoto Gui

조회 수 1450 추천 수 0 2018.06.14 15:26:16


99EF1B395B1B49A318

 

http://bab2min.tistory.com/602

 

 

 

클러스터링(clustering)은 데이터를 유사한 그룹으로 묶는 비지도학습 알고리즘입니다. 토픽 모델링(topic modeling)은 클러스터링과 비슷하지만 주로 텍스트 데이터에 적용하며 단어들의 출현 확률을 통계적인 방법으로 계산합니다. 예를 들어, 호텔 리뷰 데이터를 '와이파이, 무료', '가격', '위치, 접근성' 등 핵심 단어들의 집합으로 구분할 수 있습니다.

 

이런 토픽 모델링을 윈도우에서 GUI 메뉴로 간편하게 처리할 수 있는 프로그램입니다. LDA, DMR, HDP 등의 모델링 방법을 지원합니다. 다양한 기능이 있고 쉽게 사용할 수 있어 간단히 테스트 해보기에 좋을 듯 합니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
자연어 관련 데이터셋 사이트 - AI 오픈 이노베이션 허브 file 깊은바다 2018-12-03 1451
간편한 토픽 모델링 툴 Tomoto Gui 깊은바다 2018-06-14 1450
네이버 번역앱 파파고 개발자 인터뷰 file 깊은바다 2017-02-28 1421
공공 인공지능 오픈 API·DATA 서비스 포털 깊은바다 2017-11-29 1381
국민대 강승식 교수의 형태소 분석기 깊은바다 2017-03-24 1285
NLTK 개발자들이 직접 쓴 자연어처리 책의 공개 버전 깊은바다 2019-07-02 1259
자연어처리와 형태소분석의 기초 깊은바다 2016-03-31 1215
소셜 미디어 감성분석을 통한 주가 예측 깊은바다 2018-04-28 1159
C++로 만든 형태소 분석기 - KIWI 깊은바다 2018-07-02 1133
매주 한편씩 글을 작성하는 자연어처리 블로그 - 위클리 NLP 깊은바다 2020-06-12 1129
APEACH – 혐오 발화 평가데이터를 만드는 새로운 방법 깊은바다 2022-04-22 1103
NUGU Knowledge Base - 지식베이스 깊은바다 2018-11-10 1031
한국어 MRC 연구를 위한 표준 데이터셋(KorQuAD) 소개 및 B2B를 위한 MRC 연구 사례 깊은바다 2019-03-10 967
파이썬과 커뮤니티와 한국어 오픈데이터 - KoNLPy의 탄생배경 깊은바다 2019-11-11 942
Machine Learning for Kids로 감정분석 깊은바다 2020-02-09 932