레플리
글 수 72

간편한 토픽 모델링 툴 Tomoto Gui

조회 수 1453 추천 수 0 2018.06.14 15:26:16


99EF1B395B1B49A318

 

http://bab2min.tistory.com/602

 

 

 

클러스터링(clustering)은 데이터를 유사한 그룹으로 묶는 비지도학습 알고리즘입니다. 토픽 모델링(topic modeling)은 클러스터링과 비슷하지만 주로 텍스트 데이터에 적용하며 단어들의 출현 확률을 통계적인 방법으로 계산합니다. 예를 들어, 호텔 리뷰 데이터를 '와이파이, 무료', '가격', '위치, 접근성' 등 핵심 단어들의 집합으로 구분할 수 있습니다.

 

이런 토픽 모델링을 윈도우에서 GUI 메뉴로 간편하게 처리할 수 있는 프로그램입니다. LDA, DMR, HDP 등의 모델링 방법을 지원합니다. 다양한 기능이 있고 쉽게 사용할 수 있어 간단히 테스트 해보기에 좋을 듯 합니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
파이썬으로 3줄 요약기 만들기 깊은바다 2018-01-19 10815
마르코프 체인을 사용한 자동 문장 생성 file 깊은바다 2017-04-05 8980
한국어 문장 분리기, KSS(Korean Sentence Splitter) 파이썬 포팅 file 깊은바다 2020-12-23 6180
한국어 채팅 데이터로 머신러닝 하기 깊은바다 2018-04-25 6087
자연어(NLP) 처리 기초 정리 깊은바다 2018-10-22 5770
자바 형태소 분석기 open-korean-txt 깊은바다 2017-04-11 5436
WordPiece와 BPE(Byte Pair Encoding) 깊은바다 2019-06-17 4748
한국어 자연어처리 데이터셋 - KorQuAD 깊은바다 2018-12-21 4725
한국어 전처리 기법 모음 깊은바다 2020-07-31 4539
빠르고 성능 좋은 형태소분석기 MeCab-Ko 깊은바다 2017-05-02 4422
문서에서 핵심 단어를 찾는 TF-IDF 알고리즘 file 깊은바다 2017-09-07 4258
한글 NLP with Python - KoNLPy 사용법 [2] 깊은바다 2017-12-08 4028
노가다 없는 텍스트 분석을 위한 한국어 NLP 깊은바다 2018-04-26 3903
한글 자모 분리 및 합치기 파이썬 패키지 [1] 깊은바다 2020-03-03 3249
TextRank 기법을 이용한 핵심 어구 추출 및 텍스트 요약 file 깊은바다 2018-12-28 3229