레플리
글 수 72

간편한 토픽 모델링 툴 Tomoto Gui

조회 수 1450 추천 수 0 2018.06.14 15:26:16


99EF1B395B1B49A318

 

http://bab2min.tistory.com/602

 

 

 

클러스터링(clustering)은 데이터를 유사한 그룹으로 묶는 비지도학습 알고리즘입니다. 토픽 모델링(topic modeling)은 클러스터링과 비슷하지만 주로 텍스트 데이터에 적용하며 단어들의 출현 확률을 통계적인 방법으로 계산합니다. 예를 들어, 호텔 리뷰 데이터를 '와이파이, 무료', '가격', '위치, 접근성' 등 핵심 단어들의 집합으로 구분할 수 있습니다.

 

이런 토픽 모델링을 윈도우에서 GUI 메뉴로 간편하게 처리할 수 있는 프로그램입니다. LDA, DMR, HDP 등의 모델링 방법을 지원합니다. 다양한 기능이 있고 쉽게 사용할 수 있어 간단히 테스트 해보기에 좋을 듯 합니다.

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
APEACH – 혐오 발화 평가데이터를 만드는 새로운 방법 깊은바다 2022-04-22 1103
윈도우에서 간편하게 Mecab 설치방법 - pyeunjeon 깊은바다 2021-06-15 498
자연어처리 벤치마크 GLUE의 한글 버전인 KLUE 공개 file 깊은바다 2021-05-22 689
모두의 말뭉치에 새로운 일상 대화 추가 file 깊은바다 2021-04-06 562
자연어처리 벤치마크인 SuperGLUE도 인간의 기록을 경신 [1] 깊은바다 2021-01-21 550
한국어 문장 분리기, KSS(Korean Sentence Splitter) 파이썬 포팅 file 깊은바다 2020-12-23 6162
파이썬 한국어 말뭉치 패키지 - Korpora file 깊은바다 2020-09-12 1512
세종 말뭉치보다 9배 더 큰 한글 코퍼스 공개 - 모두의 말뭉치 file 깊은바다 2020-08-27 3150
한국어 전처리 기법 모음 깊은바다 2020-07-31 4539
예일대의 자연어-SQL 데이터셋, Spider 깊은바다 2020-07-12 526
IBM 왓슨의 자연어처리 방식 깊은바다 2020-06-26 626
매주 한편씩 글을 작성하는 자연어처리 블로그 - 위클리 NLP 깊은바다 2020-06-12 1129
인간의 언어를 이해하는 기계, NLU에는 어떤 것이 있을까? 깊은바다 2020-06-05 417
한글 자모 분리 및 합치기 파이썬 패키지 [1] 깊은바다 2020-03-03 3245
Machine Learning for Kids로 감정분석 깊은바다 2020-02-09 932