자연어처리 - 간편한 토픽 모델링 툴 Tomoto Gui

글 수 72

간편한 토픽 모델링 툴 Tomoto Gui

조회 수 1627 추천 수 0 2018.06.14 15:26:16

깊은바다 *.68.247.188 http://aidev.co.kr/5262

99EF1B395B1B49A318

http://bab2min.tistory.com/602

클러스터링(clustering)은 데이터를 유사한 그룹으로 묶는 비지도학습 알고리즘입니다. 토픽 모델링(topic modeling)은 클러스터링과 비슷하지만 주로 텍스트 데이터에 적용하며 단어들의 출현 확률을 통계적인 방법으로 계산합니다. 예를 들어, 호텔 리뷰 데이터를 '와이파이, 무료', '가격', '위치, 접근성' 등 핵심 단어들의 집합으로 구분할 수 있습니다.

이런 토픽 모델링을 윈도우에서 GUI 메뉴로 간편하게 처리할 수 있는 프로그램입니다. LDA, DMR, HDP 등의 모델링 방법을 지원합니다. 다양한 기능이 있고 쉽게 사용할 수 있어 간단히 테스트 해보기에 좋을 듯 합니다.

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
파이썬으로 3줄 요약기 만들기	깊은바다	2018-01-19	11190
마르코프 체인을 사용한 자동 문장 생성	깊은바다	2017-04-05	9454
한국어 문장 분리기, KSS(Korean Sentence Splitter) 파이썬 포팅	깊은바다	2020-12-23	6888
한국어 채팅 데이터로 머신러닝 하기	깊은바다	2018-04-25	6376
자연어(NLP) 처리 기초 정리	깊은바다	2018-10-22	6034
자바 형태소 분석기 open-korean-txt	깊은바다	2017-04-11	5750
WordPiece와 BPE(Byte Pair Encoding)	깊은바다	2019-06-17	5238
한국어 자연어처리 데이터셋 - KorQuAD	깊은바다	2018-12-21	5096
한국어 전처리 기법 모음	깊은바다	2020-07-31	4941
빠르고 성능 좋은 형태소분석기 MeCab-Ko	깊은바다	2017-05-02	4748
문서에서 핵심 단어를 찾는 TF-IDF 알고리즘	깊은바다	2017-09-07	4703
한글 NLP with Python - KoNLPy 사용법 [2]	깊은바다	2017-12-08	4379
노가다 없는 텍스트 분석을 위한 한국어 NLP	깊은바다	2018-04-26	4199
세종 말뭉치보다 9배 더 큰 한글 코퍼스 공개 - 모두의 말뭉치	깊은바다	2020-08-27	3900
한글 자모 분리 및 합치기 파이썬 패키지 [1]	깊은바다	2020-03-03	3767

쓰기

첫 페이지 1 2 3 4 5 끝 페이지