자연어처리 - 한국어 채팅 데이터로 머신러닝 하기

글 수 72

한국어 채팅 데이터로 머신러닝 하기

조회 수 6087 추천 수 0 2018.04.25 16:02:46

깊은바다 *.68.247.188 http://aidev.co.kr/4726

Word Embedding - Word2Vec
â¢ ë¨ì´ ì ë³´ë¥¼ ì´ì©íì¬ ë¨¸ì ë¬ëì íë ¤ë©´ ë¨ì´ë¥¼ vectorë¡ ë³íí´ì£¼ì´ì¼ í©ëë¤.

â¢ ì´ë¥¼ word embedding ëë word representationì´ë¼ê³ í©...

https://www.slideshare.net/hanseokjo5/little-big-data-1-94862151

스캐터랩은 카톡감정분석, 연애의 과학 등 모바일 앱을 개발하는 회사입니다. 카톡 대화내용을 분석하여 두 사람 사이의 감정이나 정보들을 알려주고 연애에 대해 조언을 하주는 서비스입니다.

여기서 어떻게 자연어처리를 했는지 설명하는 슬라이드입니다. 메신저 대화는 문법에 맞지 않은 문장이 많은데 이를 해결한 방법이 많은 참고가 될 것 같습니다.

현재 세계에서 한글 대화 데이터를 가장 많이 보유한 회사가 스캐터랩이 아닐까 생각합니다. 메신저 회사는 공개한 바에 따르면 대화 내용을 영구적으로 보관하지 않는다고 합니다.

머신러닝에 있어서 가장 중요한 것은 무엇보다 데이터입니다. 그만큼 앞으로 자연어분석에 있어 이 회사가 유리한 위치를 차지할 가능성이 높습니다. 최근에는 자연스러운 일상 대화를 제공하는 핑퐁이라는 챗봇 API를 공개했는데 앞으로 여러 챗봇에서 사용되지 않을까 싶습니다.

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
간편한 토픽 모델링 툴 Tomoto Gui	깊은바다	2018-06-14	1454
자연어 관련 데이터셋 사이트 - AI 오픈 이노베이션 허브	깊은바다	2018-12-03	1452
네이버 번역앱 파파고 개발자 인터뷰	깊은바다	2017-02-28	1421
공공 인공지능 오픈 API·DATA 서비스 포털	깊은바다	2017-11-29	1381
국민대 강승식 교수의 형태소 분석기	깊은바다	2017-03-24	1285
NLTK 개발자들이 직접 쓴 자연어처리 책의 공개 버전	깊은바다	2019-07-02	1259
자연어처리와 형태소분석의 기초	깊은바다	2016-03-31	1215
소셜 미디어 감성분석을 통한 주가 예측	깊은바다	2018-04-28	1159
C++로 만든 형태소 분석기 - KIWI	깊은바다	2018-07-02	1133
매주 한편씩 글을 작성하는 자연어처리 블로그 - 위클리 NLP	깊은바다	2020-06-12	1132
APEACH – 혐오 발화 평가데이터를 만드는 새로운 방법	깊은바다	2022-04-22	1108
NUGU Knowledge Base - 지식베이스	깊은바다	2018-11-10	1031
한국어 MRC 연구를 위한 표준 데이터셋(KorQuAD) 소개 및 B2B를 위한 MRC 연구 사례	깊은바다	2019-03-10	967
파이썬과 커뮤니티와 한국어 오픈데이터 - KoNLPy의 탄생배경	깊은바다	2019-11-11	942
Machine Learning for Kids로 감정분석	깊은바다	2020-02-09	932

쓰기

첫 페이지 1 2 3 4 5 끝 페이지