레플리
글 수 73

한국어 채팅 데이터로 머신러닝 하기

조회 수 6310 추천 수 0 2018.04.25 16:02:46


Word Embedding - Word2Vec
• 단어 정보를 이용하여 머신러닝을 하려면 단어를 vector로 변환해주어야 합니다.

• 이를 word embedding 또는 word representation이라고 합...

 

https://www.slideshare.net/hanseokjo5/little-big-data-1-94862151

 

 

 

스캐터랩은 카톡감정분석, 연애의 과학 등 모바일 앱을 개발하는 회사입니다. 카톡 대화내용을 분석하여 두 사람 사이의 감정이나 정보들을 알려주고 연애에 대해 조언을 하주는 서비스입니다.

 

여기서 어떻게 자연어처리를 했는지 설명하는 슬라이드입니다. 메신저 대화는 문법에 맞지 않은 문장이 많은데 이를 해결한 방법이 많은 참고가 될 것 같습니다.

 

 

 

현재 세계에서 한글 대화 데이터를 가장 많이 보유한 회사가 스캐터랩이 아닐까 생각합니다. 메신저 회사는 공개한 바에 따르면 대화 내용을 영구적으로 보관하지 않는다고 합니다.

 

머신러닝에 있어서 가장 중요한 것은 무엇보다 데이터입니다. 그만큼 앞으로 자연어분석에 있어 이 회사가 유리한 위치를 차지할 가능성이 높습니다. 최근에는 자연스러운 일상 대화를 제공하는 핑퐁이라는 챗봇 API를 공개했는데 앞으로 여러 챗봇에서 사용되지 않을까 싶습니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
한국어 채팅 데이터로 머신러닝 하기 깊은바다 2018-04-25 6310
나이브 베이즈로 스팸 분류 깊은바다 2018-04-15 1068
음성인식 방법과 카카오i의 음성형엔진 깊은바다 2018-04-09 876
엑소브레인 자연어 질의응답 기술 file 깊은바다 2018-03-25 874
왓슨 컴퓨터의 인공지능 소개 깊은바다 2018-03-25 1006
자연어처리의 개념 깊은바다 2018-03-24 2085
단어 간 유사도 파악 방법 깊은바다 2018-02-01 3036
네이버 사용자를 만족시켜라 - 의도파악과 의미검색 깊은바다 2018-01-28 2824
머신러닝으로 쏟아지는 유저 CS 답변하기 깊은바다 2018-01-26 877
파이썬으로 3줄 요약기 만들기 깊은바다 2018-01-19 11090
한글 NLP with Python - KoNLPy 사용법 [2] 깊은바다 2017-12-08 4279
공공 인공지능 오픈 API·DATA 서비스 포털 깊은바다 2017-11-29 1578
개인 성격 분석(Watson Personality Insights) 데모 file 깊은바다 2017-10-02 3020
문서에서 핵심 단어를 찾는 TF-IDF 알고리즘 file 깊은바다 2017-09-07 4568
문서의 카테고리를 분류할 수 있는 나이브 베이즈 알고리즘 깊은바다 2017-08-31 2133