레플리
글 수 284

카카오미니의 명령어 분류 방법

조회 수 260 추천 수 0 2020.10.23 18:04:17


 

https://tech.kakaoenterprise.com/43?category=882488

 

 

 

카카오미니에서 명령어의 의도를 분석하는 방법을 다룬 글입니다. 우선 문장을 벡터로 변환합니다. 그다음 딥러닝 CNN 모델을 사용하여 특정 카테고리로 분류한다고 합니다.

 

 

 

워드 임베딩은 GloVe를 기반으로 합니다. 여기에 몇 가지 추가 벡터를 삽입하였습니다.

 

첫째, Local Word 벡터입니다. 같은 단어라도 문맥에 따라 의미가 달라집니다. 예를 들어, 카카오는 회사의 명칭, 건물 장소, 음식 등 다양한 뜻을 내포합니다. 이런 의미 벡터를 따로 Glove 벡터에 더합니다.

 

둘째, 엔티티 벡터입니다. '아이유 좋은 날'이란 문장에서, '아이유'는 인물이고 '좋은 날'은 곡명이란 개체입니다. 임베딩에 엔티티 정보를 같이 넣어서 단어의 뜻을 더 명확히 합니다.

 

셋째, 품사정보인 POS 벡터입니다. 명사, 동사, 형용사 같은 품사 벡터를 추가해서 문장의 의미를 더욱 잘 파악하도록 하였습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
OpenAI Transformer GPT2로 만든 언어 모델 깊은바다 2019-02-17 2980
카카오 형태소 분석기(khaiii) 설치와 은전한닢(mecab) 형태소 분석기 비교 깊은바다 2018-12-02 2828
구글 딥러닝 자연어 처리 오픈소스 SyntaxNet file 깊은바다 2017-12-28 2784
그림으로 아주 쉽게 설명한, The Illustrated GPT-2 깊은바다 2020-08-15 2783
추론이 가능한 딥러닝인 Relational Networks [2] 깊은바다 2017-06-11 2740
Python과 Tensorflow를 활용한 AI Chatbot 개발 및 실무 적용 깊은바다 2017-08-25 2582
GPT-3를 강화학습으로 업그레이드한 InstructGPT file 깊은바다 2022-01-30 2569
오픈소스 한국어 딥러닝 챗봇 - Kochat 깊은바다 2020-07-03 2503
딥러닝을 사용하여 의도 및 엔티티를 파악하는 챗봇 소스코드 file 깊은바다 2019-06-25 2329
개체명인식 with Naver 깊은바다 2018-11-20 2320
BERT로 토익 문제를 푸는 프로젝트 file 깊은바다 2019-04-30 2283
GPT2에서 문장 생성 시 단어를 확률에 따라 선택하는 방법 깊은바다 2020-07-16 2206
소설을 생성하는 NarrativeKoGPT2 file 깊은바다 2020-06-19 2198
GPT2로 만든 텍스트 어드벤처 게임 깊은바다 2019-12-09 2010
딥러닝으로 욕설 탐지하기 깊은바다 2018-08-06 1881