레플리
글 수 283


 

http://blog.ncsoft.com/?p=37832

 

 

 

엔씨소프트의 야구AI 서비스인 페이지에서 사용한 자연어생성 기술을 설명한 글입니다. 과거에는 문장을 만들기 위해서는 답변 템플릿을 잘게 쪼개서 다양하게 만들어놓고 적절하게 조합하는 경우가 많았습니다.

 

그런데 페이지에서는 딥러닝 RNN의 Seq2Seq 기술을 사용했다고 합니다. 이때 신경망의 입력으로 질문 문장만이 아니라 답변 정보도 같이 넣었습니다.

 

임대한의 기록을 알려줘|야수|타율 .311, 15홈런, 55타점
-> 임대한은 타율 .311, 15홈런, 55타점을 기록중입니다.

 

 

 

그런데 구체적인 개체명이나 수치값을 따로 태그로 매칭하고 출력에서 변환하는 것이 아니라 직접 입력에 그대로 넣어서 최종 출력에 함께 나오는 것이 신기하네요. 아니면 그렇게 하는데 글의 설명에서 그 부분이 빠진 걸까요.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
OpenAI Transformer GPT2로 만든 언어 모델 깊은바다 2019-02-17 2980
카카오 형태소 분석기(khaiii) 설치와 은전한닢(mecab) 형태소 분석기 비교 깊은바다 2018-12-02 2828
구글 딥러닝 자연어 처리 오픈소스 SyntaxNet file 깊은바다 2017-12-28 2784
그림으로 아주 쉽게 설명한, The Illustrated GPT-2 깊은바다 2020-08-15 2778
추론이 가능한 딥러닝인 Relational Networks [2] 깊은바다 2017-06-11 2740
Python과 Tensorflow를 활용한 AI Chatbot 개발 및 실무 적용 깊은바다 2017-08-25 2582
GPT-3를 강화학습으로 업그레이드한 InstructGPT file 깊은바다 2022-01-30 2566
오픈소스 한국어 딥러닝 챗봇 - Kochat 깊은바다 2020-07-03 2501
딥러닝을 사용하여 의도 및 엔티티를 파악하는 챗봇 소스코드 file 깊은바다 2019-06-25 2329
개체명인식 with Naver 깊은바다 2018-11-20 2320
BERT로 토익 문제를 푸는 프로젝트 file 깊은바다 2019-04-30 2281
GPT2에서 문장 생성 시 단어를 확률에 따라 선택하는 방법 깊은바다 2020-07-16 2203
소설을 생성하는 NarrativeKoGPT2 file 깊은바다 2020-06-19 2195
GPT2로 만든 텍스트 어드벤처 게임 깊은바다 2019-12-09 2010
딥러닝으로 욕설 탐지하기 깊은바다 2018-08-06 1881