레플리
글 수 283


 

http://blog.ncsoft.com/?p=37832

 

 

 

엔씨소프트의 야구AI 서비스인 페이지에서 사용한 자연어생성 기술을 설명한 글입니다. 과거에는 문장을 만들기 위해서는 답변 템플릿을 잘게 쪼개서 다양하게 만들어놓고 적절하게 조합하는 경우가 많았습니다.

 

그런데 페이지에서는 딥러닝 RNN의 Seq2Seq 기술을 사용했다고 합니다. 이때 신경망의 입력으로 질문 문장만이 아니라 답변 정보도 같이 넣었습니다.

 

임대한의 기록을 알려줘|야수|타율 .311, 15홈런, 55타점
-> 임대한은 타율 .311, 15홈런, 55타점을 기록중입니다.

 

 

 

그런데 구체적인 개체명이나 수치값을 따로 태그로 매칭하고 출력에서 변환하는 것이 아니라 직접 입력에 그대로 넣어서 최종 출력에 함께 나오는 것이 신기하네요. 아니면 그렇게 하는데 글의 설명에서 그 부분이 빠진 걸까요.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
한글전용 초거대AI가 필요한 이유 [2] 깊은바다 2023-03-18 630
딥러닝을 이용한 자연어처리의 연구동향 깊은바다 2018-10-04 631
포자랩스의 작사/작곡 인공지능 file 깊은바다 2018-08-31 641
구글 듀플렉스(Duplex) 상용화 시작 [2] 깊은바다 2018-11-26 644
LLM Multi Agent: Customer Service를 기깔나게 자동화하는 방법 file [1] 깊은바다 2023-10-09 648
ChatGPT 플러그인 구현 방법 - manifest와 OpenAPI Spec file 깊은바다 2023-03-28 649
인터넷 검색을 하고 장기기억을 저장하는 페이스북의 챗봇 - Blenderbot 2 file 깊은바다 2021-07-19 653
사람의 말로 표현하는 페이지(PAIGE) - 자연어생성 깊은바다 2018-08-04 660
GPT3 튜링 테스트 깊은바다 2020-07-23 668
카카오미니의 명령어 분류 방법 - GloVe와 CNN 사용 깊은바다 2018-05-07 674
딥러닝 자연어처리 강의 - Natural Language Processing with PyTorch 깊은바다 2019-07-06 687
워드 임베딩에 대한 아주 쉬운 설명 - The Illustrated Word2vec 깊은바다 2019-04-09 703
새로운 자연어처리 벤치마크 - SuperGLUE 깊은바다 2019-08-15 703
GPT-3를 헬스케어 서비스에 적용했을 때의 문제점들 깊은바다 2020-11-04 707
LLM의 창발적인 현상인 CoT(Chain of Thouht) 소개 file 깊은바다 2023-07-27 708