레플리
글 수 284


K-001.png

 

K-002.png

 

K-003.png

 

K-004.png

 

K-005.png

 

K-006.png

 

K-007.png

 

 

 

이번 LangCon 2023에서 스캐터랩의 이주홍님이 발표한 내용입니다. 이루다2.0은 생성AI를 적용했습니다. 그래서 이전보다 훨씬 자연스러운 대화를 하는데요. 특히 단조롭지 않고 통통 튀는 대답이 인상적입니다.

 

이번 발표에서 이루다의 페르소나를 어떻게 딥러닝 모델로 구현했는지 대략적인 힌트가 나와있습니다. 제 생각에는 아마 내부 인력(또는 크라우드소싱)으로 이루다 성격에 맞는 대화 문장 데이터를 작성한 것 같습니다. 그것도 상당한 분량으로요.

 

InstructGPT 같이 강화학습 기법을 적용했는지는 잘 모르겠습니다. 강화학습 없이 이루다 전용 문장으로 파인튜닝만 해도 꽤 효과적이라고 봅니다. 그만큼 스캐터랩의 엄청난 노력과 노하우가 들어갔겠지만요.

 

 

 

< 강의자료 >

https://songys.github.io/2023Langcon/data/scatterlab_v2.pdf

 

< 강의영상 >

https://www.youtube.com/watch?v=QAzpAImIrMI

 

List of Articles
제목 글쓴이 날짜sort 조회 수
카카오 형태소 분석기(khaiii) 설치와 은전한닢(mecab) 형태소 분석기 비교 깊은바다 2018-12-02 2828
한국어 형태소 분석기 성능 비교 - khaiii 깊은바다 2018-12-10 1447
BERT 톺아보기 깊은바다 2018-12-17 26395
2018 Amazon Prize에서 우승한 Gunrock 소셜봇 file 깊은바다 2018-12-26 557
사전훈련 자연어처리 모델의 발전과정 - The Illustrated BERT, ELMo, and co. 깊은바다 2019-01-01 1379
BERT를 이용한 챗봇 구현 file 깊은바다 2019-01-07 4113
딥러닝 자연어처리 - RNN에서 BERT까지 [2] 깊은바다 2019-01-07 1756
Word2Vec 테스트 사이트 file 깊은바다 2019-01-13 1203
Word2Vec의 학습 방식 깊은바다 2019-01-17 898
문장을 입력하면 비슷한 짤방을 보여주는 프로젝트 file 깊은바다 2019-01-28 6172
목적지향 대화 학습 - Learning End-to-End Goal-Oriented Dialog file 깊은바다 2019-02-02 1597
텐서플로에서 사전 훈련된 임베딩을 사용하는 예제 깊은바다 2019-02-02 480
OpenAI Transformer GPT2로 만든 언어 모델 깊은바다 2019-02-17 2980
문장의 유사성을 예측하고 평가하는 AI - 카카오 심슨 깊은바다 2019-03-20 1463
대화 인공지능 대회 - ConvAI file 깊은바다 2019-03-25 631