레플리
글 수 284


K-001.png

 

K-002.png

 

K-003.png

 

K-004.png

 

K-005.png

 

K-006.png

 

K-007.png

 

 

 

이번 LangCon 2023에서 스캐터랩의 이주홍님이 발표한 내용입니다. 이루다2.0은 생성AI를 적용했습니다. 그래서 이전보다 훨씬 자연스러운 대화를 하는데요. 특히 단조롭지 않고 통통 튀는 대답이 인상적입니다.

 

이번 발표에서 이루다의 페르소나를 어떻게 딥러닝 모델로 구현했는지 대략적인 힌트가 나와있습니다. 제 생각에는 아마 내부 인력(또는 크라우드소싱)으로 이루다 성격에 맞는 대화 문장 데이터를 작성한 것 같습니다. 그것도 상당한 분량으로요.

 

InstructGPT 같이 강화학습 기법을 적용했는지는 잘 모르겠습니다. 강화학습 없이 이루다 전용 문장으로 파인튜닝만 해도 꽤 효과적이라고 봅니다. 그만큼 스캐터랩의 엄청난 노력과 노하우가 들어갔겠지만요.

 

 

 

< 강의자료 >

https://songys.github.io/2023Langcon/data/scatterlab_v2.pdf

 

< 강의영상 >

https://www.youtube.com/watch?v=QAzpAImIrMI

 

List of Articles
제목 글쓴이 날짜 조회 수sort
네이버의 초거대모델인 하이퍼클로바 가격 공개 깊은바다 2022-08-24 1862
KoGPT2로 한국어 노래 가사 생성하기 깊은바다 2020-05-21 1856
ChatGPT 한글 자동번역 크롬 확장프로그램 깊은바다 2023-01-17 1854
ChatGPT 플러그인 전략 및 생태계 변화 전망 file 깊은바다 2023-04-09 1828
GPT2를 Colab에서 테스트할 수 있는 코드 깊은바다 2019-05-21 1784
구글의 일상대화 딥러닝 모델 - Meena file 깊은바다 2020-01-30 1771
딥러닝 자연어처리 - RNN에서 BERT까지 [2] 깊은바다 2019-01-07 1756
GPT3 유료화 가격 공개 file 깊은바다 2020-09-04 1748
GLUE: 벤치마크를 통해 BERT 이해하기 깊은바다 2019-11-19 1737
100억건의 카카오톡 데이터로 
똑똑한 일상대화 인공지능 만들기 - 핑퐁 멀티턴 file 깊은바다 2019-08-20 1732
이루다 같은 챗봇은 어떤 원리로 작동하는 걸까? 깊은바다 2021-04-03 1694
심즈와 비슷한 가상세계를 ChatGPT로 구현 - 생성 에이전트(Generative Agents) file 깊은바다 2023-04-14 1683
딥러닝을 사용한 감성분석기 개발 깊은바다 2018-02-22 1658
문장의 유사도를 파악하는 구글의 universal-sentence-encoder file 깊은바다 2018-08-29 1597
목적지향 대화 학습 - Learning End-to-End Goal-Oriented Dialog file 깊은바다 2019-02-02 1597