레플리
글 수 284


K-001.png

 

K-002.png

 

K-003.png

 

K-004.png

 

K-005.png

 

K-006.png

 

K-007.png

 

 

 

이번 LangCon 2023에서 스캐터랩의 이주홍님이 발표한 내용입니다. 이루다2.0은 생성AI를 적용했습니다. 그래서 이전보다 훨씬 자연스러운 대화를 하는데요. 특히 단조롭지 않고 통통 튀는 대답이 인상적입니다.

 

이번 발표에서 이루다의 페르소나를 어떻게 딥러닝 모델로 구현했는지 대략적인 힌트가 나와있습니다. 제 생각에는 아마 내부 인력(또는 크라우드소싱)으로 이루다 성격에 맞는 대화 문장 데이터를 작성한 것 같습니다. 그것도 상당한 분량으로요.

 

InstructGPT 같이 강화학습 기법을 적용했는지는 잘 모르겠습니다. 강화학습 없이 이루다 전용 문장으로 파인튜닝만 해도 꽤 효과적이라고 봅니다. 그만큼 스캐터랩의 엄청난 노력과 노하우가 들어갔겠지만요.

 

 

 

< 강의자료 >

https://songys.github.io/2023Langcon/data/scatterlab_v2.pdf

 

< 강의영상 >

https://www.youtube.com/watch?v=QAzpAImIrMI

 

List of Articles
제목 글쓴이 날짜 조회 수sort
KoGPT2 v2.0 공개 깊은바다 2021-05-03 1589
GPT2로 글을 작성하는 사이트 - StoryAI file 깊은바다 2019-10-11 1582
KoNLPy를 이용하여 Huggingface Transformers 학습하기 깊은바다 2020-09-20 1573
Java에서 Word2vec 사용하기 깊은바다 2018-05-05 1570
글쓰는 법을 배우는 신경망 깊은바다 2016-03-25 1539
딥러닝 자연어처리 라이브러리 - Pororo file 깊은바다 2021-02-03 1531
일상대화 챗봇 레플리카(Replika)의 구현 방식 file 깊은바다 2020-12-22 1510
딥러닝으로 미소녀 챗봇 만들기 깊은바다 2018-06-01 1499
챗봇의 슬롯 채우기(Slot Filling)와 DST(Dialogue State Tracking) file 깊은바다 2021-08-19 1479
GPT-3로 NPC와 대화를 할 수 있는 게임 시뮬레이터 깊은바다 2021-02-22 1464
문장의 유사성을 예측하고 평가하는 AI - 카카오 심슨 깊은바다 2019-03-20 1463
GPT가 스스로 계획을 세워서 실행한다면 - AutoGPT와 LangChain file 깊은바다 2023-04-18 1455
한국어 형태소 분석기 성능 비교 - khaiii 깊은바다 2018-12-10 1447
글자, 사진, 영상을 동시에 처리하는 딥마인드의 딥러닝 모델 - Flamingo file 깊은바다 2022-05-10 1440
문장을 사진으로 변환하는 StackGAN [1] 깊은바다 2018-09-17 1435