레플리
글 수 283

GPT-3, InstructGPT, GPT-3.5, ChatGPT의 차이점

조회 수 1376 추천 수 0 2023.04.05 12:43:26


 

https://velog.io/@easter423/GPT-3-vs-GPT-3.5-vs-ChatGPT

 

 

 

GPT-3, InstructGPT, GPT-3.5, ChatGPT가 정확히 어떤 차이가 있는지 모르시는 분들이 많을 텐데요. 여기에 대해 알기쉽게 설명한 글입니다.

 

InstructGPT는 GPT-3에 최초로 RLHF(Reinforcement Learning from Human Feedback)를 적용한 버전입니다. GPT-3는 다음 단어를 맞추는 자기지도학습을 통해서 사전훈련만 했습니다. 여기에 사람이 작성한 데이터로 지도학습을 하고, 추가로 강화학습을 적용한 것이 RLHF입니다. 덕분에 더 성능이 높아지면서 안전한 대답을 할 수 있게 되었습니다.

 

InstructGPT가 업데이트 되면서 이름이 GPT-3.5로 바뀌었습니다. ChatGPT는 GPT-3.5를 대화 형식으로 파인튜닝한 버전입니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
RNN과 Torch로 발라드곡 작사하기 깊은바다 2018-03-23 538
챗봇에 딥러닝 학습을 적용하기 어려운 이유 file 깊은바다 2018-03-23 6641
잡담봇 삽질기 - 문봇에서 딥러닝 Seq2Seq로 문장 생성 깊은바다 2018-03-25 857
문장 입력 이진분류 모델 레시피 - 영화평점 학습 [3] 깊은바다 2018-04-04 613
Gluon으로구현해보는 한영기계번역 모형 깊은바다 2018-04-13 275
챗봇에서 유사한 문장 자동인식 방법 file 깊은바다 2018-04-27 5152
딥러닝으로 욕설 탐지하기 file [2] 깊은바다 2018-05-04 1073
Java에서 Word2vec 사용하기 깊은바다 2018-05-05 1563
카카오미니의 명령어 분류 방법 - GloVe와 CNN 사용 깊은바다 2018-05-07 674
딥러닝 학습으로 배우는 대화 인공지능 - 구글 듀플렉스 깊은바다 2018-05-09 515
머신러닝의 자연어처리 기술 깊은바다 2018-05-11 937
딥러닝을 이용한 자연어처리 깊은바다 2018-05-17 561
페이지(PAIGE)를 만드는 사람들 - 자연어처리 기법 깊은바다 2018-05-26 397
딥러닝으로 미소녀 챗봇 만들기 깊은바다 2018-06-01 1498
게임 속 음성 기술 깊은바다 2018-06-13 206