- AI Dev - 인공지능 개발자 모임
- 정보공유
- 챗봇 딥러닝
글 수 292
https://velog.io/@easter423/GPT-3-vs-GPT-3.5-vs-ChatGPT
GPT-3, InstructGPT, GPT-3.5, ChatGPT가 정확히 어떤 차이가 있는지 모르시는 분들이 많을 텐데요. 여기에 대해 알기쉽게 설명한 글입니다.
InstructGPT는 GPT-3에 최초로 RLHF(Reinforcement Learning from Human Feedback)를 적용한 버전입니다. GPT-3는 다음 단어를 맞추는 자기지도학습을 통해서 사전훈련만 했습니다. 여기에 사람이 작성한 데이터로 지도학습을 하고, 추가로 강화학습을 적용한 것이 RLHF입니다. 덕분에 더 성능이 높아지면서 안전한 대답을 할 수 있게 되었습니다.
InstructGPT가 업데이트 되면서 이름이 GPT-3.5로 바뀌었습니다. ChatGPT는 GPT-3.5를 대화 형식으로 파인튜닝한 버전입니다.