챗봇 딥러닝 - Llama 2의 RLHF 구현 방법

글 수 284

Llama 2의 RLHF 구현 방법

조회 수 734 추천 수 0 2023.07.19 20:31:41

깊은바다 *.68.249.160 http://aidev.co.kr/13228

https://www.facebook.com/rosinality/posts/6768879263164448

Llama 2의 가장 큰 특징은 역시 RLHF입니다. 이 과정에 대해서 자세히 설명한 글입니다. RLHF의 1단계는 SFT입니다. 사람이 질문에 대한 정답을 작성하고 이를 지도학습으로 배웁니다. 2단계는 사람이 모델이 생성한 답변에 점수를 매겨 reward model을 만듭니다. 3단계는 이를 사용해서 모델이 스스로 최적의 문장을 만드는 방법을 학습합니다. SFT보다 RL이 모델의 성능을 높이는데 더 효과적이라고 합니다. 직접 소설을 쓰는 것보다 좋은 소설을 판별하는게 더 쉬운 것처럼요.

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
MS 직원의 GPT 기반 콜센터 챗봇 사용기	깊은바다	2023-02-18	158
ChatGPT와 통합된 Bing 사용후기 영상	깊은바다	2023-02-10	166
ChatGPT의 3가지 핵심 특징	깊은바다	2023-02-16	166
GPT-4가 내 여자친구보다 나를 더 잘 알까?	깊은바다	2023-12-12	168
OpenAI가 ChatGPT를 개발할 수 있었던 이유	깊은바다	2023-02-20	176
생성 에이전트의 자율성이 AGI의 핵심 요소	깊은바다	2023-06-25	177
구글 듀플렉스에 대한 소개	깊은바다	2018-07-30	183
죽은 아들의 AI 아바타를 만든 중국의 부모	깊은바다	2023-12-21	186
FSM과 생성 에이전트의 차이점	깊은바다	2023-11-22	190
ChatGPT 플러그인으로 만든 TODO 예제	깊은바다	2023-04-18	198
ChatGPT plugin와 Autonomous Agent, 그리고 새로운 패러다임의 시작	깊은바다	2023-06-27	204
게임 속 음성 기술	깊은바다	2018-06-13	206
네이버의 생성AI는 챗GPT가 안 부럽다 - 심층 인터뷰 기사	깊은바다	2023-02-03	207
Scale entanglement - LLM 연대기	깊은바다	2023-05-21	208
OpenAI의 샘 알트만, AGI를 향한 계획	깊은바다	2023-02-25	211

쓰기

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지