챗봇 딥러닝 - Llama 2의 RLHF 구현 방법

글 수 295

Llama 2의 RLHF 구현 방법

조회 수 934 추천 수 0 2023.07.19 20:31:41

깊은바다 *.68.249.160 http://aidev.co.kr/13228

https://www.facebook.com/rosinality/posts/6768879263164448

Llama 2의 가장 큰 특징은 역시 RLHF입니다. 이 과정에 대해서 자세히 설명한 글입니다. RLHF의 1단계는 SFT입니다. 사람이 질문에 대한 정답을 작성하고 이를 지도학습으로 배웁니다. 2단계는 사람이 모델이 생성한 답변에 점수를 매겨 reward model을 만듭니다. 3단계는 이를 사용해서 모델이 스스로 최적의 문장을 만드는 방법을 학습합니다. SFT보다 RL이 모델의 성능을 높이는데 더 효과적이라고 합니다. 직접 소설을 쓰는 것보다 좋은 소설을 판별하는게 더 쉬운 것처럼요.

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
RAG 아키텍처를 위한 임베딩 모델의 선택에 대해	깊은바다	2023-09-14	764
LLM의 미래는 자율행동과 멀티 에이전트	깊은바다	2023-08-30	441
LLM이 서로 협력하여 프로그램을 개발 - ChatDev	깊은바다	2023-08-16	1081
GPT-4에 CoT 프롬프를 적용하여 2023 수능 국어 1등급 달성	깊은바다	2023-08-08	860
LLM의 창발적인 현상인 CoT(Chain of Thouht) 소개	깊은바다	2023-07-27	1056
RAG 아키텍처의 이해	깊은바다	2023-07-23	1528
GPT-4 세부구조에 대한 정보 유출	깊은바다	2023-07-20	617
Llama 2의 RLHF 구현 방법	깊은바다	2023-07-19	934
한국어 LLM 민주화의 시작 KoAlpaca	깊은바다	2023-07-17	1367
레포트를 써주는 LLM - GPT Researcher	깊은바다	2023-07-13	713
LLM 챗봇의 특징 2가지 - RAG와 Function	깊은바다	2023-07-06	1602
RAG(Retrieval-Augmented Generation) - LLM의 환각을 줄이는 방법	깊은바다	2023-07-04	10874
Generative AI — 시장 구조, 기회, moat에 대한 몇 가지 생각	깊은바다	2023-06-27	450
ChatGPT plugin와 Autonomous Agent, 그리고 새로운 패러다임의 시작	깊은바다	2023-06-27	351
생성 에이전트의 자율성이 AGI의 핵심 요소	깊은바다	2023-06-25	401

쓰기

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지