챗봇 딥러닝 - LLM의 창발적인 현상인 CoT(Chain of Thouht) 소개

글 수 284

LLM의 창발적인 현상인 CoT(Chain of Thouht) 소개

조회 수 718 추천 수 0 2023.07.27 18:56:42

깊은바다 *.32.218.234 http://aidev.co.kr/13249

https://brunch.co.kr/@gentlepie/62

LLM은 모델의 크기가 커지면서 개발자도 예측하지 못한 창발적인 현상이 생겼습니다. 그중 하나가 CoT(Chain of thought)입니다. 이에 대해 간략히 설명한 글입니다.

GPT-3에서 Let's think step by step이란 프롬프트만 추가해도 정확도가 크게 향상된다는 논문도 있었습니다. 이런 단계를 사람이 명시적으로 알려주면 더욱 효과적입니다.

LLM은 이렇게 task를 단계적으로 나눌 때 더 잘 동작하는 것 같습니다. AutoGPT 역시 CoT와 비슷하게 해야할 일을 먼저 순서대로 나열합니다. 그리고 각각의 일을 하나씩 이어서 실행하고 최종 결과를 사용자에게 전달합니다. 사실 이건 CoT라기 보다는 Planning에 가깝지만요.

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
BERT를 이용한 챗봇 구현	깊은바다	2019-01-07	4113
GPT-3 데모 사이트 - gpt3demo.com	깊은바다	2021-07-13	3707
한국어 자연어처리를 위한 딥러닝	깊은바다	2018-02-14	3652
하이퍼클로바 활용예 및 사용가이드	깊은바다	2022-03-05	3570
한국어로 대화하는 생성 모델의 학습을 위한 여정 - Transformer와 GPT2	깊은바다	2020-08-13	3566
KoGPT2를 파인튜닝하여 만든 챗봇	깊은바다	2020-06-23	3534
구글의 딥러닝 대화 알고리즘	깊은바다	2016-03-25	3356
여러 한국어 GPT 모델들 [1]	봄눈	2021-11-21	3338
네이버 영화 리뷰 감정 분석	깊은바다	2018-09-07	3293
욕설을 찾는 BERT 모델 - Purifier	깊은바다	2019-08-28	3274
딥러닝으로 챗봇 만들기	깊은바다	2017-05-03	3173
네이버의 초거대모델인 하이퍼클로바 사용 후기	깊은바다	2022-02-14	3171
6B 파라미터의 GPT-J_6B 오픈소스 모델	깊은바다	2021-07-01	3158
케라스로 만든 한글 Seq2Seq 챗봇 소스코드	깊은바다	2019-07-13	3091
구글의 Transformer 신경망 모델 [2]	깊은바다	2018-10-13	3023

쓰기

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지