레플리
글 수 293

GPT-4 세부구조에 대한 정보 유출

조회 수 541 추천 수 0 2023.07.20 11:33:43


https://latte4me.com/676-2/

 

 

 

GPT-4의 세부구조에 대한 루머가 또 유출되었습니다. 확실하지는 않지만 어느정도 신빙성이 있어 보입니다.

  • 파라미터수 1.7조~2조개로 GPT-3(1,750억개)의 10배

  • 16개의 MOE(Mixture of Experts) 사용. 각 MOE 당 1,000억개의 파라미터 보유. MOE는 전문분야에 최적화된 모델을 여러개 만들고 질문이 들어오면 해당하는 모델을 사용하는 방식.

  • 25,000개의 A100을 사용해서 100일 동안 학습. 총 8천억원 소요로 GPT-3 학습비용의 3배.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
LLM이 서로 협력하여 프로그램을 개발 - ChatDev file 깊은바다 2023-08-16 934
GPT-4에 CoT 프롬프를 적용하여 2023 수능 국어 1등급 달성 file 깊은바다 2023-08-08 777
LLM의 창발적인 현상인 CoT(Chain of Thouht) 소개 file 깊은바다 2023-07-27 968
RAG 아키텍처의 이해 깊은바다 2023-07-23 1440
GPT-4 세부구조에 대한 정보 유출 깊은바다 2023-07-20 541
Llama 2의 RLHF 구현 방법 깊은바다 2023-07-19 841
한국어 LLM 민주화의 시작 KoAlpaca file 깊은바다 2023-07-17 1263
레포트를 써주는 LLM - GPT Researcher file 깊은바다 2023-07-13 622
LLM 챗봇의 특징 2가지 - RAG와 Function 깊은바다 2023-07-06 1501
RAG(Retrieval-Augmented Generation) - LLM의 환각을 줄이는 방법 file 깊은바다 2023-07-04 10689
Generative AI — 시장 구조, 기회, moat에 대한 몇 가지 생각 깊은바다 2023-06-27 365
ChatGPT plugin와 Autonomous Agent, 그리고 새로운 패러다임의 시작 깊은바다 2023-06-27 266
생성 에이전트의 자율성이 AGI의 핵심 요소 file 깊은바다 2023-06-25 259
WizardLM의 Evol-instruct로 직접 한글 데이터셋을 만든 모델 file 깊은바다 2023-06-19 1557
세콰이어캐피탈에서 전망하는 LLM의 미래 깊은바다 2023-06-19 308