레플리
글 수 293


https://github.com/yandex/YaLM-100B

 

 

 

러시아의 구글인 얀덱스에서 GPT-3급의 100B 초거대모델을 공개했습니다. 아파치 라이선스로 상업적 이용도 가능합니다. 러시아어와 영어 둘 다 지원합니다. 웨이트만 다운받는데 200GB의 용량이 필요합니다. A100 800대로 65일 동안 학습했다고 합니다. A100 80G 4대 또는 V100 32G 8대의 GPU로 실행할 수 있습니다.

 

페이스북도 곧 OPT(Open Pretrained Transformer)라는 175B의 모델을 공개할 예정입니다. 적어도 영어에서는 초거대모델의 대중화가 이루어질 듯 합니다. 한글 버전도 빨리 공개가 되면 좋겠네요.

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
WizardLM의 Evol-instruct로 직접 한글 데이터셋을 만든 모델 file 깊은바다 2023-06-19 1666
세콰이어캐피탈에서 전망하는 LLM의 미래 깊은바다 2023-06-19 366
지금 생성AI는 과도기일 뿐 file 깊은바다 2023-06-19 478
카카오브레인 김일두 대표님의 글 - 생성AI가 비즈니스를 어떻게 혁신할까 깊은바다 2023-06-15 325
ChatGPT API에서도 플러그인과 동일한 기능을 - ChatGPT Function file 깊은바다 2023-06-14 515
내가 AI를 직접 가르치고 키우는 반려지능의 시대 file 깊은바다 2023-05-31 1402
LLM의 시대에도 자연어처리를 배워야할까 깊은바다 2023-05-29 442
아카라이브 AI 언어모델 로컬 채널 file 깊은바다 2023-05-23 782
Scale entanglement - LLM 연대기 깊은바다 2023-05-21 319
ChatGPT iOS 버전 출시 file 깊은바다 2023-05-19 228
GPT-3.5와 하이퍼클로바의 한국어 대결 file 깊은바다 2023-05-12 411
오픈소스 LLM이 ChatGPT를 대체할 수 있을 깊은바다 2023-05-05 381
AutoGPT 사용기 - 다른 에이전트 생성 능력 file 깊은바다 2023-04-23 435
생성 에이전트를 ChatGPT 프롬프트만으로 구현 file 깊은바다 2023-04-20 369
GPT가 스스로 계획을 세워서 실행한다면 - AutoGPT와 LangChain file 깊은바다 2023-04-18 1721