레플리
글 수 295


https://github.com/yandex/YaLM-100B

 

 

 

러시아의 구글인 얀덱스에서 GPT-3급의 100B 초거대모델을 공개했습니다. 아파치 라이선스로 상업적 이용도 가능합니다. 러시아어와 영어 둘 다 지원합니다. 웨이트만 다운받는데 200GB의 용량이 필요합니다. A100 800대로 65일 동안 학습했다고 합니다. A100 80G 4대 또는 V100 32G 8대의 GPU로 실행할 수 있습니다.

 

페이스북도 곧 OPT(Open Pretrained Transformer)라는 175B의 모델을 공개할 예정입니다. 적어도 영어에서는 초거대모델의 대중화가 이루어질 듯 합니다. 한글 버전도 빨리 공개가 되면 좋겠네요.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
WizardLM의 Evol-instruct로 직접 한글 데이터셋을 만든 모델 file 깊은바다 2023-06-19 1585
세콰이어캐피탈에서 전망하는 LLM의 미래 깊은바다 2023-06-19 316
지금 생성AI는 과도기일 뿐 file 깊은바다 2023-06-19 429
카카오브레인 김일두 대표님의 글 - 생성AI가 비즈니스를 어떻게 혁신할까 깊은바다 2023-06-15 278
ChatGPT API에서도 플러그인과 동일한 기능을 - ChatGPT Function file 깊은바다 2023-06-14 465
내가 AI를 직접 가르치고 키우는 반려지능의 시대 file 깊은바다 2023-05-31 1322
LLM의 시대에도 자연어처리를 배워야할까 깊은바다 2023-05-29 397
아카라이브 AI 언어모델 로컬 채널 file 깊은바다 2023-05-23 713
Scale entanglement - LLM 연대기 깊은바다 2023-05-21 271
ChatGPT iOS 버전 출시 file 깊은바다 2023-05-19 160
GPT-3.5와 하이퍼클로바의 한국어 대결 file 깊은바다 2023-05-12 365
인플루언서의 목소리 클론과 GPT-4로 만든 아바타 서비스 - Caryn.ai 깊은바다 2023-05-11 701
오픈소스 LLM이 ChatGPT를 대체할 수 있을 깊은바다 2023-05-05 337
AutoGPT 사용기 - 다른 에이전트 생성 능력 file 깊은바다 2023-04-23 391
생성 에이전트를 ChatGPT 프롬프트만으로 구현 file 깊은바다 2023-04-20 326