레플리
글 수 287


https://github.com/yandex/YaLM-100B

 

 

 

러시아의 구글인 얀덱스에서 GPT-3급의 100B 초거대모델을 공개했습니다. 아파치 라이선스로 상업적 이용도 가능합니다. 러시아어와 영어 둘 다 지원합니다. 웨이트만 다운받는데 200GB의 용량이 필요합니다. A100 800대로 65일 동안 학습했다고 합니다. A100 80G 4대 또는 V100 32G 8대의 GPU로 실행할 수 있습니다.

 

페이스북도 곧 OPT(Open Pretrained Transformer)라는 175B의 모델을 공개할 예정입니다. 적어도 영어에서는 초거대모델의 대중화가 이루어질 듯 합니다. 한글 버전도 빨리 공개가 되면 좋겠네요.

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
Scale entanglement - LLM 연대기 깊은바다 2023-05-21 208
ChatGPT iOS 버전 출시 file 깊은바다 2023-05-19 99
GPT-3.5와 하이퍼클로바의 한국어 대결 file 깊은바다 2023-05-12 319
인플루언서의 목소리 클론과 GPT-4로 만든 아바타 서비스 - Caryn.ai 깊은바다 2023-05-11 572
오픈소스 LLM이 ChatGPT를 대체할 수 있을 깊은바다 2023-05-05 296
AutoGPT 사용기 - 다른 에이전트 생성 능력 file 깊은바다 2023-04-23 332
생성 에이전트를 ChatGPT 프롬프트만으로 구현 file 깊은바다 2023-04-20 269
GPT가 스스로 계획을 세워서 실행한다면 - AutoGPT와 LangChain file 깊은바다 2023-04-18 1472
ChatGPT 플러그인으로 만든 TODO 예제 file 깊은바다 2023-04-18 201
한국어 초거대AI가 필요한 이유 - 토크나이저와 한국어 콘텐츠 깊은바다 2023-04-17 272
심즈와 비슷한 가상세계를 ChatGPT로 구현 - 생성 에이전트(Generative Agents) file 깊은바다 2023-04-14 1723
ChatGPT 플러그인 전략 및 생태계 변화 전망 file 깊은바다 2023-04-09 1831
ChatGPT 원티드 플러그인 사용 화면 file 깊은바다 2023-04-07 279
GPT-3, InstructGPT, GPT-3.5, ChatGPT의 차이점 깊은바다 2023-04-05 1419
ChatGPT의 오픈소스 버전 - ColossalChat file 깊은바다 2023-03-30 506