레플리
글 수 281


https://github.com/yandex/YaLM-100B

 

 

 

러시아의 구글인 얀덱스에서 GPT-3급의 100B 초거대모델을 공개했습니다. 아파치 라이선스로 상업적 이용도 가능합니다. 러시아어와 영어 둘 다 지원합니다. 웨이트만 다운받는데 200GB의 용량이 필요합니다. A100 800대로 65일 동안 학습했다고 합니다. A100 80G 4대 또는 V100 32G 8대의 GPU로 실행할 수 있습니다.

 

페이스북도 곧 OPT(Open Pretrained Transformer)라는 175B의 모델을 공개할 예정입니다. 적어도 영어에서는 초거대모델의 대중화가 이루어질 듯 합니다. 한글 버전도 빨리 공개가 되면 좋겠네요.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
GPT-4의 특징 정리 file 깊은바다 2023-03-15 1368
7B의 Alpaca가 175B의 GPT-3.5와 동급의 성능을 보임 file 깊은바다 2023-03-14 957
Together가 공개한 오픈소스 LLM - OpenChatKit 깊은바다 2023-03-12 417
ChatGPT 영어회화 깊은바다 2023-03-09 217
노암 촘스키의 ChatGPT 기고문 깊은바다 2023-03-09 316
GenAI 컨퍼런스 대담 요약 - 어떻게 AI가 비즈니스를 재편할 것인가 깊은바다 2023-03-08 318
ChatGPT로 폴 그레이엄 에세이 검색해서 대답 file 깊은바다 2023-03-03 249
ChatGPT API 정식 공개 file 깊은바다 2023-03-02 449
글쓰기 보조 서비스 JasperAI, ChatGPT 때문에 어려움 직면 깊은바다 2023-03-01 9692
네이버 케어콜의 장기기억 기능 - 맞춤 케어를 위한 기억하기 챗봇 file 깊은바다 2023-03-01 293
OpenAI의 샘 알트만, AGI를 향한 계획 깊은바다 2023-02-25 209
인공지능과 친구가 될 수 있을까요 - 이루다의 페르소나 구축 방법 file 깊은바다 2023-02-21 335
ChatGPT의 가장 큰 특징인 in-context learning file 깊은바다 2023-02-21 1332
OpenAI가 ChatGPT를 개발할 수 있었던 이유 깊은바다 2023-02-20 175
콜센터 챗봇에 ChatGPT를 적용하는 방법 깊은바다 2023-02-20 321