레플리
글 수 283


https://github.com/yandex/YaLM-100B

 

 

 

러시아의 구글인 얀덱스에서 GPT-3급의 100B 초거대모델을 공개했습니다. 아파치 라이선스로 상업적 이용도 가능합니다. 러시아어와 영어 둘 다 지원합니다. 웨이트만 다운받는데 200GB의 용량이 필요합니다. A100 800대로 65일 동안 학습했다고 합니다. A100 80G 4대 또는 V100 32G 8대의 GPU로 실행할 수 있습니다.

 

페이스북도 곧 OPT(Open Pretrained Transformer)라는 175B의 모델을 공개할 예정입니다. 적어도 영어에서는 초거대모델의 대중화가 이루어질 듯 합니다. 한글 버전도 빨리 공개가 되면 좋겠네요.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
콜센터 챗봇에 ChatGPT를 적용하는 방법 깊은바다 2023-02-20 327
OpenAI, 성능은 높아지고 가격은 싸진 새로운 모델 공개 file 깊은바다 2024-01-26 329
AutoGPT 사용기 - 다른 에이전트 생성 능력 file 깊은바다 2023-04-23 331
GPT-4 수능 국어영역에서 3등급(상위 17%) 달성 깊은바다 2023-03-21 332
인공지능과 친구가 될 수 있을까요 - 이루다의 페르소나 구축 방법 file 깊은바다 2023-02-21 340
ChatGPT API에서도 플러그인과 동일한 기능을 - ChatGPT Function file 깊은바다 2023-06-14 341
ChatGPT를 앱스토어 같은 플랫폼으로 확장 - ChatGPT 플러그인 file 깊은바다 2023-03-24 354
GPT-3를 활용하여 주석을 코드로 바꿔주는 GitHub Copilot 깊은바다 2021-06-30 356
지금 생성AI는 과도기일 뿐 file 깊은바다 2023-06-19 359
딥러닝으로 상식 구축 - Event2Mind 깊은바다 2018-09-14 373
딥러닝을 활용한 뉴스 메타 태깅 깊은바다 2019-08-26 379
Private sLLM - 어떻게 만들고 어떻게 배포할까? file 깊은바다 2023-12-18 390
스탠포드 자연어처리 강의 - The Limits and Future of NLP 깊은바다 2018-08-30 395
페이지(PAIGE)를 만드는 사람들 - 자연어처리 기법 깊은바다 2018-05-26 397
딥러닝으로 동네생활 게시글 필터링하기 깊은바다 2020-10-06 398