챗봇 딥러닝 - 러시아의 구글 얀덱스, 100B 초거대모델 무료 공개

글 수 282

러시아의 구글 얀덱스, 100B 초거대모델 무료 공개

조회 수 806 추천 수 0 2022.06.26 18:38:15

깊은바다 *.68.249.160 http://aidev.co.kr/11538

러시아의 구글인 얀덱스에서 GPT-3급의 100B 초거대모델을 공개했습니다. 아파치 라이선스로 상업적 이용도 가능합니다. 러시아어와 영어 둘 다 지원합니다. 웨이트만 다운받는데 200GB의 용량이 필요합니다. A100 800대로 65일 동안 학습했다고 합니다. A100 80G 4대 또는 V100 32G 8대의 GPU로 실행할 수 있습니다.

페이스북도 곧 OPT(Open Pretrained Transformer)라는 175B의 모델을 공개할 예정입니다. 적어도 영어에서는 초거대모델의 대중화가 이루어질 듯 합니다. 한글 버전도 빨리 공개가 되면 좋겠네요.

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
Jay Alammar의 트랜스포머 한글 번역글	깊은바다	2019-05-09	1063
한국어 LLM 민주화의 시작 KoAlpaca	깊은바다	2023-07-17	1053
Seq2Seq와 어텐션 기법을 애니메이션으로 쉽게 설명한 글	깊은바다	2018-10-12	1051
GPT-3의 다섯 가지 한계	깊은바다	2020-08-23	1049
단어를 벡터로 변환하는 Word2Vec	깊은바다	2017-05-04	1039
추천시스템이 word2vec을 만났을때	깊은바다	2018-08-22	1032
Meme 자동 생성기	깊은바다	2020-05-11	1023
딥러닝 기반 자연어처리 기법의 최근 연구 동향 [2]	깊은바다	2017-12-17	1020
딥러닝과 자연어처리의 집중 메커니즘	깊은바다	2018-09-08	1019
페르소나에 따라 대화를 하는 딥러닝 챗봇 by Hugging Face	깊은바다	2020-03-06	1007
프로그램을 작성하는 딥마인드의 알파코드	깊은바다	2022-02-04	1005
7B의 Alpaca가 175B의 GPT-3.5와 동급의 성능을 보임	깊은바다	2023-03-14	976
가짜뉴스를 생성 또는 판별하는 딥러닝 모델 - Grover	깊은바다	2019-06-01	969
OpenAI의 대화전용 딥러닝 모델 - ChatGPT	깊은바다	2022-12-02	965
End-To-End Memory Networks - 자연어 질문에 대답하는 모델 [2]	깊은바다	2017-08-21	962

쓰기

첫 페이지 3 4 5 6 7 8 9 10 11 12 끝 페이지