레플리
글 수 281


open sourcing language models concept

 

https://www.technologyreview.com/2022/05/03/1051691/meta-ai-large-language-model-gpt3-ethics-huggingface-transparency/

 

 

 

놀라운 사건이 일어났습니다. 메타(구 페이스북)가 OPT(Open Pretrained Transformer)라는 모델을 무료로 공개한다고 결정했습니다. 무려 GPT-3와 동일한 175B의 파라미터를 가지고 있습니다. 지금까지는 EleutherAI가 발표한 20B의 GPT-NeoX가 가장 큰 오픈 모델이었습니다. 또한 OPT 개발과정이 자세히 적혀있는 100페이지 분량의 logbook도 함께 공개한다고 합니다. 이를 통해 초거대모델 분야에 큰 파장을 가져올 것 같습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
Word2Vec 테스트 사이트 file 깊은바다 2019-01-13 1182
쉽게 씌어진 Word2Vec [2] 깊은바다 2017-12-25 1177
딥러닝 기반 자연어 언어모델 BERT - Colab 실습 코드 포함 file 깊은바다 2019-09-02 1177
최신 자연어처리 모델 소개 file 깊은바다 2022-07-11 1172
커뮤니케이션과 AI - Multi-channel CNN을 이용한 한국어 감성분석 깊은바다 2018-11-22 1156
퓨샷(few-shot) 러닝에 최적화된 GPT3 모델 file 깊은바다 2020-05-30 1154
LLM 챗봇의 특징 2가지 - RAG와 Function 깊은바다 2023-07-06 1150
딥러닝 질의응답 시스템인 cdQA-suite 깊은바다 2020-03-08 1141
유저 피드백을 받아 지속적으로 학습을 하는 챗봇 - BlenderBot 3 file 깊은바다 2022-08-06 1135
다이나믹 메모리 네트워크 정리 file 깊은바다 2018-09-29 1134
딥러닝을 이용한 자연어 처리 입문 - 위키독스 깊은바다 2018-09-21 1100
Dialog-BERT: 100억건의 메신저대화로 일상대화 인공지능 서비스하기 file [1] 깊은바다 2020-04-19 1091
딥러닝으로 욕설 탐지하기 file [2] 깊은바다 2018-05-04 1073
Jay Alammar의 트랜스포머 한글 번역글 깊은바다 2019-05-09 1058
WizardLM의 Evol-instruct로 직접 한글 데이터셋을 만든 모델 file 깊은바다 2023-06-19 1058