글 수 161

6B 파라미터의 GPT-J_6B 오픈소스 모델

조회 수 165 추천 수 0 2021.07.01 12:18:15


 

https://arankomatsuzaki.wordpress.com/2021/06/04/gpt-j/

 

 

 

EleutherAI는 오픈소스 GPT-3인 GPT-Neo를 공개했습니다. GPT-2의 파라미터가 1.5B, GPT-3는 175B입니다. GPT-Neo는 현재까지 2.7B까지 나왔습니다.

 

이번에는 6B 사이즈인 GPT-J-6B를 내놓았습니다. 800GB 텍스트에서 400B개의 토큰으로 학습했습니다. TPU v3-256으로 5주가 걸렸다고 합니다. 시간당 192$이니 192x5x7x24=161,280$입니다. 대충 2억정도 들었네요.

 

GPT-Neo와의 가장 큰 차이점은 제로샷이 된다는 것입니다. 별도의 파인튜닝 없이도 질문만 넣으면 다양한 태스크가 가능합니다. 샘플 아웃풋을 보면 수학계산, 기계독해(MRC), 코딩 등의 예를 보여주고 있습니다.

 

 

 

< 테스트 페이지 >

https://6b.eleuther.ai/

 

< GitHub >

https://github.com/kingoflolz/mesh-transformer-jax

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
딥러닝을 사용한 챗봇 개발방법 정리 file 깊은바다 2018-02-03 21884
딥러닝 RNN으로 구현한 챗봇 깊은바다 2017-08-01 7588
문장을 학습하는 딥러닝 RNN의 Seq2Seq 모델 설명 file 깊은바다 2017-09-15 7060
챗봇에 딥러닝 학습을 적용하기 어려운 이유 file 깊은바다 2018-03-23 5945
문장을 입력하면 비슷한 짤방을 보여주는 프로젝트 file 깊은바다 2019-01-28 5739
SKT가 공개한 한글 GPT2 - KoGPT2 깊은바다 2020-02-02 4856
챗봇에서 유사한 문장 자동인식 방법 file 깊은바다 2018-04-27 4496
사전학습을 통한 구글의 자연어처리 언어 모델 - BERT file 깊은바다 2018-11-03 3998
BERT를 이용한 챗봇 구현 file 깊은바다 2019-01-07 3717
한국어 자연어처리를 위한 딥러닝 깊은바다 2018-02-14 3534
네이버 영화리뷰 감정분석 with Hugging Face BERT file 깊은바다 2019-12-17 3405
구글의 딥러닝 대화 알고리즘 깊은바다 2016-03-25 3197
네이버 영화 리뷰 감정 분석 깊은바다 2018-09-07 3181
KoGPT2, KoBERT, KoELECTRA로 만든 심리상담 챗봇 file 깊은바다 2020-08-05 3083
딥러닝으로 챗봇 만들기 깊은바다 2017-05-03 3029