레플리
글 수 284

GPT-3보다 3배 더 큰 구글의 초거대모델, PaLM

조회 수 1408 추천 수 0 2022.04.07 01:24:12


Screenshot 2022-04-01 5.25.47 PM.png

 

https://ai.googleblog.com/2022/04/pathways-language-model-palm-scaling-to.html

 

 

 

구글에서 새로운 초거대모델인 PaLM(Pathways Language Model)을 공개했습니다. GPT-3는 1750억 파라미터입니다. PaLM은 그 3배인 5400억 파라미터를 가지고 있습니다. 5300억 파라미터인 MS의 Megatron-Turing NLG보다 약간 더 큰 편입니다. 하지만 현존하는 모든 초거대모델보다 뛰어난 성능을 보인다고 합니다.

 

BIG-bench(Beyond the Imitation Game Benchmark)는 최근에 나온 자연어처리 벤치마크입니다. Imitation Game은 튜링테스트의 원래 제목인데요. 말 그대로 진짜 사람인지 분간할 만큼 난이도가 있는 문제들로 구성되어 있습니다. 그런데 PaLM이 여기서 평균적인 사람보다 더 높은 점수를 달성했습니다.

 

흥미로운 사실은 PaLM의 성능이 아직 한계에 도달하지 않았다는 점입니다. 지금과 같은 transformer 구조로도 파라미터 크기를 더 키울 여지가 남았다는 뜻입니다.

 

List of Articles
제목 글쓴이 날짜sort 조회 수
LG 사이언스파크에서 만든 한글 MRC(기계독해) 데모 file [2] 깊은바다 2020-03-07 933
딥러닝 질의응답 시스템인 cdQA-suite 깊은바다 2020-03-08 1144
아마존, End-to-End 딥러닝 기술을 고객서비스에 챗봇에 적용 깊은바다 2020-03-17 472
장문의 대답을 평가하는 자연어처리 벤치마크 - TuringAdvice 깊은바다 2020-04-17 216
Dialog-BERT: 100억건의 메신저대화로 일상대화 인공지능 서비스하기 file [1] 깊은바다 2020-04-19 1093
MS의 딥러닝 대화 모델 - DialoGPT file 깊은바다 2020-04-24 457
페이스북의 일상대화 딥러닝 모델 - BlenderBot file 깊은바다 2020-05-01 950
딥러닝 상식추론 모델- COMET file 깊은바다 2020-05-04 466
Meme 자동 생성기 깊은바다 2020-05-11 1023
꼼꼼하고 이해하기 쉬운 ELECTRA 논문 리뷰 깊은바다 2020-05-15 512
인라이플의 한글 BERT 대형모델 깊은바다 2020-05-18 4246
KoGPT2로 한국어 노래 가사 생성하기 깊은바다 2020-05-21 1857
퓨샷(few-shot) 러닝에 최적화된 GPT3 모델 file 깊은바다 2020-05-30 1157
GPT2를 테스트해볼 수 있는 사이트 - Talk to Transformer file 깊은바다 2020-06-05 626
GPT3 유료화 기능 소개 영상 깊은바다 2020-06-15 915