챗봇 딥러닝 - GPT-3보다 3배 더 큰 구글의 초거대모델, PaLM

글 수 284

GPT-3보다 3배 더 큰 구글의 초거대모델, PaLM

조회 수 1408 추천 수 0 2022.04.07 01:24:12

깊은바다 *.68.249.160 http://aidev.co.kr/11284

Screenshot 2022-04-01 5.25.47 PM.png

https://ai.googleblog.com/2022/04/pathways-language-model-palm-scaling-to.html

구글에서 새로운 초거대모델인 PaLM(Pathways Language Model)을 공개했습니다. GPT-3는 1750억 파라미터입니다. PaLM은 그 3배인 5400억 파라미터를 가지고 있습니다. 5300억 파라미터인 MS의 Megatron-Turing NLG보다 약간 더 큰 편입니다. 하지만 현존하는 모든 초거대모델보다 뛰어난 성능을 보인다고 합니다.

BIG-bench(Beyond the Imitation Game Benchmark)는 최근에 나온 자연어처리 벤치마크입니다. Imitation Game은 튜링테스트의 원래 제목인데요. 말 그대로 진짜 사람인지 분간할 만큼 난이도가 있는 문제들로 구성되어 있습니다. 그런데 PaLM이 여기서 평균적인 사람보다 더 높은 점수를 달성했습니다.

흥미로운 사실은 PaLM의 성능이 아직 한계에 도달하지 않았다는 점입니다. 지금과 같은 transformer 구조로도 파라미터 크기를 더 키울 여지가 남았다는 뜻입니다.

이 게시물을

Screenshot 2022-04-01 5.25.47 PM.png [File Size:86.9KB/Download:40]

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
LG 사이언스파크에서 만든 한글 MRC(기계독해) 데모 [2]	깊은바다	2020-03-07	933
딥러닝 질의응답 시스템인 cdQA-suite	깊은바다	2020-03-08	1144
아마존, End-to-End 딥러닝 기술을 고객서비스에 챗봇에 적용	깊은바다	2020-03-17	472
장문의 대답을 평가하는 자연어처리 벤치마크 - TuringAdvice	깊은바다	2020-04-17	216
Dialog-BERT: 100억건의 메신저대화로 일상대화 인공지능 서비스하기 [1]	깊은바다	2020-04-19	1093
MS의 딥러닝 대화 모델 - DialoGPT	깊은바다	2020-04-24	457
페이스북의 일상대화 딥러닝 모델 - BlenderBot	깊은바다	2020-05-01	950
딥러닝 상식추론 모델- COMET	깊은바다	2020-05-04	466
Meme 자동 생성기	깊은바다	2020-05-11	1023
꼼꼼하고 이해하기 쉬운 ELECTRA 논문 리뷰	깊은바다	2020-05-15	512
인라이플의 한글 BERT 대형모델	깊은바다	2020-05-18	4246
KoGPT2로 한국어 노래 가사 생성하기	깊은바다	2020-05-21	1857
퓨샷(few-shot) 러닝에 최적화된 GPT3 모델	깊은바다	2020-05-30	1157
GPT2를 테스트해볼 수 있는 사이트 - Talk to Transformer	깊은바다	2020-06-05	626
GPT3 유료화 기능 소개 영상	깊은바다	2020-06-15	915

쓰기

첫 페이지 3 4 5 6 7 8 9 10 11 12 끝 페이지