챗봇 딥러닝 - 새로운 자연어처리 벤치마크

글 수 283

새로운 자연어처리 벤치마크 - SuperGLUE

조회 수 703 추천 수 0 2019.08.15 18:50:19

깊은바다 *.68.247.186 http://aidev.co.kr/8151

https://ai.facebook.com/blog/new-advances-in-natural-language-processing-to-better-connect-people/

GLUE(General Language Understanding Evaluation)는 SQuAD(Stanford Question Answering Dataset)와 함께 대표적인 자연어처리 벤치마크입니다. 최근 XLNet, RoBERTa 등 최신 모델들이 등장하면서 GLUE의 휴먼 베이스라인을 능가하기 시작했습니다.

이런 문제를 해결하기 위해 페이스북, 뉴욕대, 딥마인드, 워싱턴대가 협력하여 새로운 SuperGLUE를 공개했습니다. GLUE와 마찬가지로 10개 정도의 과제로 구성되어있습니다. 모든 과제들의 점수를 평균을 내어 측정하기 때문에, 한 가지만 아니라 범용적인 능력을 보여주는 모델이 필요합니다.

GLUE의 베이스라인은 BiLSTM이었습니다. 반면에 SuperGLUE는 BERT가 기본이 되었습니다. 이제 베이스라인을 넘는 것도 쉽지 않을 것 같습니다^^;

< SuperGLUE >

-> https://super.gluebenchmark.com/

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
구글의 초거대모델 PaLM의 추론과 상식 능력	깊은바다	2022-05-20	838
DALL-E를 능가하는 OpenAI의 GLIDE	깊은바다	2021-12-27	836
네이버 뉴스 댓글로 사전훈련한 구어체 모델 - KcBERT	깊은바다	2020-07-20	813
러시아의 구글 얀덱스, 100B 초거대모델 무료 공개	깊은바다	2022-06-26	806
ChatGPT 프롬프트 엔지니어링 - 다양한 말투로 대답하기	깊은바다	2023-02-17	802
GPT-3 패러다임을 바꿀 미친 성능의 인공지능 등장 및 활용 사례 10가지	깊은바다	2020-09-14	799
ChatGPT와 유사한 서비스 - Chatsonic	깊은바다	2023-01-09	794
GPT3로 하는 리액트 프로그래밍	깊은바다	2020-07-19	769
HyperCLOVA로 만드는 캐릭터 챗봇	깊은바다	2021-11-26	761
LLM이 서로 협력하여 프로그램을 개발 - ChatDev	깊은바다	2023-08-16	751
GPT3가 상식을 가지고 있을까	깊은바다	2020-07-24	741
Llama 2의 RLHF 구현 방법	깊은바다	2023-07-19	727
LLM의 창발적인 현상인 CoT(Chain of Thouht) 소개	깊은바다	2023-07-27	708
RAG를 사용한 페르소나 챗봇 - ChatHaruhi	깊은바다	2023-10-17	708
GPT-3를 헬스케어 서비스에 적용했을 때의 문제점들	깊은바다	2020-11-04	707

쓰기

첫 페이지 5 6 7 8 9 10 11 12 13 14 끝 페이지