레플리
글 수 295

새로운 자연어처리 벤치마크 - SuperGLUE

조회 수 778 추천 수 0 2019.08.15 18:50:19


https://ai.facebook.com/blog/new-advances-in-natural-language-processing-to-better-connect-people/

 

 

 

GLUE(General Language Understanding Evaluation)는 SQuAD(Stanford Question Answering Dataset)와 함께 대표적인 자연어처리 벤치마크입니다. 최근 XLNet, RoBERTa 등 최신 모델들이 등장하면서 GLUE의 휴먼 베이스라인을 능가하기 시작했습니다.

 

이런 문제를 해결하기 위해 페이스북, 뉴욕대, 딥마인드, 워싱턴대가 협력하여 새로운 SuperGLUE를 공개했습니다. GLUE와 마찬가지로 10개 정도의 과제로 구성되어있습니다. 모든 과제들의 점수를 평균을 내어 측정하기 때문에, 한 가지만 아니라 범용적인 능력을 보여주는 모델이 필요합니다.

 

GLUE의 베이스라인은 BiLSTM이었습니다. 반면에 SuperGLUE는 BERT가 기본이 되었습니다. 이제 베이스라인을 넘는 것도 쉽지 않을 것 같습니다^^;

 

 

 

< SuperGLUE >

-> https://super.gluebenchmark.com/

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
꼼꼼하고 이해하기 쉬운 ELECTRA 논문 리뷰 깊은바다 2020-05-15 564
Meme 자동 생성기 깊은바다 2020-05-11 1076
딥러닝 상식추론 모델- COMET file 깊은바다 2020-05-04 548
페이스북의 일상대화 딥러닝 모델 - BlenderBot file 깊은바다 2020-05-01 1065
MS의 딥러닝 대화 모델 - DialoGPT file 깊은바다 2020-04-24 543
Dialog-BERT: 100억건의 메신저대화로 일상대화 인공지능 서비스하기 file [1] 깊은바다 2020-04-19 1159
장문의 대답을 평가하는 자연어처리 벤치마크 - TuringAdvice 깊은바다 2020-04-17 272
아마존, End-to-End 딥러닝 기술을 고객서비스에 챗봇에 적용 깊은바다 2020-03-17 528
딥러닝 질의응답 시스템인 cdQA-suite 깊은바다 2020-03-08 1208
LG 사이언스파크에서 만든 한글 MRC(기계독해) 데모 file [2] 깊은바다 2020-03-07 1005
페르소나에 따라 대화를 하는 딥러닝 챗봇 by Hugging Face 깊은바다 2020-03-06 1124
GPT2로 만든 가상의 SNS - Botnet 깊은바다 2020-02-14 519
SKT가 공개한 한글 GPT2 - KoGPT2 깊은바다 2020-02-02 5391
구글의 일상대화 딥러닝 모델 - Meena file 깊은바다 2020-01-30 1882
핑퐁의 리액션 모델 - Dialog-BERT 만들기 깊은바다 2020-01-28 1451