레플리
글 수 283

새로운 자연어처리 벤치마크 - SuperGLUE

조회 수 703 추천 수 0 2019.08.15 18:50:19


https://ai.facebook.com/blog/new-advances-in-natural-language-processing-to-better-connect-people/

 

 

 

GLUE(General Language Understanding Evaluation)는 SQuAD(Stanford Question Answering Dataset)와 함께 대표적인 자연어처리 벤치마크입니다. 최근 XLNet, RoBERTa 등 최신 모델들이 등장하면서 GLUE의 휴먼 베이스라인을 능가하기 시작했습니다.

 

이런 문제를 해결하기 위해 페이스북, 뉴욕대, 딥마인드, 워싱턴대가 협력하여 새로운 SuperGLUE를 공개했습니다. GLUE와 마찬가지로 10개 정도의 과제로 구성되어있습니다. 모든 과제들의 점수를 평균을 내어 측정하기 때문에, 한 가지만 아니라 범용적인 능력을 보여주는 모델이 필요합니다.

 

GLUE의 베이스라인은 BiLSTM이었습니다. 반면에 SuperGLUE는 BERT가 기본이 되었습니다. 이제 베이스라인을 넘는 것도 쉽지 않을 것 같습니다^^;

 

 

 

< SuperGLUE >

-> https://super.gluebenchmark.com/

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
5배 싸진 클로바X의 경량화 모델 - HCX-DASH file 깊은바다 2024-04-26 32
MS의 CTO인 Kevin Scott과 OpenAI와의 협업 깊은바다 2023-03-17 82
ChatGPT 2달만에 누적 사용자 1억명 돌파 깊은바다 2023-02-03 89
ChatGPT iOS 버전 출시 file 깊은바다 2023-05-19 98
ChatGPT가 Stack Overflow를 대체할까 깊은바다 2023-02-16 105
클로바X의 사용량 제한 - QPM과 TPM 깊은바다 2024-04-01 105
구글의 초거대AI LaMDA, 과연 의식을 가지고 있을까 깊은바다 2023-02-17 107
Pi를 만든 Inflection AI, MS로 대거 이직한 이유 깊은바다 2024-03-25 113
MS의 목적은 ChatGPT로 구글이 장악한 검색시장 자체를 무너뜨리는 것 깊은바다 2023-02-11 122
ChatGPT와 대화 인공지능의 미래 깊은바다 2023-02-17 124
와튼스쿨 에단 몰릭 교수의 Bing 사용 후기 깊은바다 2023-02-19 136
딥마인드의 데미스 하사비스, AGI는 신중한 접근 필요 깊은바다 2023-03-22 147
구글, ChatGPT의 라이벌인 Bard 공개 file 깊은바다 2023-02-07 148
MS, Bing과 Edge에 ChatGPT 통합 file 깊은바다 2023-02-08 154
MS 직원의 GPT 기반 콜센터 챗봇 사용기 깊은바다 2023-02-18 158