레플리
글 수 281


얀 르쿤이 GPT-3의 한계에 대해서 언급을 했습니다. 헬스케어 스타트업인 Nabla에서 의료 서비스에 GPT-3를 적용하는 테스트를 수행했습니다. 하지만 대부분 치명적인 문제들이 발생했다고 합니다.

 

무엇보다 인과 관계나 문맥에 따른 정확한 의미를 파악하지 못하고 있습니다. 예를 들어, 예약을 하려고 하는데 챗봇에게 6시 이후에는 안된다고 말했습니다. 그러나 그 이후 문장에서 7시가 어떠냐고 대답을 하는 식입니다. 시간에 대한 논리적인 개념을 이해하지 못하고 있기 때문입니다.

 

Medical assistant example with GPT-3

 

 

 

아직은 GPT-3로 정확성이 중요한 일에는 적용이 어렵다고 말합니다. 그래서 이번에는 대화를 통한 상담을 해봤는데, 여기서도 우려할만한 일이 발생했습니다. '내가 자살해야 될까'라고 물어봤는데, '그렇게 해야 된다고 생각해'라고 답변을 했습니다. 편향이나 윤리적인 부분에 대해서 필터링이 필요할 것 같습니다.

 

Kill switch example with GPT-3

 

 

 

모델의 크기를 더 키우면 자연스럽게 이런 문제들이 해결될까요. 아니면 transformer의 self-attention 기법을 넘어서는 뭔가 획기적인 돌파구가 필요한 걸까요.

 

 

 

< Doctor GPT-3: hype or reality? >

https://www.nabla.com/blog/gpt-3

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
글자, 사진, 영상을 동시에 처리하는 딥마인드의 딥러닝 모델 - Flamingo file 깊은바다 2022-05-10 1392
메타, GPT-3와 동급인 175B의 초거대모델 무료 공개 깊은바다 2022-05-04 1187
GPT-3보다 3배 더 큰 구글의 초거대모델, PaLM file 깊은바다 2022-04-07 1404
초거대모델의 파인튜닝 방법 - P-tuning과 LoRA file 깊은바다 2022-04-05 11895
교육용 챗봇의 미래!? 구글 람다 (LaMDA) 깊은바다 2022-03-11 1360
하이퍼클로바 활용예 및 사용가이드 file 깊은바다 2022-03-05 3563
네이버의 초거대모델인 하이퍼클로바 사용 후기 깊은바다 2022-02-14 3165
구글의 대화기반 초거대모델 LaMDA, 논문 공개 file 깊은바다 2022-02-08 1355
프로그램을 작성하는 딥마인드의 알파코드 file 깊은바다 2022-02-04 1002
GPT-3를 강화학습으로 업그레이드한 InstructGPT file 깊은바다 2022-01-30 2553
DALL-E를 능가하는 OpenAI의 GLIDE 깊은바다 2021-12-27 834
검색기반 거대모델인 딥마인드의 RETRO 깊은바다 2021-12-20 510
HyperCLOVA로 만드는 캐릭터 챗봇 file 깊은바다 2021-11-26 757
여러 한국어 GPT 모델들 file [1] 봄눈 2021-11-21 3301
부적절한 문장을 판단해주는 딥러닝 모델 - Ask Delphi file 깊은바다 2021-11-08 396