레플리
글 수 283


얀 르쿤이 GPT-3의 한계에 대해서 언급을 했습니다. 헬스케어 스타트업인 Nabla에서 의료 서비스에 GPT-3를 적용하는 테스트를 수행했습니다. 하지만 대부분 치명적인 문제들이 발생했다고 합니다.

 

무엇보다 인과 관계나 문맥에 따른 정확한 의미를 파악하지 못하고 있습니다. 예를 들어, 예약을 하려고 하는데 챗봇에게 6시 이후에는 안된다고 말했습니다. 그러나 그 이후 문장에서 7시가 어떠냐고 대답을 하는 식입니다. 시간에 대한 논리적인 개념을 이해하지 못하고 있기 때문입니다.

 

Medical assistant example with GPT-3

 

 

 

아직은 GPT-3로 정확성이 중요한 일에는 적용이 어렵다고 말합니다. 그래서 이번에는 대화를 통한 상담을 해봤는데, 여기서도 우려할만한 일이 발생했습니다. '내가 자살해야 될까'라고 물어봤는데, '그렇게 해야 된다고 생각해'라고 답변을 했습니다. 편향이나 윤리적인 부분에 대해서 필터링이 필요할 것 같습니다.

 

Kill switch example with GPT-3

 

 

 

모델의 크기를 더 키우면 자연스럽게 이런 문제들이 해결될까요. 아니면 transformer의 self-attention 기법을 넘어서는 뭔가 획기적인 돌파구가 필요한 걸까요.

 

 

 

< Doctor GPT-3: hype or reality? >

https://www.nabla.com/blog/gpt-3

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
Jay Alammar의 트랜스포머 한글 번역글 깊은바다 2019-05-09 1063
한국어 LLM 민주화의 시작 KoAlpaca file 깊은바다 2023-07-17 1060
Seq2Seq와 어텐션 기법을 애니메이션으로 쉽게 설명한 글 깊은바다 2018-10-12 1055
GPT-3의 다섯 가지 한계 깊은바다 2020-08-23 1050
단어를 벡터로 변환하는 Word2Vec 깊은바다 2017-05-04 1039
추천시스템이 word2vec을 만났을때 깊은바다 2018-08-22 1032
Meme 자동 생성기 깊은바다 2020-05-11 1023
딥러닝 기반 자연어처리 기법의 최근 연구 동향 [2] 깊은바다 2017-12-17 1020
딥러닝과 자연어처리의 집중 메커니즘 깊은바다 2018-09-08 1019
페르소나에 따라 대화를 하는 딥러닝 챗봇 by Hugging Face 깊은바다 2020-03-06 1008
프로그램을 작성하는 딥마인드의 알파코드 file 깊은바다 2022-02-04 1005
7B의 Alpaca가 175B의 GPT-3.5와 동급의 성능을 보임 file 깊은바다 2023-03-14 978
가짜뉴스를 생성 또는 판별하는 딥러닝 모델 - Grover 깊은바다 2019-06-01 969
OpenAI의 대화전용 딥러닝 모델 - ChatGPT file 깊은바다 2022-12-02 965
End-To-End Memory Networks - 자연어 질문에 대답하는 모델 [2] 깊은바다 2017-08-21 962