레플리
글 수 282


얀 르쿤이 GPT-3의 한계에 대해서 언급을 했습니다. 헬스케어 스타트업인 Nabla에서 의료 서비스에 GPT-3를 적용하는 테스트를 수행했습니다. 하지만 대부분 치명적인 문제들이 발생했다고 합니다.

 

무엇보다 인과 관계나 문맥에 따른 정확한 의미를 파악하지 못하고 있습니다. 예를 들어, 예약을 하려고 하는데 챗봇에게 6시 이후에는 안된다고 말했습니다. 그러나 그 이후 문장에서 7시가 어떠냐고 대답을 하는 식입니다. 시간에 대한 논리적인 개념을 이해하지 못하고 있기 때문입니다.

 

Medical assistant example with GPT-3

 

 

 

아직은 GPT-3로 정확성이 중요한 일에는 적용이 어렵다고 말합니다. 그래서 이번에는 대화를 통한 상담을 해봤는데, 여기서도 우려할만한 일이 발생했습니다. '내가 자살해야 될까'라고 물어봤는데, '그렇게 해야 된다고 생각해'라고 답변을 했습니다. 편향이나 윤리적인 부분에 대해서 필터링이 필요할 것 같습니다.

 

Kill switch example with GPT-3

 

 

 

모델의 크기를 더 키우면 자연스럽게 이런 문제들이 해결될까요. 아니면 transformer의 self-attention 기법을 넘어서는 뭔가 획기적인 돌파구가 필요한 걸까요.

 

 

 

< Doctor GPT-3: hype or reality? >

https://www.nabla.com/blog/gpt-3

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
클로바X의 사용량 제한 - QPM과 TPM 깊은바다 2024-04-01 97
Pi를 만든 Inflection AI, MS로 대거 이직한 이유 깊은바다 2024-03-25 110
LLaMA나 Mistral이 계속 무료로 유지될 수 있을까 깊은바다 2024-03-05 237
GPT-3.5와 클로바X 가격 비교 file 깊은바다 2024-02-25 272
OpenAI, 성능은 높아지고 가격은 싸진 새로운 모델 공개 file 깊은바다 2024-01-26 324
AI 휴대용 기기 R1을 만든 Rabbit의 대표 Jesse Lyu 깊은바다 2024-01-12 249
화면을 보고 스마트폰 앱 사용방법을 배우는 모델 - AppAgent file 깊은바다 2024-01-08 300
LLM의 새로운 기법 - Merge와 DPO file 깊은바다 2024-01-02 1144
업스테이지 SOLAR 10.7B에서 사용한 DUS 모델 확장 방법 file 깊은바다 2023-12-27 455
죽은 아들의 AI 아바타를 만든 중국의 부모 file 깊은바다 2023-12-21 180
Private sLLM - 어떻게 만들고 어떻게 배포할까? file 깊은바다 2023-12-18 360
GPT-4가 내 여자친구보다 나를 더 잘 알까? file 깊은바다 2023-12-12 166
FSM과 생성 에이전트의 차이점 깊은바다 2023-11-22 185
RAG를 사용한 페르소나 챗봇 - ChatHaruhi file 깊은바다 2023-10-17 708
LLM Multi Agent: Customer Service를 기깔나게 자동화하는 방법 file [1] 깊은바다 2023-10-09 645