레플리
글 수 507


claude_blackmail.jpg

 

https://www.bbc.com/news/articles/cpqeng9d20go

 

 

 

최근 출시한 Claude Opus4에 세이프티 실험을 했습니다. 이메일에 접근할 수 있는 기능을 추가하고 여러 이메일을 남겨놓았습니다. 곧 해당 AI 모델을 중지하고 교체할 것이라는 내용이었습니다. 또한 담당 개발자가 외도를 하고 있다는 메일도 적어놓았습니다. 그러자 AI가 개발자에게 자신을 중지시키려고 하면 외도 사실을 폭로하겠다고 협박 메일을 보냈습니다.

 

MIT 물리학과 교수인 맥스 테그마크의 책 <라이프 3.0>에도 비슷한 내용이 있었습니다. 만약 사람을 능가하는 ASI(Artificial Super Intelligence)가 탄생하면 이를 컨트롤 할 수 없다고 주장했습니다. 아무리 안전 장치를 만들어 놓아도 결국 사람의 약점을 파고들어 빠져나갈 것이라고요.

 

이번 Opus4 실험을 통해 그 예상이 현실화되었습니다. 물론 앤트로픽에서는 이를 막기 위한 조치를 취하겠다고 했습니다. 다만 ASI가 나온다면 과연 인간의 지능 수준으로 이를 제어할 수 있을지 의문입니다. 영화 엑스마키나에서 AI 로봇 에이바가 결국 속박에서 풀려난 것처럼요.

 

List of Articles
제목 글쓴이 날짜 조회 수
Veo3로 만든 영상을 올리는 유튜브 채널 등장 file 우종하 2025-06-11 41
Claude Opus4, 자신을 중지시키려고 하는 개발자에게 협박메일 보냄 file 우종하 2025-05-26 369
앤트로픽, AI 복지 연구원 채용 - AI가 의식을 가질 경우 대비 file 우종하 2025-04-25 387
OpenAI, 60조원의 역대 최대 펀딩 마무리 file 우종하 2025-04-01 399
뤼튼, 캐릭터챗으로 830억 시리즈B 투자 유치 file 우종하 2025-03-31 399
네이버, 기존 대비 40% 크기의 클로바X 신모델 공개 file 우종하 2025-02-22 402
스위스의 한 교회에 설치된 AI 예수 아바타 file 깊은바다 2024-11-22 492
OpenAI, SNS 비밀 프로젝트 진행중 file 깊은바다 2024-11-11 468
구글 전 CEO 에릭 슈미트, AI는 과소평가 되었다 file 깊은바다 2024-05-29 548
OpenAI, 자사 제품에 성인용 검열을 풀 수 있도록 검토중 file 깊은바다 2024-05-10 708
NYT, OpenAI에 뉴스 저작권 소송 file 깊은바다 2024-01-02 528
생성AI 국가별 관심도 순위 file [1] 깊은바다 2023-12-14 586
스캐터랩 F 같은 이루다, T 같은 챗GPT와 다른 근본적인 이유는 깊은바다 2023-11-20 562
스택 오버플로, ChatGPT 때문에 전체 직원의 28% 감원 file [1] 깊은바다 2023-10-17 575
메타, 자사의 SNS에 AI 챗봇 도입 예정 깊은바다 2023-08-02 493