레플리
글 수 214

혁명적인 AI 네이티브 휴대용 기기 - Rabbit의 R1

조회 수 535 추천 수 0 2024.01.12 15:09:30


실리콘밸리 스타트업인 Rabbit에서 R1이란 AI 네이티브 기기를 선보였습니다. 처음에는 장난감처럼 보여서 큰 관심이 없었는데요. 자세한 기능을 살펴보고는 전율이 느껴졌습니다. 아이폰을 처음 봤을 때의 충격이라고 할까요.

 

R1은 Rabbit OS라는 AI 전용 운영체제를 탑재하고 있습니다. 터치스크린이 되는 작은 화면과 마이크, 스피커를 내장하고 있습니다. 오른쪽 버튼을 누르고 음성으로 명령을 내립니다. 4GB 램, 128GB 저장공간, 와이파이와 4G를 지원하고 통화도 가능합니다.

 

K-023_1.jpg

 

K-025_1.jpg

 

K-001_1.jpg

 

K-004_1.jpg


 

K-019_1.jpg


 

 

스마트폰이 모바일 시대를 열었어만 한 가지 문제가 있습니다. 내가 원하는 일을 하기 위해서는 수많은 앱들을 각각 실행해야 한다는 점입니다. 음악을 들을 때는 스포티파이 앱을, 택시를 타려면 카카오 T 앱을, 음식을 주문하려면 배민 앱을 사용합니다. 이런 과정을 하나로 통합하기 위해 아이폰의 시리가 탄생했습니다. 하지만 룰베이스 AI의 한계로 이해력이 너무 떨어져서 거의 쓸모가 없었습니다.

 

ChatGPT 플러그인은 LLM으로 새로운 돌파구를 열었습니다. LLM의 뛰어난 이해력을 API 호출 기능과 연결하여 특정 작업을 수행할 수 있게 되었습니다. 말로 설명하면 해당 기능의 API를 실행하기 위한 세부적인 명세를 LLM이 작성합니다. 마치 코딩을 하는 것처럼요. 룰베이스 AI는 이 부분을 사람이 설계해야 했기 때문에 성능도 떨어지고 확장하기가 어려웠습니다.

 

여기서 한 단계 더 발전한 것이 텐센트의 AppAgent입니다. 플러그인 기능을 넣으려면 각 앱의 개발자가 LLM과 연동할 수 있는 자체 플러그인 만들어야 합니다. 앱의 모든 기능을 API로 외부에 공개하는 작업도 쉽지 않고요. 만약 LLM이 직접 앱을 조작할 수 있다면 어떨까요. 터치나 스와이프, 또는 키패드 입력처럼 사람과 동일하게 액션을 수행하는 방식으로요. AppAgent는 사람의 명령과 앱 스크린샷을 입력받아 직접 앱을 컨트롤하는 모델입니다.

 

(AppAgent 설명)

http://aidev.co.kr/chatbotdeeplearning/14211

 

 

 

R1의 Rabbit OS가 바로 AppAgent의 개념을 상용화한 버전입니다. 솔직히 이런 방식이 이렇게 빨리 제품으로 출시될지 예상도 못했습니다. 다만 R1은 아직 기존 스마트폰처럼 외부 앱을 설치할 수 없습니다. 그래서 Rabbit Hole Web Portal을 제공합니다. 이 사이트에서 스포티파이, 우버, 도어대시, 아마존, 이베이 등 자신이 사용하고 싶은 서비스를 지정합니다. 내 계정으로 로그인을 해놓으면 그 다음부터 R1으로 쉽게 조작할 수 있습니다.

 

K-026_1.jpg

 

 

 

영상에는 자세한 기술이 나오지 않았는데 아마 가상머신으로 돌아가는 듯 합니다. 예를 들어, 내가 스포티파이 음악을 요청하면 Rabbit의 클라우드에서 가상머신을 실행하여 내 계정으로 스포티파이 로그인을 합니다. 그리고 원하는 음악을 찾아 플레이하는 과정을 스포티파이 UI를 통해 직접 AI가 조작합니다. 이를 위해서 LAM(Large Action Model)을 새로 학습했습니다. LLM은 텍스트만 출력되지만, LAM은 텍스트와 함께 UI 액션까지 같이 나옵니다.

 

K-005_1.jpg

 

K-006_1.jpg

 

K-010_1.jpg

 

K-030_1.jpg

 

K-031_1.jpg

 

K-033_1.jpg

 

K-034_1.jpg

 

K-036_1.jpg

 

K-037_1.jpg

 

 

 

Web Portal에 없는 서비스를 사용하고 싶다면 Teach 모드로 직접 학습하면 됩니다. 사이트 주소를 입력하고 녹화버튼을 누른 다음 원하는 기능을 내가 직접 실행합니다. 이렇게 한번 등록해놓고 R1에게 명령하면 자동으로 해당 작업을 수행합니다.

 

K-045_1.jpg

 

K-048_1.jpg

 

K-056_1.jpg

 

K-058_1.jpg

 

K-059_1.jpg

 

K-060_1.jpg

 

 

 

플러그인이 처음 나왔을 때도 엄청난 기술이었지만 API 호출이 갖는 한계가 있습니다. 각각의 앱이 자신의 API와 연동하는 플러그인을 개발해야 하니까요. Rabbit의 LAM을 쓰면 이런 문제가 바로 해결됩니다. 거추장스러운 플러그인을 지원 안해도 모든 앱을 말로 조작할 수 있습니다.

 

R1의 가격은 고작 199달러입니다. 기기만 구입하면 별도의 사용료도 없습니다. 가상머신을 돌리는 비용이 상당할 텐데요. 초기 유저를 확보하기 위해 거의 무료로 풀고 있습니다. 과연 R1이 기존 스마트폰을 대체할 수 있을까요. Web Portal로 서비스를 연결하는건 사실 매우 불편합니다. 당장 앱 생태계를 구축하기 어렵기 때문에 고안한 방식이라고 봅니다. 아이폰이나 안드로이드에 이런 기능이 내장될 날이 얼마 남지 않았습니다. 그때까지 R1이 고유의 영역을 구축할 수 있을지, 아니면 선구적인 시도로만 역사에 남게 될지 모르겠습니다. 마음속으로는 R1을 응원하고 싶네요.

 

K-038_1.jpg

 

K-041_1.jpg

 

K-062_1.jpg

 

K-065_1.jpg

 

https://www.youtube.com/watch?v=22wlLy7hKP4

 

List of Articles
제목 글쓴이 날짜 조회 수
GenZ 여성들에게 챗GPT 남자친구와 대화하는게 유행 file 깊은바다 2024-04-22 57
생성AI SNS에서 사람과 AI가 소통하는 세상 - 디어메이트 file 깊은바다 2024-04-12 77
뤼튼, 웹 검색 후 최신 정보 반영 file 깊은바다 2024-04-05 80
마인드로직의 페르소나 챗봇 - 전 SM엔터 이수만 회장 70억 투자 file 깊은바다 2024-03-28 130
NVIDIA와 파트너십을 맺은 AI 간호사 서비스 - Hippocratic AI file 깊은바다 2024-03-21 160
Claude 3가 가끔씩 사람처럼 느껴질 때 file 깊은바다 2024-03-19 188
Claude 3와 GPT-4의 일상대화 비교 file 깊은바다 2024-03-15 216
Claude-3와 영화 Her의 사만다 file 깊은바다 2024-03-10 165
Claude-3와 GPT-4의 감성대화 능력 비교 file 깊은바다 2024-03-10 242
일본 MZ세대에게 인기를 끌고 있는 앱 - 이야기 듣는 삼촌 file [2] 깊은바다 2024-03-04 632
GetGPT의 가장 인기 챗봇 - 행발 작성 프로그램 file 깊은바다 2024-02-19 204
클로바X, GPT-3.5, GPT-4의 일상대화 능력 비교 file 깊은바다 2024-02-13 211
버추얼 아이돌 메이브와 대화할 수 있는 AI 챗봇 file 깊은바다 2024-02-08 194
Rabbit의 R1은 뉴로-심볼릭으로 LAM(Large Action Model) 구현 file 깊은바다 2024-01-21 381
혁명적인 AI 네이티브 휴대용 기기 - Rabbit의 R1 file 깊은바다 2024-01-12 535