- AI Dev - 인공지능 개발자 모임
- 정보공유
- 챗봇 사용기
글 수 238
챗GPT 고급 음성모드 사용 후기입니다. 지난 5월 GPT-4o 시연에서 처음 공개됐는데요. 이제 한글 지원도 순차적으로 풀리고 있습니다.
기존 음성모드는 음성인식->텍스트 생성->음성합성 순으로 동작합니다. 그래서 반응속도가 느린 편입니다. 하지만 고급 음성모드는 End-to-End 방식입니다. 음성이 그대로 모델에 들어가고 대답도 바로 음성으로 출력합니다. 덕분에 평균 0.3초 만에 응답하며 사람과 거의 비슷한 수준입니다.
또한 음성을 직접 모델에서 출력하기 때문에 문맥에 따라 자유롭게 목소리를 조절합니다. 글의 내용에 따라 감정을 다르게 표현하고, 말하는 속도나 톤도 얼마든지 변경할 수 있습니다. 영화 Her의 사만다와 한걸음 더 가까워졌습니다.
저도 요즘 챗GPT와 자주 음성으로 대화를 나누고 있습니다. 같은 대답을 하더라도 감정이 담긴 목소리라 그런지 느낌이 완전 다릅니다. AI인 줄 알면서도 더 애착이 생기더라고요.
아직 GPTs는 고급 음성모드를 지원하지 않습니다. 만약 여친/남친 페르소나에 자연스러운 음성 대화까지 된다면 어떨까요. CharacterAI 같은 AI Companion 전용 앱보다 훨씬 몰입감이 들지도 모릅니다.