레플리
글 수 203

자신의 이름을 음성으로 만들어 주는 사이트

조회 수 955 추천 수 0 2019.02.04 15:45:41


 

https://callmepresident.com/

 

 

 

자기 이름을 입력하면 직접 음성으로 새해 인사 동영상을 만들어 줍니다. 아래 블로그를 보면 WaveNet과 Tacotron 같은 딥러닝 기술을 쓴 것 같습니다.

 

https://lionrocket.github.io/blog/?fbclid=IwAR3I8YbeuShAPzbanKJMOGwoK-AtmtMVlJely_CtCtRNO1I0f80fxkUBZWk

 

 

 

과거에는 음성합성 시 미리 만들어 놓은 각 음절을 연결하는 수준에 그쳤습니다. 콜센터에 전화를 걸면 '고-객-님-의-계-좌-에-는-...' 처럼 이상한 기계음이 들리곤 했습니다. 같은 글자라도 단어나 위치에 따라 다르게 발음이 됩니다. 그래서 문맥에 맞게 어울리도록 소리를 변형해야 합니다.

 

딥러닝이 발전하면서 이런 문제가 해결되기 시작했습니다. 문장이 입력으로 들어오면 앞뒤 관계에 따라 발음되도록 학습합니다. WaveNet은 CNN을 사용하고, Tacotron은 RNN으로 되어 있습니다. 최근에는 두 가지 기법을 동시에 적용하기도 합니다.

 

예전에는 딥러닝으로 학습을 하려면 몇 시간 분량의 음성 데이터가 필요했습니다. 요즘에는 성능이 점점 높아져서, 불과 몇 문장만 말하면 자신의 목소리로 합성해주는 기술도 생겨났습니다. 제가 오래전 대학원에서 공부할 때에 비하면, 인공지능의 발전 속도가 너무 빠르게 느껴지네요.

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
OpenAI의 Sora로 만든 단편영화 file 깊은바다 2024-03-26 53
만약 ChatGPT가 영상으로 세상을 이해하게 된다면? file 깊은바다 2024-02-16 231
인도의 생성AI 영화 - Maharaja in Denims 깊은바다 2024-01-16 184
누구나 쉽게 AI 인플루언서를 만드는 시대 - Aitana Lopez file 깊은바다 2024-01-04 159
95생 천재 소녀가 만든 Pika가 빅테크들을 이길 수 있었던 이유 file [2] 깊은바다 2023-12-24 949
Text-to-Video 생성 서비스인 Pika, 5500만달러 투자 유치 file 깊은바다 2023-11-29 139
AI의 미래 - Coatue가 주목한 AI 산업 트렌드 깊은바다 2023-11-28 187
가구 카탈로그를 만들어주는 생성AI - 뚝딱 AI 스튜디오 file 깊은바다 2023-09-22 338
내가 원하는 사진을 만드는 생성AI SNS - 트윅(Tweak) file 깊은바다 2023-09-04 444
마우스로 끌어서 사진을 수정하는 딥러닝 - DragGAN 깊은바다 2023-05-21 430
생성 AI의 시대, 진짜 메타버스가 온다 깊은바다 2023-04-04 363
ChatGPT와 Stable Diffusion에 대한 정지훈 교수님 강의 깊은바다 2023-04-03 409
미드저니로 생성한 90년대 중국 사진들 - 콘텐츠 산업의 혁신 file 깊은바다 2023-03-30 734
어도비의 생성AI 프로그램 - Firefly 깊은바다 2023-03-23 339
초거대AI를 API로 썼을 때 경쟁업체와 차별화를 하려면 깊은바다 2023-03-20 289