레플리
글 수 203

자신의 이름을 음성으로 만들어 주는 사이트

조회 수 955 추천 수 0 2019.02.04 15:45:41


 

https://callmepresident.com/

 

 

 

자기 이름을 입력하면 직접 음성으로 새해 인사 동영상을 만들어 줍니다. 아래 블로그를 보면 WaveNet과 Tacotron 같은 딥러닝 기술을 쓴 것 같습니다.

 

https://lionrocket.github.io/blog/?fbclid=IwAR3I8YbeuShAPzbanKJMOGwoK-AtmtMVlJely_CtCtRNO1I0f80fxkUBZWk

 

 

 

과거에는 음성합성 시 미리 만들어 놓은 각 음절을 연결하는 수준에 그쳤습니다. 콜센터에 전화를 걸면 '고-객-님-의-계-좌-에-는-...' 처럼 이상한 기계음이 들리곤 했습니다. 같은 글자라도 단어나 위치에 따라 다르게 발음이 됩니다. 그래서 문맥에 맞게 어울리도록 소리를 변형해야 합니다.

 

딥러닝이 발전하면서 이런 문제가 해결되기 시작했습니다. 문장이 입력으로 들어오면 앞뒤 관계에 따라 발음되도록 학습합니다. WaveNet은 CNN을 사용하고, Tacotron은 RNN으로 되어 있습니다. 최근에는 두 가지 기법을 동시에 적용하기도 합니다.

 

예전에는 딥러닝으로 학습을 하려면 몇 시간 분량의 음성 데이터가 필요했습니다. 요즘에는 성능이 점점 높아져서, 불과 몇 문장만 말하면 자신의 목소리로 합성해주는 기술도 생겨났습니다. 제가 오래전 대학원에서 공부할 때에 비하면, 인공지능의 발전 속도가 너무 빠르게 느껴지네요.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
오픈소스로 공개된 Text-to-Image 모델 - Stable Diffusion 깊은바다 2022-09-07 1336
Dall.E 2 Prompt Book - 프롬프트 작성 가이드 깊은바다 2022-07-14 4339
최초로 인간 수준의 크기를 가진 중국의 딥러닝 모델 - BaGuaLu file 깊은바다 2022-06-23 1116
미국에서 Dalle Mini로 짤(Meme)을 만드는게 유행 file 깊은바다 2022-06-19 1583
말로 영상을 생성하는 딥러닝 모델 - CogVideo file 깊은바다 2022-05-30 1069
DALL.E를 직접 테스트해볼 수 있는 사이트 - DALL.E mini file 깊은바다 2022-05-17 11519
전문가 수준의 사진을 생성하는 NVIDIA의 PoE-GAN 깊은바다 2022-02-16 1279
메타AI의 멀티모달 자기지도학습 모델인 Data2vec 깊은바다 2022-01-26 1028
GAN으로 사진에서 특정 부분을 지워주는 서비스 - Cleanup.pictures file 깊은바다 2022-01-17 1018
3D 이미지를 만드는 GAN - StyleNeRF 깊은바다 2021-12-20 835
CLIP을 사용하여 말로 그림을 그려주는 스마트폰 앱 - WOMBO Dream file 깊은바다 2021-11-25 1777
내가 말하는 걸 보여줘, DALL-E 깊은바다 2021-11-11 1062
텍스트를 이미지로 생성해주는 사이트 - Text2Art (VQGAN-CLIP) file 깊은바다 2021-11-10 6865
원티드는 어떻게 AI로 채용 결과를 예측하고 매칭할까 깊은바다 2021-11-09 959
OpenAI의 CLIP을 한글로 구현한 KoCLIP file 깊은바다 2021-11-02 2735