레플리
글 수 203

자신의 이름을 음성으로 만들어 주는 사이트

조회 수 956 추천 수 0 2019.02.04 15:45:41


 

https://callmepresident.com/

 

 

 

자기 이름을 입력하면 직접 음성으로 새해 인사 동영상을 만들어 줍니다. 아래 블로그를 보면 WaveNet과 Tacotron 같은 딥러닝 기술을 쓴 것 같습니다.

 

https://lionrocket.github.io/blog/?fbclid=IwAR3I8YbeuShAPzbanKJMOGwoK-AtmtMVlJely_CtCtRNO1I0f80fxkUBZWk

 

 

 

과거에는 음성합성 시 미리 만들어 놓은 각 음절을 연결하는 수준에 그쳤습니다. 콜센터에 전화를 걸면 '고-객-님-의-계-좌-에-는-...' 처럼 이상한 기계음이 들리곤 했습니다. 같은 글자라도 단어나 위치에 따라 다르게 발음이 됩니다. 그래서 문맥에 맞게 어울리도록 소리를 변형해야 합니다.

 

딥러닝이 발전하면서 이런 문제가 해결되기 시작했습니다. 문장이 입력으로 들어오면 앞뒤 관계에 따라 발음되도록 학습합니다. WaveNet은 CNN을 사용하고, Tacotron은 RNN으로 되어 있습니다. 최근에는 두 가지 기법을 동시에 적용하기도 합니다.

 

예전에는 딥러닝으로 학습을 하려면 몇 시간 분량의 음성 데이터가 필요했습니다. 요즘에는 성능이 점점 높아져서, 불과 몇 문장만 말하면 자신의 목소리로 합성해주는 기술도 생겨났습니다. 제가 오래전 대학원에서 공부할 때에 비하면, 인공지능의 발전 속도가 너무 빠르게 느껴지네요.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
인공지능 과학자의 꿈, 범용 AI는 가능할까 깊은바다 2021-10-15 865
딥러닝 범용 모델 - Foundation Models 깊은바다 2021-09-06 1318
소프트웨어 개발 경험이 먼저다 - 딥러닝 역시 S/W 기술의 하나일 뿐 깊은바다 2021-07-14 914
제프리 힌튼, 얀 르쿤, 요슈아 벤지오가 말하는 딥러닝의 미래 깊은바다 2021-07-08 878
OpenAI의 CLIP을 사용해서 자연어로 유튜브 영상 검색 깊은바다 2021-07-05 1094
스케치를 사진으로 바꾸어주는 프로그램 - NVIDIA CANVAS 깊은바다 2021-06-25 637
한 단어만으로 텍스트 스타일을 바꿔주는 딥러닝 모델 - TextStyleBrush 깊은바다 2021-06-24 654
GameGAN으로 직접 화면을 생성하는 GTA5 게임 깊은바다 2021-06-20 635
Transformer와 동급의 성능에 속도는 훨씬 빨라진 MLP-Mixer file 깊은바다 2021-06-11 1439
GAN으로 얼굴사진을 생성하는 사이트 - Face Generator file 깊은바다 2021-04-28 2792
말로 설명하여 이미지를 변형하는 GAN - StyleCLIP file 깊은바다 2021-04-04 1817
GPT-3로 광고문구를 만드는 서비스 - Copy.ai 깊은바다 2021-03-22 648
딥러닝의 창시자인 제프리 힌튼이 구글에 합류하게 된 스토리 깊은바다 2021-03-18 418
뉴런 하나로 특정 개념을 표현한다, CLIP 모델에서 개념 뉴런을 발견 file 깊은바다 2021-03-12 573
스냅챕의 디즈니 필터 깊은바다 2021-03-12 529