레플리
글 수 203

책 읽어주는 딥러닝

조회 수 943 추천 수 0 2017.11.23 00:37:19


4. Vocoder

슬라이드 : https://www.slideshare.net/carpedm20/deview-2017-80824162

음성합성 데모 : https://carpedm20.github.io/tacotron/

 

 

 

딥러닝을 사용하여 텍스트로 입력된 문장을 음성으로 출력하는 방법을 설명한 슬라이드 입니다. 먼저 텍스트를 기계가 처리할 수 있는 숫자로 변경하여 입력으로 하고, 거기에 맞는 음성 파형을 출력으로 하여 데이터쌍을 만들고 RNN으로 학습을 합니다. 그러면 새로운 문장에도 학습한 모델에 의해서 음성을 생성할 수 있습니다.

 

손석희 아나운서의 음성으로 학습한 데모를 들어보았는데 상당히 자연스러운 발음에 놀랐습니다. 예전 터미네이터2에서 액체로봇이 인간의 목소리를 그대로 흉내내어 속이는 장면이 있었습니다. 그때는 먼 미래의 일이라고 생각했는데 그게 벌써 현실이 되었네요.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
오픈소스로 공개된 Text-to-Image 모델 - Stable Diffusion 깊은바다 2022-09-07 1347
Dall.E 2 Prompt Book - 프롬프트 작성 가이드 깊은바다 2022-07-14 4375
최초로 인간 수준의 크기를 가진 중국의 딥러닝 모델 - BaGuaLu file 깊은바다 2022-06-23 1117
미국에서 Dalle Mini로 짤(Meme)을 만드는게 유행 file 깊은바다 2022-06-19 1627
말로 영상을 생성하는 딥러닝 모델 - CogVideo file 깊은바다 2022-05-30 1070
DALL.E를 직접 테스트해볼 수 있는 사이트 - DALL.E mini file 깊은바다 2022-05-17 11540
전문가 수준의 사진을 생성하는 NVIDIA의 PoE-GAN 깊은바다 2022-02-16 1280
메타AI의 멀티모달 자기지도학습 모델인 Data2vec 깊은바다 2022-01-26 1032
GAN으로 사진에서 특정 부분을 지워주는 서비스 - Cleanup.pictures file 깊은바다 2022-01-17 1026
3D 이미지를 만드는 GAN - StyleNeRF 깊은바다 2021-12-20 841
CLIP을 사용하여 말로 그림을 그려주는 스마트폰 앱 - WOMBO Dream file 깊은바다 2021-11-25 1780
내가 말하는 걸 보여줘, DALL-E 깊은바다 2021-11-11 1062
텍스트를 이미지로 생성해주는 사이트 - Text2Art (VQGAN-CLIP) file 깊은바다 2021-11-10 6899
원티드는 어떻게 AI로 채용 결과를 예측하고 매칭할까 깊은바다 2021-11-09 961
OpenAI의 CLIP을 한글로 구현한 KoCLIP file 깊은바다 2021-11-02 2813