레플리
글 수 204

책 읽어주는 딥러닝

조회 수 943 추천 수 0 2017.11.23 00:37:19


4. Vocoder

슬라이드 : https://www.slideshare.net/carpedm20/deview-2017-80824162

음성합성 데모 : https://carpedm20.github.io/tacotron/

 

 

 

딥러닝을 사용하여 텍스트로 입력된 문장을 음성으로 출력하는 방법을 설명한 슬라이드 입니다. 먼저 텍스트를 기계가 처리할 수 있는 숫자로 변경하여 입력으로 하고, 거기에 맞는 음성 파형을 출력으로 하여 데이터쌍을 만들고 RNN으로 학습을 합니다. 그러면 새로운 문장에도 학습한 모델에 의해서 음성을 생성할 수 있습니다.

 

손석희 아나운서의 음성으로 학습한 데모를 들어보았는데 상당히 자연스러운 발음에 놀랐습니다. 예전 터미네이터2에서 액체로봇이 인간의 목소리를 그대로 흉내내어 속이는 장면이 있었습니다. 그때는 먼 미래의 일이라고 생각했는데 그게 벌써 현실이 되었네요.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
Stable Diffusion으로 만든 뮤직비디오 영상 깊은바다 2022-09-25 1136
Text-to-Image 모델을 정리한 글 - The State of AI and Art 2022 깊은바다 2022-10-06 1204
텐서플로우 기초 이해하기 깊은바다 2017-03-11 1205
AutoML을 이용한 Architecture Search 소개 및 NASNet 논문 리뷰 깊은바다 2019-08-18 1207
GAN으로 만든 가짜 사진과 진짜 사진을 맞추는 사이트 file 깊은바다 2019-03-04 1209
빈 주차공간을 찾아서 알려주는 인공지능 만든 개발자 깊은바다 2019-02-09 1210
쉽게 씌어진 GAN 깊은바다 2018-04-11 1224
모두를 위한 머신러닝/딥러닝 강의 깊은바다 2016-04-03 1225
사진을 복원하는 딥러닝 모델 - DFDNet 깊은바다 2020-08-24 1230
최신 딥러닝 모델들의 학습 비용 깊은바다 2019-12-12 1268
전문가 수준의 사진을 생성하는 NVIDIA의 PoE-GAN 깊은바다 2022-02-16 1282
딥러닝 GAN으로 생성한 고해상도 사진 [2] 깊은바다 2017-06-08 1290
하나의 얼굴 이미지로 다양하게 변형된 얼굴을 만드는 StarGAN [1] NeuroWhAI 2017-12-30 1301
RNN(Recurrent Neural Network) 튜토리얼 깊은바다 2017-07-22 1303
아이폰에서 실행하는 Stable Diffusion 앱 - Draw Things 깊은바다 2022-11-11 1318