글 수 134

책 읽어주는 딥러닝

조회 수 749 추천 수 0 2017.11.23 00:37:19


4. Vocoder

슬라이드 : https://www.slideshare.net/carpedm20/deview-2017-80824162

음성합성 데모 : https://carpedm20.github.io/tacotron/

 

 

 

딥러닝을 사용하여 텍스트로 입력된 문장을 음성으로 출력하는 방법을 설명한 슬라이드 입니다. 먼저 텍스트를 기계가 처리할 수 있는 숫자로 변경하여 입력으로 하고, 거기에 맞는 음성 파형을 출력으로 하여 데이터쌍을 만들고 RNN으로 학습을 합니다. 그러면 새로운 문장에도 학습한 모델에 의해서 음성을 생성할 수 있습니다.

 

손석희 아나운서의 음성으로 학습한 데모를 들어보았는데 상당히 자연스러운 발음에 놀랐습니다. 예전 터미네이터2에서 액체로봇이 인간의 목소리를 그대로 흉내내어 속이는 장면이 있었습니다. 그때는 먼 미래의 일이라고 생각했는데 그게 벌써 현실이 되었네요.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
R-CNN 에서 부터 Mask R-CNN 까지 깊은바다 2019-09-03 783
만화 캐릭터를 자동으로 생성하는 서비스 - Waifu file 깊은바다 2019-08-23 1762
AutoML을 이용한 Architecture Search 소개 및 NASNet 논문 리뷰 깊은바다 2019-08-18 839
얀 르쿤의 자기지도학습 강의 - The Power and Limits Of Deep Learning file 깊은바다 2019-07-13 1288
딥러닝의 기본 깊은바다 2019-07-12 622
셀프 어텐션만으로 이미지를 인식하는 딥러닝 모델 file 깊은바다 2019-06-26 1091
Selfie, 비지도학습 이미지 사전훈련 모델 file 깊은바다 2019-06-15 2023
목소리와 입모양을 변경할 수 있는 GAN 모델 깊은바다 2019-06-13 682
딥러닝의 미래는 바로 비지도학습 깊은바다 2019-06-06 3384
YOLO, Object Detection Network - 알고리즘 설명 file 깊은바다 2019-06-02 8737
사진 한 장으로 GAN 영상 생성 깊은바다 2019-05-23 1102
객체 검출 딥러닝 모델인 YOLO의 테드 영상 깊은바다 2019-05-22 1982
스냅챕의 성별 변환 필터는 GAN을 사용했을까 깊은바다 2019-05-15 412
신경망에 활성화 함수가 필요한 이유 file 깊은바다 2019-05-14 1175
핸즈온 머신러닝 2판 영문 초고 다운로드 깊은바다 2019-05-12 1421