레플리
글 수 203

책 읽어주는 딥러닝

조회 수 943 추천 수 0 2017.11.23 00:37:19


4. Vocoder

슬라이드 : https://www.slideshare.net/carpedm20/deview-2017-80824162

음성합성 데모 : https://carpedm20.github.io/tacotron/

 

 

 

딥러닝을 사용하여 텍스트로 입력된 문장을 음성으로 출력하는 방법을 설명한 슬라이드 입니다. 먼저 텍스트를 기계가 처리할 수 있는 숫자로 변경하여 입력으로 하고, 거기에 맞는 음성 파형을 출력으로 하여 데이터쌍을 만들고 RNN으로 학습을 합니다. 그러면 새로운 문장에도 학습한 모델에 의해서 음성을 생성할 수 있습니다.

 

손석희 아나운서의 음성으로 학습한 데모를 들어보았는데 상당히 자연스러운 발음에 놀랐습니다. 예전 터미네이터2에서 액체로봇이 인간의 목소리를 그대로 흉내내어 속이는 장면이 있었습니다. 그때는 먼 미래의 일이라고 생각했는데 그게 벌써 현실이 되었네요.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
딥러닝 이론에서 텐서플로 실습까지 [2] 깊은바다 2017-11-08 786
Stable Diffusion을 사용한 사진 변환 앱 Lensa AI, 앱스토어 1위 달성 깊은바다 2022-12-09 786
사진을 텍스트로 설명 - CaptionBot file 깊은바다 2016-04-07 795
AutoML-Zero, 진화적 알고리즘을 사용하여 신경망 구조 설계 [2] 깊은바다 2020-03-13 820
당근마켓에서 딥러닝 활용하기 - 불량 게시물 검사 깊은바다 2017-12-23 821
자동회귀(autoregressive)로 이미지를 생성하는 iGPT file 깊은바다 2020-06-18 821
전신 사진을 생성하는 GAN 깊은바다 2019-05-05 832
알렉스넷과 Seq2Seq의 창시자 일리야 수츠케버(Ilya Sutskever) 깊은바다 2020-11-17 832
어떻게 해야 기계에게 글을 잘 읽고 말할 수 있게 할까? - 기계독해(MRC) 깊은바다 2020-01-14 836
앤드류 응의 YOLO 강의 영상 깊은바다 2020-09-23 838
3D 이미지를 만드는 GAN - StyleNeRF 깊은바다 2021-12-20 843
소프트웨어 2.0 깊은바다 2018-08-14 847
고해상도 GAN - A Style-Based Generator Architecture for GAN 깊은바다 2018-12-15 849
인공지능 과학자의 꿈, 범용 AI는 가능할까 깊은바다 2021-10-15 866
Recurrent Neural Network (RNN) 이해하기 - MNIST 숫자 인식 깊은바다 2018-04-11 880