레플리
글 수 203

책 읽어주는 딥러닝

조회 수 943 추천 수 0 2017.11.23 00:37:19


4. Vocoder

슬라이드 : https://www.slideshare.net/carpedm20/deview-2017-80824162

음성합성 데모 : https://carpedm20.github.io/tacotron/

 

 

 

딥러닝을 사용하여 텍스트로 입력된 문장을 음성으로 출력하는 방법을 설명한 슬라이드 입니다. 먼저 텍스트를 기계가 처리할 수 있는 숫자로 변경하여 입력으로 하고, 거기에 맞는 음성 파형을 출력으로 하여 데이터쌍을 만들고 RNN으로 학습을 합니다. 그러면 새로운 문장에도 학습한 모델에 의해서 음성을 생성할 수 있습니다.

 

손석희 아나운서의 음성으로 학습한 데모를 들어보았는데 상당히 자연스러운 발음에 놀랐습니다. 예전 터미네이터2에서 액체로봇이 인간의 목소리를 그대로 흉내내어 속이는 장면이 있었습니다. 그때는 먼 미래의 일이라고 생각했는데 그게 벌써 현실이 되었네요.

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
OpenAI의 Sora로 만든 단편영화 file 깊은바다 2024-03-26 189
만약 ChatGPT가 영상으로 세상을 이해하게 된다면? file 깊은바다 2024-02-16 261
인도의 생성AI 영화 - Maharaja in Denims 깊은바다 2024-01-16 197
누구나 쉽게 AI 인플루언서를 만드는 시대 - Aitana Lopez file 깊은바다 2024-01-04 174
95생 천재 소녀가 만든 Pika가 빅테크들을 이길 수 있었던 이유 file [2] 깊은바다 2023-12-24 976
Text-to-Video 생성 서비스인 Pika, 5500만달러 투자 유치 file 깊은바다 2023-11-29 149
AI의 미래 - Coatue가 주목한 AI 산업 트렌드 깊은바다 2023-11-28 204
가구 카탈로그를 만들어주는 생성AI - 뚝딱 AI 스튜디오 file 깊은바다 2023-09-22 364
내가 원하는 사진을 만드는 생성AI SNS - 트윅(Tweak) file 깊은바다 2023-09-04 467
마우스로 끌어서 사진을 수정하는 딥러닝 - DragGAN 깊은바다 2023-05-21 446
생성 AI의 시대, 진짜 메타버스가 온다 깊은바다 2023-04-04 374
ChatGPT와 Stable Diffusion에 대한 정지훈 교수님 강의 깊은바다 2023-04-03 425
미드저니로 생성한 90년대 중국 사진들 - 콘텐츠 산업의 혁신 file 깊은바다 2023-03-30 773
어도비의 생성AI 프로그램 - Firefly 깊은바다 2023-03-23 349
초거대AI를 API로 썼을 때 경쟁업체와 차별화를 하려면 깊은바다 2023-03-20 301