글 수 208
슬라이드 : https://www.slideshare.net/carpedm20/deview-2017-80824162
음성합성 데모 : https://carpedm20.github.io/tacotron/
딥러닝을 사용하여 텍스트로 입력된 문장을 음성으로 출력하는 방법을 설명한 슬라이드 입니다. 먼저 텍스트를 기계가 처리할 수 있는 숫자로 변경하여 입력으로 하고, 거기에 맞는 음성 파형을 출력으로 하여 데이터쌍을 만들고 RNN으로 학습을 합니다. 그러면 새로운 문장에도 학습한 모델에 의해서 음성을 생성할 수 있습니다.
손석희 아나운서의 음성으로 학습한 데모를 들어보았는데 상당히 자연스러운 발음에 놀랐습니다. 예전 터미네이터2에서 액체로봇이 인간의 목소리를 그대로 흉내내어 속이는 장면이 있었습니다. 그때는 먼 미래의 일이라고 생각했는데 그게 벌써 현실이 되었네요.