글 수 497
http://www.epnc.co.kr/news/articleView.html?idxno=95069
"그러나 텍스트나 음원의 전처리 과정 없이 입력 텍스트로부터 바로 음성을 예측하는 구글의 타코트론(Tacotron) 기반 음성합성기가 등장하기 시작한 이후 AI 기반 음성합성 기술은 비약적인 성장을 이루기 시작했다. 전처리 과정이 사라진 음성합성 기술은 텍스트와 음원 사이의 연관성을 AI가 스스로 학습하므로 실제 사람이 말하는 것과 같은 자연스러운 합성 품질을 보였으며, 개발 장벽도 한층 낮아졌다."
과거에는 음소단위로 분리하여 재결합하는 연결합성, HMM으로 학습하는 통계기반 파라미터 음성합성이 주로 사용되었습니다. 지금은 딥러닝을 통해 매우 자연스러운 목소리를 생성할 수 있습니다. 여기에 대한 간략히 정리한 기사입니다.