레플리
글 수 203

자신의 이름을 음성으로 만들어 주는 사이트

조회 수 955 추천 수 0 2019.02.04 15:45:41


 

https://callmepresident.com/

 

 

 

자기 이름을 입력하면 직접 음성으로 새해 인사 동영상을 만들어 줍니다. 아래 블로그를 보면 WaveNet과 Tacotron 같은 딥러닝 기술을 쓴 것 같습니다.

 

https://lionrocket.github.io/blog/?fbclid=IwAR3I8YbeuShAPzbanKJMOGwoK-AtmtMVlJely_CtCtRNO1I0f80fxkUBZWk

 

 

 

과거에는 음성합성 시 미리 만들어 놓은 각 음절을 연결하는 수준에 그쳤습니다. 콜센터에 전화를 걸면 '고-객-님-의-계-좌-에-는-...' 처럼 이상한 기계음이 들리곤 했습니다. 같은 글자라도 단어나 위치에 따라 다르게 발음이 됩니다. 그래서 문맥에 맞게 어울리도록 소리를 변형해야 합니다.

 

딥러닝이 발전하면서 이런 문제가 해결되기 시작했습니다. 문장이 입력으로 들어오면 앞뒤 관계에 따라 발음되도록 학습합니다. WaveNet은 CNN을 사용하고, Tacotron은 RNN으로 되어 있습니다. 최근에는 두 가지 기법을 동시에 적용하기도 합니다.

 

예전에는 딥러닝으로 학습을 하려면 몇 시간 분량의 음성 데이터가 필요했습니다. 요즘에는 성능이 점점 높아져서, 불과 몇 문장만 말하면 자신의 목소리로 합성해주는 기술도 생겨났습니다. 제가 오래전 대학원에서 공부할 때에 비하면, 인공지능의 발전 속도가 너무 빠르게 느껴지네요.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
불쾌한 골짜기에서 대유쾌 마운틴으로 - 이미지 생성AI file 깊은바다 2023-03-08 6931
아카라이브 반실사 채널 - Stable Diffusion 실사 그림 file 깊은바다 2023-03-01 2107
사인필드 시트콤을 패러디한 AI 생성 애니메이션 방송 file 깊은바다 2023-02-01 402
글로 설명하면 음악을 만들어주는 딥러닝 모델 - MusicLM 깊은바다 2023-01-27 446
Stable Diffusion 포토샵 플러그인 깊은바다 2022-12-25 2393
GPT : 도래한 초거대 AI의 시대, 빅테크가 주도할 수 밖에 없는 이유 file 깊은바다 2022-12-22 329
Stable Diffusion을 사용한 사진 변환 앱 Lensa AI, 앱스토어 1위 달성 깊은바다 2022-12-09 785
NVIDIA가 발표한 Text-to-3D 모델 - Magic3D 깊은바다 2022-11-22 652
아이폰에서 실행하는 Stable Diffusion 앱 - Draw Things 깊은바다 2022-11-11 1285
일기를 쓰면 그림을 그려주는 그림일기 서비스 file 깊은바다 2022-11-08 1895
World Models를 만든 David Ha, 구글에서 StabilityAI로 이적 file 깊은바다 2022-10-11 361
인공지능 킬러앱의 등장, 그리고 모바일에서 인공지능으로 패러다임 변환 file 깊은바다 2022-10-10 511
Text-to-Image 모델을 정리한 글 - The State of AI and Art 2022 깊은바다 2022-10-06 1169
Text-to-3D인 DreamFusion과 Text-to-Video인 Make-A-Video 깊은바다 2022-10-01 438
Stable Diffusion으로 만든 뮤직비디오 영상 깊은바다 2022-09-25 1128