레플리
글 수 203

자신의 이름을 음성으로 만들어 주는 사이트

조회 수 955 추천 수 0 2019.02.04 15:45:41


 

https://callmepresident.com/

 

 

 

자기 이름을 입력하면 직접 음성으로 새해 인사 동영상을 만들어 줍니다. 아래 블로그를 보면 WaveNet과 Tacotron 같은 딥러닝 기술을 쓴 것 같습니다.

 

https://lionrocket.github.io/blog/?fbclid=IwAR3I8YbeuShAPzbanKJMOGwoK-AtmtMVlJely_CtCtRNO1I0f80fxkUBZWk

 

 

 

과거에는 음성합성 시 미리 만들어 놓은 각 음절을 연결하는 수준에 그쳤습니다. 콜센터에 전화를 걸면 '고-객-님-의-계-좌-에-는-...' 처럼 이상한 기계음이 들리곤 했습니다. 같은 글자라도 단어나 위치에 따라 다르게 발음이 됩니다. 그래서 문맥에 맞게 어울리도록 소리를 변형해야 합니다.

 

딥러닝이 발전하면서 이런 문제가 해결되기 시작했습니다. 문장이 입력으로 들어오면 앞뒤 관계에 따라 발음되도록 학습합니다. WaveNet은 CNN을 사용하고, Tacotron은 RNN으로 되어 있습니다. 최근에는 두 가지 기법을 동시에 적용하기도 합니다.

 

예전에는 딥러닝으로 학습을 하려면 몇 시간 분량의 음성 데이터가 필요했습니다. 요즘에는 성능이 점점 높아져서, 불과 몇 문장만 말하면 자신의 목소리로 합성해주는 기술도 생겨났습니다. 제가 오래전 대학원에서 공부할 때에 비하면, 인공지능의 발전 속도가 너무 빠르게 느껴지네요.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
사진 한장으로 딥페이크 영상을 만드는 앱 - Reface 깊은바다 2020-08-18 26955
셀카를 일반 사진으로 변환해주는 GAN 모델 - Unselfie file 깊은바다 2020-08-08 891
StyleGAN을 이말년 웹툰으로 파인튜닝한 모델 깊은바다 2020-08-07 2711
배치 사이즈에 따라 GPU 메모리가 증가하는 이유 깊은바다 2020-07-28 5254
말로 설명하면 사진을 만들어주는 딥러닝 모델 - RetrieveGAN 깊은바다 2020-07-26 632
자신의 사진과 선택한 옷들을 GAN으로 합성해서 보여주는 딥러닝 깊은바다 2020-07-21 1888
대학교 게시판을 크롤링하여 만든 GPT2 모델 file 깊은바다 2020-07-18 916
딥페이크 알고리즘 설명 깊은바다 2020-07-16 1782
GAN으로 만든 모델 사진을 판매하는 일본 회사 깊은바다 2020-07-08 575
생성 모델이 일반 인공지능(AGI)으로 가는 열쇠 file 깊은바다 2020-06-29 1687
퓨샷 러닝(few-shot learning)과 메타 러닝(meta-learning) 깊은바다 2020-06-27 10285
자동회귀(autoregressive)로 이미지를 생성하는 iGPT file 깊은바다 2020-06-18 820
GPT3를 기반으로한 OpenAI API 유료화 깊은바다 2020-06-12 2535
스케치를 얼굴사진으로 변형하는 딥러닝 생성모델 - DeepFaceDrawing 깊은바다 2020-06-07 553
AI는 '스스로 학습'할 수 있을까? - 자기지도학습 깊은바다 2020-06-02 544