레플리
글 수 203


K-001.png

 

https://openai.com/blog/jukebox/

 

 

 

GPT2로 유명한 OpenAI가 또 굉장한 모델을 공개했습니다. 작년에 발표한 MuseNet(https://openai.com/blog/musenet/)은 미디 데이터를 기반으로 음악을 생성했습니다. 방금 예측한 정보를 다시 입력에 넣어서 반복적으로 출력하는 자동회귀(autoregressive) 방식입니다.

 

Jukebox는 무려 오디오 사운드를 그대로 사용합니다. 웨이브 파형은 기호화된 미디 데이터보다 시퀀스가 훨씬 길어집니다. 그래서 직접 입력으로 넣기가 어렵습니다. 이를 위해 VQ-VAE를 활용하는 새로운 아이디어를 적용합니다. 먼저 인코더에서 오디오를 코드로 압축합니다. 코드 단위로 트랜스포머에 넣어 음악을 생성을 한 다음에, 다시 디코더에서 오디오 형태로 복원합니다.

 

이렇게 학습이 끝나면 GAN이나 VAE처럼 잠재공간(latent space)를 조작하여 다양하게 변형도 가능합니다. 노래의 장르를 팝에서 재즈로 바꾸거나, 특정 곡을 다른 가수의 목소리로 변경할 수도 있습니다. 무엇보다 새로운 가사만 주어지면 거기에 맞는 노래를 만들어내는게 가장 놀라웠습니다.

 

아직은 잡음이 너무 심하고 곡의 품질이 많이 떨어지는 편입니다. 하지만 이런 기술이 발전하면 음악 산업에 큰 파장을 일으킬 것 같습니다. 내가 좋아하는 가수의 신곡을 매일 받아보는 세상이 오게 될까요.

 

List of Articles
제목 글쓴이 날짜 조회 수sort
딥러닝 웹서비스 개발 도전기 - 연예인 얼굴 판별기 깊은바다 2020-05-01 3107
자기지도학습 기반의 이미지 사전훈련 모델 - SimCLR 깊은바다 2020-03-10 3017
StyleGAN을 사용하여 새로운 얼굴을 생성하는 사이트 file 깊은바다 2019-02-17 3005
딥러닝을 사용한 포즈 인식 - Teachable Machine 깊은바다 2020-02-28 2961
이미지를 문장으로 설명하는 딥러닝 코드 file 깊은바다 2017-12-15 2930
OpenAI의 CLIP을 한글로 구현한 KoCLIP file 깊은바다 2021-11-02 2833
구글이 만든 딥러닝 자동그리기 - AutoDraw [2] 깊은바다 2017-04-13 2821
객체 검출 딥러닝 모델인 YOLO의 테드 영상 깊은바다 2019-05-22 2819
GAN을 이용한 염색 및 헤어 스타일 합성 - 꽤 GAN찮은 헤어살롱 깊은바다 2020-10-29 2817
GAN으로 얼굴사진을 생성하는 사이트 - Face Generator file 깊은바다 2021-04-28 2795
딥 러닝 이후, AI 알고리즘 트렌드 깊은바다 2019-03-11 2747
텐서플로우에서 구글의 이미지 인식 프로그램 사용하기 file [2] 깊은바다 2017-03-30 2719
StyleGAN을 이말년 웹툰으로 파인튜닝한 모델 깊은바다 2020-08-07 2714
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 깊은바다 2018-06-26 2686
딥러닝이 탄생할 수 있었던 진짜 이유 file 깊은바다 2019-02-01 2572