레플리
글 수 203

말로 영상을 생성하는 딥러닝 모델 - CogVideo

조회 수 1069 추천 수 0 2022.05.30 11:59:07


 

 

cog.jpg

 

https://github.com/THUDM/CogVideo

 

 

 

중국 칭화대에서 CogVideo(Large-scale Pretraining for Text-to-Video Generation via Transformers)란 모델을 공개했습니다. 아직 논문은 안나왔고 github에 결과물만 올려놓았습니다. 말로 설명하면 4초 분량의 32프레임 동영상을 생성합니다.

 

조만간 이런 모델이 나올줄은 알았지만 신기하네요. 말로 이미지를 생성하는 DALL.E2나 Imagen은 당장 상용화 수준을 넘어섰다고 봅니다. 아마 몇 년 지나면 이런 동영상 생성 모델도 성능이 급격히 올라갈 것 같습니다. 그때는 개인 혼자서 영화를 만드는 세상이 올까요.

 

List of Articles
제목 글쓴이 날짜 조회 수
오픈소스로 공개된 Text-to-Image 모델 - Stable Diffusion 깊은바다 2022-09-07 1336
Dall.E 2 Prompt Book - 프롬프트 작성 가이드 깊은바다 2022-07-14 4339
최초로 인간 수준의 크기를 가진 중국의 딥러닝 모델 - BaGuaLu file 깊은바다 2022-06-23 1116
미국에서 Dalle Mini로 짤(Meme)을 만드는게 유행 file 깊은바다 2022-06-19 1583
말로 영상을 생성하는 딥러닝 모델 - CogVideo file 깊은바다 2022-05-30 1069
DALL.E를 직접 테스트해볼 수 있는 사이트 - DALL.E mini file 깊은바다 2022-05-17 11520
전문가 수준의 사진을 생성하는 NVIDIA의 PoE-GAN 깊은바다 2022-02-16 1279
메타AI의 멀티모달 자기지도학습 모델인 Data2vec 깊은바다 2022-01-26 1028
GAN으로 사진에서 특정 부분을 지워주는 서비스 - Cleanup.pictures file 깊은바다 2022-01-17 1018
3D 이미지를 만드는 GAN - StyleNeRF 깊은바다 2021-12-20 835
CLIP을 사용하여 말로 그림을 그려주는 스마트폰 앱 - WOMBO Dream file 깊은바다 2021-11-25 1777
내가 말하는 걸 보여줘, DALL-E 깊은바다 2021-11-11 1062
텍스트를 이미지로 생성해주는 사이트 - Text2Art (VQGAN-CLIP) file 깊은바다 2021-11-10 6865
원티드는 어떻게 AI로 채용 결과를 예측하고 매칭할까 깊은바다 2021-11-09 959
OpenAI의 CLIP을 한글로 구현한 KoCLIP file 깊은바다 2021-11-02 2735