딥러닝 - 텍스트를 이미지로 생성해주는 사이트

글 수 208

텍스트를 이미지로 생성해주는 사이트 - Text2Art (VQGAN-CLIP)

조회 수 7430 추천 수 0 2021.11.10 16:06:11

깊은바다 *.106.133.224 https://aidev.co.kr/10916

OpenAI의 CLIP은 이미지와 텍스트를 동시에 고려하는 멀티모달 모델입니다. 이를 활용한 다양한 애플리케이션이 등장하고 있는데요. 이번에는 Text2Art란 사이트가 생겼습니다. 말로 설명하면 그림을 그려주는 서비스입니다.

DALL-E와 비슷하지만 동작방식에 차이가 있습니다. DALL-E는 GPT-3에 텍스트를 넣어 다음 픽셀을 예측합니다. 그 픽셀은 텍스트와 함께 다시 입력으로 들어갑니다. 이렇게 계속 반복적으로 예측하면서 전체 이미지를 생성합니다.

(참고 - https://jiho-ml.com/weekly-nlp-40/)

반면에 Text2Art는 VQGAN을 사용합니다. GAN은 생성자와 판별자가 서로 경쟁하면서 학습을 합니다. VQGAN-CLIP도 마찬가지입니다. VQGAN이 이미지를 만들면, CLIP이 그 이미지가 해당 텍스트와 일치하는지 검사를 합니다. 이 과정을 여러번 반복하면 점점 텍스트 설명과 유사한 이미지가 생성됩니다.

우리 뇌에서도 아마 같은 의미를 가진 다양한 형태의 개념들은 하나로 처리되지 않을까 생각됩니다. 예를 들어, '강아지'란 단어와 강아지의 이미지, 강아지가 내는 멍멍하는 소리는 서로 연결되어 있습니다. 우리는 강아지를 떠올리면 이런 개념들을 동시에 연상합니다. CLIP은 딥러닝도 같은 방식으로 동작할 수 있다는 것을 보여줬습니다. 앞으로 이를 활용한 재미있는 사례가 계속 나오지 않을까요.

< Text2Art >

https://text2art.com/

< 개발과정 >

https://towardsdatascience.com/how-i-built-an-ai-text-to...

< Github >

https://github.com/mfrashad/text2art

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
CLIP을 사용하여 말로 그림을 그려주는 스마트폰 앱 - WOMBO Dream	깊은바다	2021-11-25	2045
내가 말하는 걸 보여줘, DALL-E	깊은바다	2021-11-11	1315
텍스트를 이미지로 생성해주는 사이트 - Text2Art (VQGAN-CLIP)	깊은바다	2021-11-10	7430
원티드는 어떻게 AI로 채용 결과를 예측하고 매칭할까	깊은바다	2021-11-09	1231
OpenAI의 CLIP을 한글로 구현한 KoCLIP	깊은바다	2021-11-02	3634
인공지능 과학자의 꿈, 범용 AI는 가능할까	깊은바다	2021-10-15	1131
딥러닝 범용 모델 - Foundation Models	깊은바다	2021-09-06	1587
소프트웨어 개발 경험이 먼저다 - 딥러닝 역시 S/W 기술의 하나일 뿐	깊은바다	2021-07-14	1172
제프리 힌튼, 얀 르쿤, 요슈아 벤지오가 말하는 딥러닝의 미래	깊은바다	2021-07-08	1173
OpenAI의 CLIP을 사용해서 자연어로 유튜브 영상 검색	깊은바다	2021-07-05	1476
스케치를 사진으로 바꾸어주는 프로그램 - NVIDIA CANVAS	깊은바다	2021-06-25	876
한 단어만으로 텍스트 스타일을 바꿔주는 딥러닝 모델 - TextStyleBrush	깊은바다	2021-06-24	916
GameGAN으로 직접 화면을 생성하는 GTA5 게임	깊은바다	2021-06-20	867
Transformer와 동급의 성능에 속도는 훨씬 빨라진 MLP-Mixer	깊은바다	2021-06-11	1830
GAN으로 얼굴사진을 생성하는 사이트 - Face Generator	깊은바다	2021-04-28	3172

쓰기

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지