딥러닝 - 자동회귀(autoregressive)로 이미지를 생성하는 iGPT

글 수 203

자동회귀(autoregressive)로 이미지를 생성하는 iGPT

조회 수 821 추천 수 0 2020.06.18 14:00:09

깊은바다 *.68.247.45 http://aidev.co.kr/9269

GPT2는 원래 텍스트를 생성하는 딥러닝 모델입니다. 이 구조를 그대로 사용해서 이미지에 적용한 iGPT가 나왔습니다. 방식은 거의 유사합니다. 글자 대신 픽셀을 묶어서 입력에 넣으면 다음 픽셀을 예측합니다. 예측한 픽셀은 다시 입력으로 들어가는 자동회귀(autoregressive)입니다.

첫 번째 실험에서는 사진의 절반을 주고 나머지 절반을 생성하였습니다. 두 번째는 랜덤하게 시작을 해서 전체 사진을 완성합니다. 모두 상당히 그럴듯한 이미지가 만들어졌습니다.

기존 GAN과 같은 모델은 사진을 벡터로 압축하고, 벡터의 잠재공간(latent space)를 변형하여 다시 이미지로 변환합니다. 이렇게 하면 안경을 쓴다던가, 표정을 바꾸는 등 다양하게 조작이 가능합니다. 반면에 iGPT는 앞의 픽셀과 이어지는 픽셀을 연속적으로 생성하는거라 조금 차이가 있습니다. 단일 이미지보다는 영상을 만드는데 더 적합하지 않을까 생각됩니다.

이 게시물을

K-001.png [File Size:102.8KB/Download:39]

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
오픈소스로 공개된 Text-to-Image 모델 - Stable Diffusion	깊은바다	2022-09-07	1349
Dall.E 2 Prompt Book - 프롬프트 작성 가이드	깊은바다	2022-07-14	4380
최초로 인간 수준의 크기를 가진 중국의 딥러닝 모델 - BaGuaLu	깊은바다	2022-06-23	1117
미국에서 Dalle Mini로 짤(Meme)을 만드는게 유행	깊은바다	2022-06-19	1632
말로 영상을 생성하는 딥러닝 모델 - CogVideo	깊은바다	2022-05-30	1070
DALL.E를 직접 테스트해볼 수 있는 사이트 - DALL.E mini	깊은바다	2022-05-17	11542
전문가 수준의 사진을 생성하는 NVIDIA의 PoE-GAN	깊은바다	2022-02-16	1280
메타AI의 멀티모달 자기지도학습 모델인 Data2vec	깊은바다	2022-01-26	1032
GAN으로 사진에서 특정 부분을 지워주는 서비스 - Cleanup.pictures	깊은바다	2022-01-17	1026
3D 이미지를 만드는 GAN - StyleNeRF	깊은바다	2021-12-20	841
CLIP을 사용하여 말로 그림을 그려주는 스마트폰 앱 - WOMBO Dream	깊은바다	2021-11-25	1780
내가 말하는 걸 보여줘, DALL-E	깊은바다	2021-11-11	1062
텍스트를 이미지로 생성해주는 사이트 - Text2Art (VQGAN-CLIP)	깊은바다	2021-11-10	6899
원티드는 어떻게 AI로 채용 결과를 예측하고 매칭할까	깊은바다	2021-11-09	961
OpenAI의 CLIP을 한글로 구현한 KoCLIP	깊은바다	2021-11-02	2815

쓰기

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지