레플리
글 수 203


K-001.png

 

https://openai.com/blog/image-gpt/

 

 

 

GPT2는 원래 텍스트를 생성하는 딥러닝 모델입니다. 이 구조를 그대로 사용해서 이미지에 적용한 iGPT가 나왔습니다. 방식은 거의 유사합니다. 글자 대신 픽셀을 묶어서 입력에 넣으면 다음 픽셀을 예측합니다. 예측한 픽셀은 다시 입력으로 들어가는 자동회귀(autoregressive)입니다.

 

첫 번째 실험에서는 사진의 절반을 주고 나머지 절반을 생성하였습니다. 두 번째는 랜덤하게 시작을 해서 전체 사진을 완성합니다. 모두 상당히 그럴듯한 이미지가 만들어졌습니다.

 

기존 GAN과 같은 모델은 사진을 벡터로 압축하고, 벡터의 잠재공간(latent space)를 변형하여 다시 이미지로 변환합니다. 이렇게 하면 안경을 쓴다던가, 표정을 바꾸는 등 다양하게 조작이 가능합니다. 반면에 iGPT는 앞의 픽셀과 이어지는 픽셀을 연속적으로 생성하는거라 조금 차이가 있습니다. 단일 이미지보다는 영상을 만드는데 더 적합하지 않을까 생각됩니다.

 

List of Articles
제목 글쓴이 날짜 조회 수sort
사진을 디즈니 만화로 바뀌주는 딥러닝 모델 - Toonify 깊은바다 2020-09-21 1343
오픈소스로 공개된 Text-to-Image 모델 - Stable Diffusion 깊은바다 2022-09-07 1351
텐서플로우로 선형 회귀 구현 file 깊은바다 2017-03-09 1360
텐서플로우에서 소프트맥스로 숫자 인식 구현 file 깊은바다 2017-03-09 1373
목소리와 입모양을 변경할 수 있는 GAN 모델 깊은바다 2019-06-13 1388
딥페이크로 일론 머스크인 척 친구들을 속이는 영상 깊은바다 2020-04-19 1389
R-CNN 에서 부터 Mask R-CNN 까지 깊은바다 2019-09-03 1407
Transformer와 동급의 성능에 속도는 훨씬 빨라진 MLP-Mixer file 깊은바다 2021-06-11 1445
CNN 시각화 사이트 - CNN Explainer 깊은바다 2020-05-10 1460
스탠포드 딥러닝 강의 한글화 프로젝트 깊은바다 2017-02-28 1555
이미지 생성모델에서 특징 벡터를 추출하여 사진을 조작하는 방법 file 깊은바다 2020-10-09 1575
쉽게 풀어쓴 딥 러닝의 거의 모든 것 file 깊은바다 2016-03-21 1612
Spiking Neural Networks: 생물학적 신경망을 모방한 차세대 신경망 [2] 깊은바다 2018-08-27 1642
미국에서 Dalle Mini로 짤(Meme)을 만드는게 유행 file 깊은바다 2022-06-19 1648
생성 모델이 일반 인공지능(AGI)으로 가는 열쇠 file 깊은바다 2020-06-29 1688