레플리
글 수 203


K-001.png

 

https://openai.com/blog/image-gpt/

 

 

 

GPT2는 원래 텍스트를 생성하는 딥러닝 모델입니다. 이 구조를 그대로 사용해서 이미지에 적용한 iGPT가 나왔습니다. 방식은 거의 유사합니다. 글자 대신 픽셀을 묶어서 입력에 넣으면 다음 픽셀을 예측합니다. 예측한 픽셀은 다시 입력으로 들어가는 자동회귀(autoregressive)입니다.

 

첫 번째 실험에서는 사진의 절반을 주고 나머지 절반을 생성하였습니다. 두 번째는 랜덤하게 시작을 해서 전체 사진을 완성합니다. 모두 상당히 그럴듯한 이미지가 만들어졌습니다.

 

기존 GAN과 같은 모델은 사진을 벡터로 압축하고, 벡터의 잠재공간(latent space)를 변형하여 다시 이미지로 변환합니다. 이렇게 하면 안경을 쓴다던가, 표정을 바꾸는 등 다양하게 조작이 가능합니다. 반면에 iGPT는 앞의 픽셀과 이어지는 픽셀을 연속적으로 생성하는거라 조금 차이가 있습니다. 단일 이미지보다는 영상을 만드는데 더 적합하지 않을까 생각됩니다.

 

List of Articles
제목 글쓴이 날짜 조회 수sort
전신 사진을 생성하는 GAN 깊은바다 2019-05-05 832
알렉스넷과 Seq2Seq의 창시자 일리야 수츠케버(Ilya Sutskever) 깊은바다 2020-11-17 831
당근마켓에서 딥러닝 활용하기 - 불량 게시물 검사 깊은바다 2017-12-23 821
자동회귀(autoregressive)로 이미지를 생성하는 iGPT file 깊은바다 2020-06-18 821
AutoML-Zero, 진화적 알고리즘을 사용하여 신경망 구조 설계 [2] 깊은바다 2020-03-13 820
사진을 텍스트로 설명 - CaptionBot file 깊은바다 2016-04-07 794
딥러닝 이론에서 텐서플로 실습까지 [2] 깊은바다 2017-11-08 786
Stable Diffusion을 사용한 사진 변환 앱 Lensa AI, 앱스토어 1위 달성 깊은바다 2022-12-09 786
스케치와 색을 지정하여 셀카를 편집하는 SC-FEGAN 깊은바다 2019-02-22 771
딥러닝이 작동하는 원리는? 깊은바다 2019-11-17 770
미드저니로 생성한 90년대 중국 사진들 - 콘텐츠 산업의 혁신 file 깊은바다 2023-03-30 767
딥러닝 역사 깊은바다 2018-07-10 749
Semantic Segmentation을 활용한 차량 파손 탐지 딥러닝 모델 개발기 깊은바다 2020-02-14 734
순차적으로 여러가지 일을 동시에 배우는 신경망 깊은바다 2017-03-16 729
얀 르쿤, 자기지도학습이 강화학습보다 중요 깊은바다 2020-05-03 726