글 수 120


K-001.png

 

https://openai.com/blog/image-gpt/

 

 

 

GPT2는 원래 텍스트를 생성하는 딥러닝 모델입니다. 이 구조를 그대로 사용해서 이미지에 적용한 iGPT가 나왔습니다. 방식은 거의 유사합니다. 글자 대신 픽셀을 묶어서 입력에 넣으면 다음 픽셀을 예측합니다. 예측한 픽셀은 다시 입력으로 들어가는 자동회귀(autoregressive)입니다.

 

첫 번째 실험에서는 사진의 절반을 주고 나머지 절반을 생성하였습니다. 두 번째는 랜덤하게 시작을 해서 전체 사진을 완성합니다. 모두 상당히 그럴듯한 이미지가 만들어졌습니다.

 

기존 GAN과 같은 모델은 사진을 벡터로 압축하고, 벡터의 잠재공간(latent space)를 변형하여 다시 이미지로 변환합니다. 이렇게 하면 안경을 쓴다던가, 표정을 바꾸는 등 다양하게 조작이 가능합니다. 반면에 iGPT는 앞의 픽셀과 이어지는 픽셀을 연속적으로 생성하는거라 조금 차이가 있습니다. 단일 이미지보다는 영상을 만드는데 더 적합하지 않을까 생각됩니다.

 

List of Articles
제목 글쓴이 날짜 조회 수
GAN으로 만든 모델 사진을 판매하는 일본 회사 new 깊은바다 2020-07-08 12
생성 모델이 일반 인공지능(AGI)으로 가는 열쇠 file 깊은바다 2020-06-29 332
퓨샷 러닝(few-shot learning)과 메타 러닝(meta-learning) 깊은바다 2020-06-27 109
자동회귀(autoregressive)로 이미지를 생성하는 iGPT file 깊은바다 2020-06-18 149
GPT3를 기반으로한 OpenAI API 유료화 깊은바다 2020-06-12 231
스케치를 얼굴사진으로 변형하는 딥러닝 생성모델 - DeepFaceDrawing 깊은바다 2020-06-07 110
AI는 '스스로 학습'할 수 있을까? - 자기지도학습 깊은바다 2020-06-02 164
팩맨 게임을 딥러닝으로 시뮬레이션한 GameGAN 깊은바다 2020-05-23 152
CNN 시각화 사이트 - CNN Explainer 깊은바다 2020-05-10 224
얀 르쿤, 자기지도학습이 강화학습보다 중요 깊은바다 2020-05-03 161
미디가 아니라 오디오로 음악을 만들어내는 OpenAI의 생성 모델 - Jukebox file 깊은바다 2020-05-02 75
딥러닝 웹서비스 개발 도전기 - 연예인 얼굴 판별기 깊은바다 2020-05-01 146
사회적 거리를 지키는지 확인하는 지능형 CCTV 깊은바다 2020-04-23 161
딥페이크로 일론 머스크인 척 친구들을 속이는 영상 깊은바다 2020-04-19 194
딥마인드의 Agent57, 아타리 게임 벤치마크 정복 깊은바다 2020-04-03 171