레플리
글 수 204


K-001.png

 

https://openai.com/blog/image-gpt/

 

 

 

GPT2는 원래 텍스트를 생성하는 딥러닝 모델입니다. 이 구조를 그대로 사용해서 이미지에 적용한 iGPT가 나왔습니다. 방식은 거의 유사합니다. 글자 대신 픽셀을 묶어서 입력에 넣으면 다음 픽셀을 예측합니다. 예측한 픽셀은 다시 입력으로 들어가는 자동회귀(autoregressive)입니다.

 

첫 번째 실험에서는 사진의 절반을 주고 나머지 절반을 생성하였습니다. 두 번째는 랜덤하게 시작을 해서 전체 사진을 완성합니다. 모두 상당히 그럴듯한 이미지가 만들어졌습니다.

 

기존 GAN과 같은 모델은 사진을 벡터로 압축하고, 벡터의 잠재공간(latent space)를 변형하여 다시 이미지로 변환합니다. 이렇게 하면 안경을 쓴다던가, 표정을 바꾸는 등 다양하게 조작이 가능합니다. 반면에 iGPT는 앞의 픽셀과 이어지는 픽셀을 연속적으로 생성하는거라 조금 차이가 있습니다. 단일 이미지보다는 영상을 만드는데 더 적합하지 않을까 생각됩니다.

 

List of Articles
제목 글쓴이 날짜sort 조회 수
GAN의 상용화를 알리는 시작 - 포토샵 뉴럴 필터 깊은바다 2020-10-22 884
GAN을 이용한 염색 및 헤어 스타일 합성 - 꽤 GAN찮은 헤어살롱 깊은바다 2020-10-29 2817
알렉스넷과 Seq2Seq의 창시자 일리야 수츠케버(Ilya Sutskever) 깊은바다 2020-11-17 832
GAN으로 만든 얼굴을 테스트할 수 있는 뉴욕타임스의 기사 file 깊은바다 2020-11-24 682
문장을 사진으로 변환하는 GPT-3 모델, DALL-E 깊은바다 2021-01-09 986
톰 크루즈의 딥페이크 영상 file 깊은바다 2021-02-28 672
사진 한 장으로 움직이는 얼굴을 만드는 사이트 - Deep Nostalgia 깊은바다 2021-03-01 4291
이젠 모델 구축도 학습도 필요없다, OpenAI의 이미지인식 모델 CLIP file 깊은바다 2021-03-07 4363
스냅챕의 디즈니 필터 깊은바다 2021-03-12 529
뉴런 하나로 특정 개념을 표현한다, CLIP 모델에서 개념 뉴런을 발견 file 깊은바다 2021-03-12 575
딥러닝의 창시자인 제프리 힌튼이 구글에 합류하게 된 스토리 깊은바다 2021-03-18 418
GPT-3로 광고문구를 만드는 서비스 - Copy.ai 깊은바다 2021-03-22 648
말로 설명하여 이미지를 변형하는 GAN - StyleCLIP file 깊은바다 2021-04-04 1820
GAN으로 얼굴사진을 생성하는 사이트 - Face Generator file 깊은바다 2021-04-28 2798
Transformer와 동급의 성능에 속도는 훨씬 빨라진 MLP-Mixer file 깊은바다 2021-06-11 1448