레플리
글 수 203


K-001.png

 

https://openai.com/blog/image-gpt/

 

 

 

GPT2는 원래 텍스트를 생성하는 딥러닝 모델입니다. 이 구조를 그대로 사용해서 이미지에 적용한 iGPT가 나왔습니다. 방식은 거의 유사합니다. 글자 대신 픽셀을 묶어서 입력에 넣으면 다음 픽셀을 예측합니다. 예측한 픽셀은 다시 입력으로 들어가는 자동회귀(autoregressive)입니다.

 

첫 번째 실험에서는 사진의 절반을 주고 나머지 절반을 생성하였습니다. 두 번째는 랜덤하게 시작을 해서 전체 사진을 완성합니다. 모두 상당히 그럴듯한 이미지가 만들어졌습니다.

 

기존 GAN과 같은 모델은 사진을 벡터로 압축하고, 벡터의 잠재공간(latent space)를 변형하여 다시 이미지로 변환합니다. 이렇게 하면 안경을 쓴다던가, 표정을 바꾸는 등 다양하게 조작이 가능합니다. 반면에 iGPT는 앞의 픽셀과 이어지는 픽셀을 연속적으로 생성하는거라 조금 차이가 있습니다. 단일 이미지보다는 영상을 만드는데 더 적합하지 않을까 생각됩니다.

 

List of Articles
제목 글쓴이 날짜 조회 수
불쾌한 골짜기에서 대유쾌 마운틴으로 - 이미지 생성AI file 깊은바다 2023-03-08 6926
아카라이브 반실사 채널 - Stable Diffusion 실사 그림 file 깊은바다 2023-03-01 2104
사인필드 시트콤을 패러디한 AI 생성 애니메이션 방송 file 깊은바다 2023-02-01 402
글로 설명하면 음악을 만들어주는 딥러닝 모델 - MusicLM 깊은바다 2023-01-27 446
Stable Diffusion 포토샵 플러그인 깊은바다 2022-12-25 2392
GPT : 도래한 초거대 AI의 시대, 빅테크가 주도할 수 밖에 없는 이유 file 깊은바다 2022-12-22 329
Stable Diffusion을 사용한 사진 변환 앱 Lensa AI, 앱스토어 1위 달성 깊은바다 2022-12-09 785
NVIDIA가 발표한 Text-to-3D 모델 - Magic3D 깊은바다 2022-11-22 652
아이폰에서 실행하는 Stable Diffusion 앱 - Draw Things 깊은바다 2022-11-11 1285
일기를 쓰면 그림을 그려주는 그림일기 서비스 file 깊은바다 2022-11-08 1895
World Models를 만든 David Ha, 구글에서 StabilityAI로 이적 file 깊은바다 2022-10-11 361
인공지능 킬러앱의 등장, 그리고 모바일에서 인공지능으로 패러다임 변환 file 깊은바다 2022-10-10 511
Text-to-Image 모델을 정리한 글 - The State of AI and Art 2022 깊은바다 2022-10-06 1168
Text-to-3D인 DreamFusion과 Text-to-Video인 Make-A-Video 깊은바다 2022-10-01 438
Stable Diffusion으로 만든 뮤직비디오 영상 깊은바다 2022-09-25 1128