글 수 208
RetrieveGAN이라는 재미있는 모델이 공개됐습니다. 말로 장면을 설명하면 거기에 맞는 이미지를 만들어냅니다. StackGAN(http://aidev.co.kr/5894)과 비슷하지만 큰 차이가 있습니다. 문장에서 바로 사진을 생성하지 않고, 먼저 데이터셋에서 각 오브젝트의 사진 조각들을 찾습니다. 그다음 이 사진 조각들을 사용해서 GAN으로 전체 이미지를 다시 그립니다. 이렇게 하면 좀 더 정확한 사진을 만들 수 있습니다.
예를 들어, '하늘이 보이는 바다위에 사람이 있다'라는 문장이 주어졌습니다. 우선 이를 그래프로 변환하고, 다시 수학적인 형식으로 표현합니다. 그리고 '하늘', '바다', '사람'의 사진 조각을 데이터에서 검색합니다. 마지막으로 GAN을 통해 하나의 이미지를 생성합니다.
작년에 NVIDIA에서 스케치를 사진으로 만들어주는 GauGAN(http://aidev.co.kr/7184)을 발표하기도 했습니다. 앞으로는 더 나아가 컴퓨터와 대화하면서 그림을 그리는 시대가 될 것 같습니다.