레플리
글 수 203


0e0006ad-26b9-4868-af4c-e5d8186c8e20.png

 

http://www.kakaobrain.com/blog/55?fbclid=IwAR2qjoW9zALGrzEMaYxQmPyr-hg3hC4lGCHTJzuU1ASYdoKOyml3byIV8Rg

 

 

 

"그러나 지난 4년간 GAN의 발전상을 보자면 언젠가는 이미지 속 인물의 성별, 나이뿐만 아니라 신체 부위를 자유자재로 바꿀 수 있게 될 것으로 기대됩니다. 원하는 포즈를 취하는 인물도 만들어낼 수 있음은 물론이죠. 또는 "트렌치코트를 입은 한 여인이 카페 안에서 창밖을 바라보고 있다"는 문장대로 이미지를 생성할 수 있게 될 것으로 보입니다. 개인적으로는 GAN을 활용한 인물 생성 알고리즘의 활용 예상 분야 중 하나가 온라인 모델 시장이지 않을까 싶습니다."

 

 

 

GAN과 같은 생성모델은 이미지와 잠재공간(latent space) 사이의 관계를 찾는 것입니다. 예를 들어, 모든 얼굴 사진이 (x, y)라는 2차원 벡터로 표현된다고 생각해 보겠습니다. 하나의 사진은 (x, y) 벡터 한 점을 가리킵니다. 훈련 사진이 1만장이라고 했을 때, 이는 무한대에 가까운 잠재공간에서 극히 일부분에 불과합니다.

 

하지만 사진이 벡터로 바뀌는 모델, 또는 벡터가 사진으로 바뀌는 모델을 만들 수 있다면 어떨까요. 이렇게 하면 훈련 데이터와 매칭되지 않는 잠재 공간 속 벡터로 전혀 새로운 사진을 생성할 수 있습니다.

 

잠재공간에서 비슷한 위치에 있는 사진은 그 형태도 유사합니다. 게다가 벡터 연산도 가능합니다. word2vec에서 '(왕 - 남자) + 여자 = 여왕'인 것과 똑같습니다. 지금도 GAN에서 안경이나 웃음 벡터를 찾아 연산하여 사진을 원하는 모습으로 변경할 수 있습니다.

 

앞으로 이런 기술이 발전하면 거의 자유자재로 인물의 움직임이나 배경의 형태 등을 바꿀지도 모릅니다. 지금 그래픽 프로그램으로 3D 모델링의 위치나 애니메이션을 조작하는 것과 마찬가지일 것입니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
오픈소스로 공개된 Text-to-Image 모델 - Stable Diffusion 깊은바다 2022-09-07 1347
Dall.E 2 Prompt Book - 프롬프트 작성 가이드 깊은바다 2022-07-14 4377
최초로 인간 수준의 크기를 가진 중국의 딥러닝 모델 - BaGuaLu file 깊은바다 2022-06-23 1117
미국에서 Dalle Mini로 짤(Meme)을 만드는게 유행 file 깊은바다 2022-06-19 1627
말로 영상을 생성하는 딥러닝 모델 - CogVideo file 깊은바다 2022-05-30 1070
DALL.E를 직접 테스트해볼 수 있는 사이트 - DALL.E mini file 깊은바다 2022-05-17 11540
전문가 수준의 사진을 생성하는 NVIDIA의 PoE-GAN 깊은바다 2022-02-16 1280
메타AI의 멀티모달 자기지도학습 모델인 Data2vec 깊은바다 2022-01-26 1032
GAN으로 사진에서 특정 부분을 지워주는 서비스 - Cleanup.pictures file 깊은바다 2022-01-17 1026
3D 이미지를 만드는 GAN - StyleNeRF 깊은바다 2021-12-20 841
CLIP을 사용하여 말로 그림을 그려주는 스마트폰 앱 - WOMBO Dream file 깊은바다 2021-11-25 1780
내가 말하는 걸 보여줘, DALL-E 깊은바다 2021-11-11 1062
텍스트를 이미지로 생성해주는 사이트 - Text2Art (VQGAN-CLIP) file 깊은바다 2021-11-10 6899
원티드는 어떻게 AI로 채용 결과를 예측하고 매칭할까 깊은바다 2021-11-09 961
OpenAI의 CLIP을 한글로 구현한 KoCLIP file 깊은바다 2021-11-02 2813