레플리
글 수 203

내가 말하는 걸 보여줘, DALL-E

조회 수 1062 추천 수 0 2021.11.11 12:49:13


 

https://jiho-ml.com/weekly-nlp-40/

 

 

 

요즘 딥러닝에서 멀티모달 모델이 관심을 받고 있습니다. 기존에는 이미지 모델, 자연어처리 모델, 음성 모델 등이 별도로 존재했습니다. 반면에 멀티 모달은 다양한 형태의 데이터를 동시에 고려합니다.

 

OpenAI가 발표한 DALL-E가 대표적입니다. 문장을 입력하면 거기에 맞는 이미지를 생성해냅니다. GPT-3와 같은 구조이지만 텍스트와 이미지를 동시에 처리한다는 차이가 있습니다. 좀 더 자세한 사항은 링크의 글을 참고 바랍니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
오픈소스로 공개된 Text-to-Image 모델 - Stable Diffusion 깊은바다 2022-09-07 1336
Dall.E 2 Prompt Book - 프롬프트 작성 가이드 깊은바다 2022-07-14 4339
최초로 인간 수준의 크기를 가진 중국의 딥러닝 모델 - BaGuaLu file 깊은바다 2022-06-23 1116
미국에서 Dalle Mini로 짤(Meme)을 만드는게 유행 file 깊은바다 2022-06-19 1582
말로 영상을 생성하는 딥러닝 모델 - CogVideo file 깊은바다 2022-05-30 1069
DALL.E를 직접 테스트해볼 수 있는 사이트 - DALL.E mini file 깊은바다 2022-05-17 11518
전문가 수준의 사진을 생성하는 NVIDIA의 PoE-GAN 깊은바다 2022-02-16 1279
메타AI의 멀티모달 자기지도학습 모델인 Data2vec 깊은바다 2022-01-26 1028
GAN으로 사진에서 특정 부분을 지워주는 서비스 - Cleanup.pictures file 깊은바다 2022-01-17 1018
3D 이미지를 만드는 GAN - StyleNeRF 깊은바다 2021-12-20 835
CLIP을 사용하여 말로 그림을 그려주는 스마트폰 앱 - WOMBO Dream file 깊은바다 2021-11-25 1777
내가 말하는 걸 보여줘, DALL-E 깊은바다 2021-11-11 1062
텍스트를 이미지로 생성해주는 사이트 - Text2Art (VQGAN-CLIP) file 깊은바다 2021-11-10 6865
원티드는 어떻게 AI로 채용 결과를 예측하고 매칭할까 깊은바다 2021-11-09 959
OpenAI의 CLIP을 한글로 구현한 KoCLIP file 깊은바다 2021-11-02 2733