레플리
글 수 208

내가 말하는 걸 보여줘, DALL-E

조회 수 1120 추천 수 0 2021.11.11 12:49:13


 

https://jiho-ml.com/weekly-nlp-40/

 

 

 

요즘 딥러닝에서 멀티모달 모델이 관심을 받고 있습니다. 기존에는 이미지 모델, 자연어처리 모델, 음성 모델 등이 별도로 존재했습니다. 반면에 멀티 모달은 다양한 형태의 데이터를 동시에 고려합니다.

 

OpenAI가 발표한 DALL-E가 대표적입니다. 문장을 입력하면 거기에 맞는 이미지를 생성해냅니다. GPT-3와 같은 구조이지만 텍스트와 이미지를 동시에 처리한다는 차이가 있습니다. 좀 더 자세한 사항은 링크의 글을 참고 바랍니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
CLIP을 사용하여 말로 그림을 그려주는 스마트폰 앱 - WOMBO Dream file 깊은바다 2021-11-25 1839
내가 말하는 걸 보여줘, DALL-E 깊은바다 2021-11-11 1120
텍스트를 이미지로 생성해주는 사이트 - Text2Art (VQGAN-CLIP) file 깊은바다 2021-11-10 7090
원티드는 어떻게 AI로 채용 결과를 예측하고 매칭할까 깊은바다 2021-11-09 1036
OpenAI의 CLIP을 한글로 구현한 KoCLIP file 깊은바다 2021-11-02 3332
인공지능 과학자의 꿈, 범용 AI는 가능할까 깊은바다 2021-10-15 932
딥러닝 범용 모델 - Foundation Models 깊은바다 2021-09-06 1388
소프트웨어 개발 경험이 먼저다 - 딥러닝 역시 S/W 기술의 하나일 뿐 깊은바다 2021-07-14 972
제프리 힌튼, 얀 르쿤, 요슈아 벤지오가 말하는 딥러닝의 미래 깊은바다 2021-07-08 972
OpenAI의 CLIP을 사용해서 자연어로 유튜브 영상 검색 깊은바다 2021-07-05 1225
스케치를 사진으로 바꾸어주는 프로그램 - NVIDIA CANVAS 깊은바다 2021-06-25 704
한 단어만으로 텍스트 스타일을 바꿔주는 딥러닝 모델 - TextStyleBrush 깊은바다 2021-06-24 752
GameGAN으로 직접 화면을 생성하는 GTA5 게임 깊은바다 2021-06-20 702
Transformer와 동급의 성능에 속도는 훨씬 빨라진 MLP-Mixer file 깊은바다 2021-06-11 1575
GAN으로 얼굴사진을 생성하는 사이트 - Face Generator file 깊은바다 2021-04-28 2951