레플리
글 수 203

내가 말하는 걸 보여줘, DALL-E

조회 수 1062 추천 수 0 2021.11.11 12:49:13


 

https://jiho-ml.com/weekly-nlp-40/

 

 

 

요즘 딥러닝에서 멀티모달 모델이 관심을 받고 있습니다. 기존에는 이미지 모델, 자연어처리 모델, 음성 모델 등이 별도로 존재했습니다. 반면에 멀티 모달은 다양한 형태의 데이터를 동시에 고려합니다.

 

OpenAI가 발표한 DALL-E가 대표적입니다. 문장을 입력하면 거기에 맞는 이미지를 생성해냅니다. GPT-3와 같은 구조이지만 텍스트와 이미지를 동시에 처리한다는 차이가 있습니다. 좀 더 자세한 사항은 링크의 글을 참고 바랍니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
모두를 위한 머신러닝/딥러닝 강의 깊은바다 2016-04-03 1224
쉽게 씌어진 GAN 깊은바다 2018-04-11 1224
사진을 복원하는 딥러닝 모델 - DFDNet 깊은바다 2020-08-24 1223
빈 주차공간을 찾아서 알려주는 인공지능 만든 개발자 깊은바다 2019-02-09 1210
AutoML을 이용한 Architecture Search 소개 및 NASNet 논문 리뷰 깊은바다 2019-08-18 1207
텐서플로우 기초 이해하기 깊은바다 2017-03-11 1205
GAN으로 만든 가짜 사진과 진짜 사진을 맞추는 사이트 file 깊은바다 2019-03-04 1202
Text-to-Image 모델을 정리한 글 - The State of AI and Art 2022 깊은바다 2022-10-06 1197
Stable Diffusion으로 만든 뮤직비디오 영상 깊은바다 2022-09-25 1136
10분안에 배우는 머신러닝 - GAN 알고리즘 원리와 응용분야 깊은바다 2019-04-01 1131
최초로 인간 수준의 크기를 가진 중국의 딥러닝 모델 - BaGuaLu file 깊은바다 2022-06-23 1117
OpenAI의 CLIP을 사용해서 자연어로 유튜브 영상 검색 깊은바다 2021-07-05 1096
말로 영상을 생성하는 딥러닝 모델 - CogVideo file 깊은바다 2022-05-30 1071
내가 말하는 걸 보여줘, DALL-E 깊은바다 2021-11-11 1062
인공신경망 학습 레시피 - 안드레이 카파시의 딥러닝 실전 노하우 깊은바다 2019-04-27 1052