레플리
글 수 203

내가 말하는 걸 보여줘, DALL-E

조회 수 1062 추천 수 0 2021.11.11 12:49:13


 

https://jiho-ml.com/weekly-nlp-40/

 

 

 

요즘 딥러닝에서 멀티모달 모델이 관심을 받고 있습니다. 기존에는 이미지 모델, 자연어처리 모델, 음성 모델 등이 별도로 존재했습니다. 반면에 멀티 모달은 다양한 형태의 데이터를 동시에 고려합니다.

 

OpenAI가 발표한 DALL-E가 대표적입니다. 문장을 입력하면 거기에 맞는 이미지를 생성해냅니다. GPT-3와 같은 구조이지만 텍스트와 이미지를 동시에 처리한다는 차이가 있습니다. 좀 더 자세한 사항은 링크의 글을 참고 바랍니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
OpenAI의 Sora로 만든 단편영화 file 깊은바다 2024-03-26 180
만약 ChatGPT가 영상으로 세상을 이해하게 된다면? file 깊은바다 2024-02-16 258
인도의 생성AI 영화 - Maharaja in Denims 깊은바다 2024-01-16 197
누구나 쉽게 AI 인플루언서를 만드는 시대 - Aitana Lopez file 깊은바다 2024-01-04 172
95생 천재 소녀가 만든 Pika가 빅테크들을 이길 수 있었던 이유 file [2] 깊은바다 2023-12-24 976
Text-to-Video 생성 서비스인 Pika, 5500만달러 투자 유치 file 깊은바다 2023-11-29 149
AI의 미래 - Coatue가 주목한 AI 산업 트렌드 깊은바다 2023-11-28 203
가구 카탈로그를 만들어주는 생성AI - 뚝딱 AI 스튜디오 file 깊은바다 2023-09-22 363
내가 원하는 사진을 만드는 생성AI SNS - 트윅(Tweak) file 깊은바다 2023-09-04 467
마우스로 끌어서 사진을 수정하는 딥러닝 - DragGAN 깊은바다 2023-05-21 446
생성 AI의 시대, 진짜 메타버스가 온다 깊은바다 2023-04-04 374
ChatGPT와 Stable Diffusion에 대한 정지훈 교수님 강의 깊은바다 2023-04-03 423
미드저니로 생성한 90년대 중국 사진들 - 콘텐츠 산업의 혁신 file 깊은바다 2023-03-30 768
어도비의 생성AI 프로그램 - Firefly 깊은바다 2023-03-23 349
초거대AI를 API로 썼을 때 경쟁업체와 차별화를 하려면 깊은바다 2023-03-20 300