딥러닝 - 내가 말하는 걸 보여줘, DALL-E

글 수 203

조회 수 1062 추천 수 0 2021.11.11 12:49:13

깊은바다 *.106.133.166 http://aidev.co.kr/10923

요즘 딥러닝에서 멀티모달 모델이 관심을 받고 있습니다. 기존에는 이미지 모델, 자연어처리 모델, 음성 모델 등이 별도로 존재했습니다. 반면에 멀티 모달은 다양한 형태의 데이터를 동시에 고려합니다.

OpenAI가 발표한 DALL-E가 대표적입니다. 문장을 입력하면 거기에 맞는 이미지를 생성해냅니다. GPT-3와 같은 구조이지만 텍스트와 이미지를 동시에 처리한다는 차이가 있습니다. 좀 더 자세한 사항은 링크의 글을 참고 바랍니다.

List of Articles

제목	글쓴이	날짜	조회 수
OpenAI의 Sora로 만든 단편영화	깊은바다	2024-03-26	180
만약 ChatGPT가 영상으로 세상을 이해하게 된다면?	깊은바다	2024-02-16	258
인도의 생성AI 영화 - Maharaja in Denims	깊은바다	2024-01-16	197
누구나 쉽게 AI 인플루언서를 만드는 시대 - Aitana Lopez	깊은바다	2024-01-04	172
95생 천재 소녀가 만든 Pika가 빅테크들을 이길 수 있었던 이유 [2]	깊은바다	2023-12-24	976
Text-to-Video 생성 서비스인 Pika, 5500만달러 투자 유치	깊은바다	2023-11-29	149
AI의 미래 - Coatue가 주목한 AI 산업 트렌드	깊은바다	2023-11-28	203
가구 카탈로그를 만들어주는 생성AI - 뚝딱 AI 스튜디오	깊은바다	2023-09-22	363
내가 원하는 사진을 만드는 생성AI SNS - 트윅(Tweak)	깊은바다	2023-09-04	467
마우스로 끌어서 사진을 수정하는 딥러닝 - DragGAN	깊은바다	2023-05-21	446
생성 AI의 시대, 진짜 메타버스가 온다	깊은바다	2023-04-04	374
ChatGPT와 Stable Diffusion에 대한 정지훈 교수님 강의	깊은바다	2023-04-03	423
미드저니로 생성한 90년대 중국 사진들 - 콘텐츠 산업의 혁신	깊은바다	2023-03-30	768
어도비의 생성AI 프로그램 - Firefly	깊은바다	2023-03-23	349
초거대AI를 API로 썼을 때 경쟁업체와 차별화를 하려면	깊은바다	2023-03-20	300

쓰기

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지