딥러닝 - 내가 말하는 걸 보여줘, DALL-E

글 수 203

조회 수 1062 추천 수 0 2021.11.11 12:49:13

깊은바다 *.106.133.166 http://aidev.co.kr/10923

요즘 딥러닝에서 멀티모달 모델이 관심을 받고 있습니다. 기존에는 이미지 모델, 자연어처리 모델, 음성 모델 등이 별도로 존재했습니다. 반면에 멀티 모달은 다양한 형태의 데이터를 동시에 고려합니다.

OpenAI가 발표한 DALL-E가 대표적입니다. 문장을 입력하면 거기에 맞는 이미지를 생성해냅니다. GPT-3와 같은 구조이지만 텍스트와 이미지를 동시에 처리한다는 차이가 있습니다. 좀 더 자세한 사항은 링크의 글을 참고 바랍니다.

List of Articles

제목	글쓴이	날짜	조회 수
스케치를 사진으로 변환하는 딥러닝 - NVIDIA의 GauGAN	깊은바다	2019-03-20	968
95생 천재 소녀가 만든 Pika가 빅테크들을 이길 수 있었던 이유 [2]	깊은바다	2023-12-24	976
문장을 사진으로 변환하는 GPT-3 모델, DALL-E	깊은바다	2021-01-09	985
어떻게 컴퓨터가 사진을 이해하게 되었는가	깊은바다	2017-03-31	995
딥러닝(Deep Learning)에 대한 소개	깊은바다	2016-03-21	1000
GAN으로 사진에서 특정 부분을 지워주는 서비스 - Cleanup.pictures	깊은바다	2022-01-17	1026
메타AI의 멀티모달 자기지도학습 모델인 Data2vec	깊은바다	2022-01-26	1032
CNN 초보자가 만드는 초보자 가이드	깊은바다	2017-04-09	1041
인공신경망 학습 레시피 - 안드레이 카파시의 딥러닝 실전 노하우	깊은바다	2019-04-27	1052
내가 말하는 걸 보여줘, DALL-E	깊은바다	2021-11-11	1062
말로 영상을 생성하는 딥러닝 모델 - CogVideo	깊은바다	2022-05-30	1071
OpenAI의 CLIP을 사용해서 자연어로 유튜브 영상 검색	깊은바다	2021-07-05	1096
최초로 인간 수준의 크기를 가진 중국의 딥러닝 모델 - BaGuaLu	깊은바다	2022-06-23	1117
10분안에 배우는 머신러닝 - GAN 알고리즘 원리와 응용분야	깊은바다	2019-04-01	1131
Stable Diffusion으로 만든 뮤직비디오 영상	깊은바다	2022-09-25	1136

쓰기

첫 페이지 2 3 4 5 6 7 8 9 10 11 끝 페이지