딥러닝 - 내가 말하는 걸 보여줘, DALL-E

글 수 207

조회 수 1268 추천 수 0 2021.11.11 12:49:13

깊은바다 *.106.133.166 http://aidev.co.kr/10923

요즘 딥러닝에서 멀티모달 모델이 관심을 받고 있습니다. 기존에는 이미지 모델, 자연어처리 모델, 음성 모델 등이 별도로 존재했습니다. 반면에 멀티 모달은 다양한 형태의 데이터를 동시에 고려합니다.

OpenAI가 발표한 DALL-E가 대표적입니다. 문장을 입력하면 거기에 맞는 이미지를 생성해냅니다. GPT-3와 같은 구조이지만 텍스트와 이미지를 동시에 처리한다는 차이가 있습니다. 좀 더 자세한 사항은 링크의 글을 참고 바랍니다.

List of Articles

제목	글쓴이	날짜	조회 수
내가 말하는 걸 보여줘, DALL-E	깊은바다	2021-11-11	1268
텍스트를 이미지로 생성해주는 사이트 - Text2Art (VQGAN-CLIP)	깊은바다	2021-11-10	7373
원티드는 어떻게 AI로 채용 결과를 예측하고 매칭할까	깊은바다	2021-11-09	1183
OpenAI의 CLIP을 한글로 구현한 KoCLIP	깊은바다	2021-11-02	3581
인공지능 과학자의 꿈, 범용 AI는 가능할까	깊은바다	2021-10-15	1081
딥러닝 범용 모델 - Foundation Models	깊은바다	2021-09-06	1535
소프트웨어 개발 경험이 먼저다 - 딥러닝 역시 S/W 기술의 하나일 뿐	깊은바다	2021-07-14	1119
제프리 힌튼, 얀 르쿤, 요슈아 벤지오가 말하는 딥러닝의 미래	깊은바다	2021-07-08	1120
OpenAI의 CLIP을 사용해서 자연어로 유튜브 영상 검색	깊은바다	2021-07-05	1428
스케치를 사진으로 바꾸어주는 프로그램 - NVIDIA CANVAS	깊은바다	2021-06-25	828
한 단어만으로 텍스트 스타일을 바꿔주는 딥러닝 모델 - TextStyleBrush	깊은바다	2021-06-24	884
GameGAN으로 직접 화면을 생성하는 GTA5 게임	깊은바다	2021-06-20	825
Transformer와 동급의 성능에 속도는 훨씬 빨라진 MLP-Mixer	깊은바다	2021-06-11	1777
GAN으로 얼굴사진을 생성하는 사이트 - Face Generator	깊은바다	2021-04-28	3119
말로 설명하여 이미지를 변형하는 GAN - StyleCLIP	깊은바다	2021-04-04	2203

쓰기

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지