레플리
글 수 203


Search results for "People crossing the street"

 

https://github.com/haltakov/natural-language-youtube-search

 

 

 

올해 1월에 OpenAI가 CLIP이란 모델을 공개했습니다. 자연어를 벡터로 표현하고, 이미지도 벡터로 표현합니다. 그다음 같은 의미를 가진 자연어와 이미지가 비슷한 벡터값을 가지도록 학습합니다. 인터넷에는 사진에 대한 캡션이 많이 있는데, 이걸 데이터로 사용했습니다.

 

http://aidev.co.kr/deeplearning/10254

 

 

 

CLIP 발표 이후로 다양하게 응용한 애플리케이션이 등장하고 있습니다. 대표적으로는 StyleCLIP이 있습니다. CLIP에 StyleGAN을 적용했는데, 말로 설명해서 사진을 변형할 수 있습니다. 예를 들어, 얼굴사진에 '웃는 얼굴'이라고 입력하면 웃는 표정의 사진으로 바뀝니다.

 

http://aidev.co.kr/deeplearning/10338

 

 

 

이번에 소개해드리는 것은 유튜브 영상에서 원하는 장면을 자연어로 찾는 기능입니다. 우선 영상에서 특정 시간단위로 프레임을 추출합니다. 그리고 각 프레임을 CLIP으로 인코딩합니다. 찾고자 하는 장면을 말로 설명하면 그 문장 역시 CLIP으로 벡터화합니다. 마지막으로 두 벡터가 가장 유사한 프레임을 선택합니다. 예제를 보면, '소방차', '거리를 건너는 사람들', '빨간불에서 대기' 등의 장면을 성공적으로 검색했습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
GPT3를 기반으로한 OpenAI API 유료화 깊은바다 2020-06-12 2536
경쟁을 통해 이미지를 생성하는 법을 배우는 GAN file 깊은바다 2017-03-20 2530
Stable Diffusion 포토샵 플러그인 깊은바다 2022-12-25 2418
라온피플의 머신러닝과 딥러닝 강의 깊은바다 2017-05-07 2385
핸즈온 머신러닝 2판 영문 초고 다운로드 깊은바다 2019-05-12 2367
구글이 만든 이미지 생성 딥러닝 BEGAN file [2] 깊은바다 2017-04-05 2307
얀 르쿤이 만든 최초의 CNN 테스트 영상 깊은바다 2020-01-19 2247
아카라이브 반실사 채널 - Stable Diffusion 실사 그림 file 깊은바다 2023-03-01 2197
뭔가가 웹사이트를 하나 발견했는데... file [4] LegenDUST 2017-08-23 2161
자습해도 모르겠던 딥러닝, 머리속에 인스톨 시켜드립니다 [2] 깊은바다 2017-09-12 2094
GTA5로 자율주행 구현 영상 깊은바다 2019-05-08 1996
사진 한 장으로 GAN 영상 생성 깊은바다 2019-05-23 1967
일기를 쓰면 그림을 그려주는 그림일기 서비스 file 깊은바다 2022-11-08 1927
얀 르쿤의 자기지도학습 강의 - The Power and Limits Of Deep Learning file 깊은바다 2019-07-13 1901
Style Transfer [1] NeuroWhAI 2018-04-21 1897