레플리
글 수 204


Search results for "People crossing the street"

 

https://github.com/haltakov/natural-language-youtube-search

 

 

 

올해 1월에 OpenAI가 CLIP이란 모델을 공개했습니다. 자연어를 벡터로 표현하고, 이미지도 벡터로 표현합니다. 그다음 같은 의미를 가진 자연어와 이미지가 비슷한 벡터값을 가지도록 학습합니다. 인터넷에는 사진에 대한 캡션이 많이 있는데, 이걸 데이터로 사용했습니다.

 

http://aidev.co.kr/deeplearning/10254

 

 

 

CLIP 발표 이후로 다양하게 응용한 애플리케이션이 등장하고 있습니다. 대표적으로는 StyleCLIP이 있습니다. CLIP에 StyleGAN을 적용했는데, 말로 설명해서 사진을 변형할 수 있습니다. 예를 들어, 얼굴사진에 '웃는 얼굴'이라고 입력하면 웃는 표정의 사진으로 바뀝니다.

 

http://aidev.co.kr/deeplearning/10338

 

 

 

이번에 소개해드리는 것은 유튜브 영상에서 원하는 장면을 자연어로 찾는 기능입니다. 우선 영상에서 특정 시간단위로 프레임을 추출합니다. 그리고 각 프레임을 CLIP으로 인코딩합니다. 찾고자 하는 장면을 말로 설명하면 그 문장 역시 CLIP으로 벡터화합니다. 마지막으로 두 벡터가 가장 유사한 프레임을 선택합니다. 예제를 보면, '소방차', '거리를 건너는 사람들', '빨간불에서 대기' 등의 장면을 성공적으로 검색했습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
AI는 '스스로 학습'할 수 있을까? - 자기지도학습 깊은바다 2020-06-02 546
팩맨 게임을 딥러닝으로 시뮬레이션한 GameGAN 깊은바다 2020-05-23 707
CNN 시각화 사이트 - CNN Explainer 깊은바다 2020-05-10 1462
얀 르쿤, 자기지도학습이 강화학습보다 중요 깊은바다 2020-05-03 735
미디가 아니라 오디오로 음악을 만들어내는 OpenAI의 생성 모델 - Jukebox file 깊은바다 2020-05-02 665
딥러닝 웹서비스 개발 도전기 - 연예인 얼굴 판별기 깊은바다 2020-05-01 3111
사회적 거리를 지키는지 확인하는 지능형 CCTV 깊은바다 2020-04-23 477
딥페이크로 일론 머스크인 척 친구들을 속이는 영상 깊은바다 2020-04-19 1389
딥마인드의 Agent57, 아타리 게임 벤치마크 정복 깊은바다 2020-04-03 456
AutoML-Zero, 진화적 알고리즘을 사용하여 신경망 구조 설계 [2] 깊은바다 2020-03-13 820
자기지도학습 기반의 이미지 사전훈련 모델 - SimCLR 깊은바다 2020-03-10 3020
딥러닝을 사용한 포즈 인식 - Teachable Machine 깊은바다 2020-02-28 2963
딥러닝 챗봇에 대한 오해 깊은바다 2020-02-25 902
Semantic Segmentation을 활용한 차량 파손 탐지 딥러닝 모델 개발기 깊은바다 2020-02-14 734
딥러닝으로 음성합성을 해주는 서비스 - 네이버 클로바더빙 file 깊은바다 2020-02-09 471