레플리
글 수 203


Search results for "People crossing the street"

 

https://github.com/haltakov/natural-language-youtube-search

 

 

 

올해 1월에 OpenAI가 CLIP이란 모델을 공개했습니다. 자연어를 벡터로 표현하고, 이미지도 벡터로 표현합니다. 그다음 같은 의미를 가진 자연어와 이미지가 비슷한 벡터값을 가지도록 학습합니다. 인터넷에는 사진에 대한 캡션이 많이 있는데, 이걸 데이터로 사용했습니다.

 

http://aidev.co.kr/deeplearning/10254

 

 

 

CLIP 발표 이후로 다양하게 응용한 애플리케이션이 등장하고 있습니다. 대표적으로는 StyleCLIP이 있습니다. CLIP에 StyleGAN을 적용했는데, 말로 설명해서 사진을 변형할 수 있습니다. 예를 들어, 얼굴사진에 '웃는 얼굴'이라고 입력하면 웃는 표정의 사진으로 바뀝니다.

 

http://aidev.co.kr/deeplearning/10338

 

 

 

이번에 소개해드리는 것은 유튜브 영상에서 원하는 장면을 자연어로 찾는 기능입니다. 우선 영상에서 특정 시간단위로 프레임을 추출합니다. 그리고 각 프레임을 CLIP으로 인코딩합니다. 찾고자 하는 장면을 말로 설명하면 그 문장 역시 CLIP으로 벡터화합니다. 마지막으로 두 벡터가 가장 유사한 프레임을 선택합니다. 예제를 보면, '소방차', '거리를 건너는 사람들', '빨간불에서 대기' 등의 장면을 성공적으로 검색했습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
OpenAI의 Sora로 만든 단편영화 file 깊은바다 2024-03-26 158
만약 ChatGPT가 영상으로 세상을 이해하게 된다면? file 깊은바다 2024-02-16 255
인도의 생성AI 영화 - Maharaja in Denims 깊은바다 2024-01-16 197
누구나 쉽게 AI 인플루언서를 만드는 시대 - Aitana Lopez file 깊은바다 2024-01-04 172
95생 천재 소녀가 만든 Pika가 빅테크들을 이길 수 있었던 이유 file [2] 깊은바다 2023-12-24 970
Text-to-Video 생성 서비스인 Pika, 5500만달러 투자 유치 file 깊은바다 2023-11-29 149
AI의 미래 - Coatue가 주목한 AI 산업 트렌드 깊은바다 2023-11-28 201
가구 카탈로그를 만들어주는 생성AI - 뚝딱 AI 스튜디오 file 깊은바다 2023-09-22 359
내가 원하는 사진을 만드는 생성AI SNS - 트윅(Tweak) file 깊은바다 2023-09-04 464
마우스로 끌어서 사진을 수정하는 딥러닝 - DragGAN 깊은바다 2023-05-21 444
생성 AI의 시대, 진짜 메타버스가 온다 깊은바다 2023-04-04 373
ChatGPT와 Stable Diffusion에 대한 정지훈 교수님 강의 깊은바다 2023-04-03 421
미드저니로 생성한 90년대 중국 사진들 - 콘텐츠 산업의 혁신 file 깊은바다 2023-03-30 764
어도비의 생성AI 프로그램 - Firefly 깊은바다 2023-03-23 348
초거대AI를 API로 썼을 때 경쟁업체와 차별화를 하려면 깊은바다 2023-03-20 300