딥러닝 - 3초 분량의 100만개 동영상 데이터셋

글 수 203

3초 분량의 100만개 동영상 데이터셋 - Moments in Time

조회 수 570 추천 수 0 2020.09.05 17:02:03

깊은바다 *.68.248.98 http://aidev.co.kr/9605

Image for post

http://moments.csail.mit.edu/

Moments in Time은 MIT에서 공개한 동영상 데이터셋입니다. ImageNet이 사진을 분류한다면, 이것은 동영상의 행동을 판단합니다. 3초 분량의 100만개의 동영상으로 구성되어 있습니다.

2018년과 2019년에 대회를 열기도 했는데요. 각각 다양한 방법들을 사용했습니다. 그중 2018년 우승한 팀은 시공간과 오디오 두가지 방법을 결합했습니다. 동영상에서 시간순으로 간격을 주고 8프레임을 뽑아내 붙입니다. 이를 CNN에 넣고 분류를 합니다. 오디오 역시 웨이브폼으로 변환하여 EnvNet으로 처리합니다. 최종적으로 이 두개의 모델을 앙상블하여 결과를 도출합니다.

딥러닝으로 사진을 분류하는 것은 이미 사람의 수준을 넘어섰습니다. 최근에는 이런 동영상 데이터가 많이 연구되고 있습니다. 지금은 유튜브에서 제목이나 설명, 태그 같은 텍스트 정보만 가지고 검색을 합니다. 이런 기술이 발전하면 매우 세밀하게 영상의 정보를 찾게 되지 않을까요.

이 게시물을

엮인글 :

List of Articles

제목	글쓴이	날짜	조회 수
AI는 '스스로 학습'할 수 있을까? - 자기지도학습	깊은바다	2020-06-02	544
스케치를 얼굴사진으로 변형하는 딥러닝 생성모델 - DeepFaceDrawing	깊은바다	2020-06-07	553
MS의 챗봇 린나, 딥러닝으로 노래를 부르는 가수로 데뷔	깊은바다	2019-04-10	561
3초 분량의 100만개 동영상 데이터셋 - Moments in Time	깊은바다	2020-09-05	570
뉴런 하나로 특정 개념을 표현한다, CLIP 모델에서 개념 뉴런을 발견	깊은바다	2021-03-12	573
GAN으로 만든 모델 사진을 판매하는 일본 회사	깊은바다	2020-07-08	575
딥페이크로 만든 실베스터 스탤론의 터미네이터2	깊은바다	2019-12-29	577
파이토치 버전 YOLO Colab 테스트 코드	깊은바다	2020-09-25	597
말로 설명하면 사진을 만들어주는 딥러닝 모델 - RetrieveGAN	깊은바다	2020-07-26	632
스케치를 사진으로 바꾸어주는 프로그램 - NVIDIA CANVAS	깊은바다	2021-06-25	637
GameGAN으로 직접 화면을 생성하는 GTA5 게임	깊은바다	2021-06-20	637
GPT-3로 광고문구를 만드는 서비스 - Copy.ai	깊은바다	2021-03-22	648
한 단어만으로 텍스트 스타일을 바꿔주는 딥러닝 모델 - TextStyleBrush	깊은바다	2021-06-24	654
NVIDIA가 발표한 Text-to-3D 모델 - Magic3D	깊은바다	2022-11-22	654
기계학습 / 딥러닝이란 무엇인가	깊은바다	2017-02-28	661

쓰기

첫 페이지 1 2 3 4 5 6 7 8 9 10 끝 페이지