레플리
글 수 203


Image for post

 

http://moments.csail.mit.edu/

 

 

 

Moments in Time은 MIT에서 공개한 동영상 데이터셋입니다. ImageNet이 사진을 분류한다면, 이것은 동영상의 행동을 판단합니다. 3초 분량의 100만개의 동영상으로 구성되어 있습니다.

 

2018년과 2019년에 대회를 열기도 했는데요. 각각 다양한 방법들을 사용했습니다. 그중 2018년 우승한 팀은 시공간과 오디오 두가지 방법을 결합했습니다. 동영상에서 시간순으로 간격을 주고 8프레임을 뽑아내 붙입니다. 이를 CNN에 넣고 분류를 합니다. 오디오 역시 웨이브폼으로 변환하여 EnvNet으로 처리합니다. 최종적으로 이 두개의 모델을 앙상블하여 결과를 도출합니다.

 

딥러닝으로 사진을 분류하는 것은 이미 사람의 수준을 넘어섰습니다. 최근에는 이런 동영상 데이터가 많이 연구되고 있습니다. 지금은 유튜브에서 제목이나 설명, 태그 같은 텍스트 정보만 가지고 검색을 합니다. 이런 기술이 발전하면 매우 세밀하게 영상의 정보를 찾게 되지 않을까요.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
소프트웨어 개발 경험이 먼저다 - 딥러닝 역시 S/W 기술의 하나일 뿐 깊은바다 2021-07-14 914
GAN을 활용한 My handwriting styler 깊은바다 2019-10-20 913
쉬운 딥러닝 강의 슬라이드 깊은바다 2017-04-09 906
남세동의 딥러닝 이야기 깊은바다 2018-06-22 903
딥러닝 챗봇에 대한 오해 깊은바다 2020-02-25 902
셀카를 일반 사진으로 변환해주는 GAN 모델 - Unselfie file 깊은바다 2020-08-08 893
GAN의 상용화를 알리는 시작 - 포토샵 뉴럴 필터 깊은바다 2020-10-22 884
Recurrent Neural Network (RNN) 이해하기 - MNIST 숫자 인식 깊은바다 2018-04-11 879
제프리 힌튼, 얀 르쿤, 요슈아 벤지오가 말하는 딥러닝의 미래 깊은바다 2021-07-08 878
인공지능 과학자의 꿈, 범용 AI는 가능할까 깊은바다 2021-10-15 865
고해상도 GAN - A Style-Based Generator Architecture for GAN 깊은바다 2018-12-15 849
소프트웨어 2.0 깊은바다 2018-08-14 846
3D 이미지를 만드는 GAN - StyleNeRF 깊은바다 2021-12-20 841
어떻게 해야 기계에게 글을 잘 읽고 말할 수 있게 할까? - 기계독해(MRC) 깊은바다 2020-01-14 836
앤드류 응의 YOLO 강의 영상 깊은바다 2020-09-23 836