레플리
글 수 203

객체 검출 딥러닝 모델인 YOLO의 테드 영상

조회 수 2819 추천 수 0 2019.05.22 14:54:06


 

 

 

YOLO(You Only Look Once)는 객체 검출(object detection)의 가장 유명한 방법 중 하나입니다. 이를 개발한 Joseph Redmon의 테드 영상입니다. 객체 검출에 대해서 아주 쉽게 설명하고 있으니 관심있는 분들에게 적극 추천드립니다.

 

보통 딥러닝 이미지 인식 예제에서는 사진 전체를 가지고 분류를 합니다. 하지만 실제 현업에서는 이런 방식으로 적용이 불가능합니다. 사람이 일일이 사진속 중요한 객체들을 자를 수가 없기 때문입니다.

 

 

 

이를 해결하는 가장 간단한 방식은 슬라이딩 윈도우(sliding window)입니다. 다양한 크기의 사각형을 전체 이미지에서 쭉 이동하면서, 모든 영역을 CNN 모델로 인식합니다. 당연히 속도가 엄청나게 느릴 수밖에 없습니다.

 

그 다음으로 개발된 것은 R-CNN(Region CNN)입니다. Fast R-CNN, Faster R-CNN으로 발전되었는데, 기본적인 방법은 다음과 같습니다. 전체 이미지를 한 번만 CNN으로 돌려 특성 맵을 만듭니다. 그리고 객체가 있을 만한 영역들을 특성 맵에서 추출하여 각각을 별도의 분류기(CNN은 아님)로 판단합니다. CNN은 딱 한 번 하지만 분류는 여러 번 반복하기 때문에 여전히 속도가 느린 편입니다.

 

이를 개선한 것이 YOLO입니다. 말 그대로 분류 자체를 한 번에 끝냅니다. 먼저 사진을 NxN 격자로 나눕니다. 그리고 CNN으로 각 격자마다 클래스를 예측합니다. 마지막으로 격자들을 비슷한 유형으로 통합하여 최종 후보들만 남깁니다. 최종적으로 분류기가 아니라 간단한 수식만 계산하기 때문에, 동영상도 거의 실시간으로 객체 검출이 됩니다.

 

 

 

아래 사이트에서 YOLO를 다운받아 테스트 해볼 수 있습니다.
-> https://pjreddie.com/darknet/yolo/

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
인공지능 과학자의 꿈, 범용 AI는 가능할까 깊은바다 2021-10-15 865
딥러닝 범용 모델 - Foundation Models 깊은바다 2021-09-06 1317
소프트웨어 개발 경험이 먼저다 - 딥러닝 역시 S/W 기술의 하나일 뿐 깊은바다 2021-07-14 913
제프리 힌튼, 얀 르쿤, 요슈아 벤지오가 말하는 딥러닝의 미래 깊은바다 2021-07-08 871
OpenAI의 CLIP을 사용해서 자연어로 유튜브 영상 검색 깊은바다 2021-07-05 1069
스케치를 사진으로 바꾸어주는 프로그램 - NVIDIA CANVAS 깊은바다 2021-06-25 636
한 단어만으로 텍스트 스타일을 바꿔주는 딥러닝 모델 - TextStyleBrush 깊은바다 2021-06-24 647
GameGAN으로 직접 화면을 생성하는 GTA5 게임 깊은바다 2021-06-20 632
Transformer와 동급의 성능에 속도는 훨씬 빨라진 MLP-Mixer file 깊은바다 2021-06-11 1414
GAN으로 얼굴사진을 생성하는 사이트 - Face Generator file 깊은바다 2021-04-28 2768
말로 설명하여 이미지를 변형하는 GAN - StyleCLIP file 깊은바다 2021-04-04 1803
GPT-3로 광고문구를 만드는 서비스 - Copy.ai 깊은바다 2021-03-22 645
딥러닝의 창시자인 제프리 힌튼이 구글에 합류하게 된 스토리 깊은바다 2021-03-18 415
뉴런 하나로 특정 개념을 표현한다, CLIP 모델에서 개념 뉴런을 발견 file 깊은바다 2021-03-12 568
스냅챕의 디즈니 필터 깊은바다 2021-03-12 528