글 수 208
객체 검출(Object Detection)은 사진 안에 있는 모든 객체들을 네모박스로 추출하는 인공지능입니다. 그중 YOLO가 가장 유명한 모델인데요. 스탠포드대 교수인 앤드류 응의 동영상 강의를 소개해드립니다. 제가 본 YOLO 설명 중 가장 쉽고 이해가 잘 되었습니다.
보통 R-CNN 계열의 모델은 후보 객체들을 선택하고 각각 분류기로 예측합니다. 만약 1000개의 후보가 있다면, 1000번 분류를 해야 합니다. 반면에 YOLO는 단 한번만 예측을 하여 모든 객체를 판단합니다. 그래서 속도가 훨씬 빠르다는 장점이 있습니다.
앞의 강의와 이어지는 내용이라 생략되는 부분이 있습니다. 영상에 나오지 않는 용어에 대해서 간략하게 정리했습니다.
- Pc : 박스 안에 객체가 있을 확률
- Bx, By, Bh, Bw : 박스의 x, y, height, width
- C : 객체의 클래스 개수만큼 존재. 원핫인코딩 출력.
- IOU : Intersection Over Union. 두 영역의 중첩된 비율.
< 추가 자료 >
- http://blog.naver.com/PostView.nhn?blogId=sogangori&logNo=220993971883