레플리
글 수 203

R-CNN 에서 부터 Mask R-CNN 까지

조회 수 1407 추천 수 0 2019.09.03 15:20:34


4.png

 

https://junn.net/archives/2517

 

 

 

대부분의 딥러닝 예제들은 사진 전체를 입력으로 받아 하나의 카테고리를 판별합니다. 하지만 현실 문제에 적용하기 위해서는 사진속에 있는 많은 객체들을 별도로 구분해야 합니다. 이렇게 객체의 박스 영역과 종류를 출력하는 모델을 객체 검출(Object Detection)이라고 합니다. 의미 분할(Semantic Segmentation)은 사각형이 아니라 픽셀 단위로 더 정교하게 객체를 인식합니다.

 

최근에는 객체 검출로 YOLO가 가장 유명하지만, 그 이전에 많은 모델들이 단계적으로 발전해왔습니다. 이 글은 R-CNN, Fast R-CNN, Faster R-CNN, MASK R-CNN에 대해서 자세히 설명하고 있습니다. 이미지 처리의 개념을 파악하는데 좋은 자료라 생각합니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
오픈소스로 공개된 Text-to-Image 모델 - Stable Diffusion 깊은바다 2022-09-07 1347
Dall.E 2 Prompt Book - 프롬프트 작성 가이드 깊은바다 2022-07-14 4375
최초로 인간 수준의 크기를 가진 중국의 딥러닝 모델 - BaGuaLu file 깊은바다 2022-06-23 1117
미국에서 Dalle Mini로 짤(Meme)을 만드는게 유행 file 깊은바다 2022-06-19 1626
말로 영상을 생성하는 딥러닝 모델 - CogVideo file 깊은바다 2022-05-30 1070
DALL.E를 직접 테스트해볼 수 있는 사이트 - DALL.E mini file 깊은바다 2022-05-17 11539
전문가 수준의 사진을 생성하는 NVIDIA의 PoE-GAN 깊은바다 2022-02-16 1280
메타AI의 멀티모달 자기지도학습 모델인 Data2vec 깊은바다 2022-01-26 1032
GAN으로 사진에서 특정 부분을 지워주는 서비스 - Cleanup.pictures file 깊은바다 2022-01-17 1026
3D 이미지를 만드는 GAN - StyleNeRF 깊은바다 2021-12-20 841
CLIP을 사용하여 말로 그림을 그려주는 스마트폰 앱 - WOMBO Dream file 깊은바다 2021-11-25 1780
내가 말하는 걸 보여줘, DALL-E 깊은바다 2021-11-11 1062
텍스트를 이미지로 생성해주는 사이트 - Text2Art (VQGAN-CLIP) file 깊은바다 2021-11-10 6899
원티드는 어떻게 AI로 채용 결과를 예측하고 매칭할까 깊은바다 2021-11-09 961
OpenAI의 CLIP을 한글로 구현한 KoCLIP file 깊은바다 2021-11-02 2813