레플리
글 수 203

OpenAI의 CLIP을 한글로 구현한 KoCLIP

조회 수 2825 추천 수 0 2021.11.02 16:38:13


OpenAI에서 발표한 CLIP을 한글로 구현한 KoCLIP을 소개해드립니다. 보통 이미지 분류는 사진을 각 클래스로 예측합니다. 예를 들어, 10개의 클래스라면 0은 강아지, 1은 고양이, 이런 식으로 구분합니다.

 

반면에 CLIP은 사진과 그 사진의 캡션문장을 학습 데이터로 사용합니다. 고양이 사진을 벡터로 변환하고, '이것은 고양이에요'라는 문장을 다른 벡터로 변환합니다. 그리고 두 벡터가 유사해지도록 학습을 수행합니다.

 

특이한 점은 클래스 개수가 미리 정해지지 않았다는 것입니다. 예측할 때 원하는 만큼 클래스의 문장을 만들면 됩니다. 사진을 보면 '이것은 고양이', '이것은 강아지', '이것은 햄스터'라고 문장을 직접 입력합니다. 그러면 입력 사진의 벡터와 각 클래스 문장의 벡터를 비교하여 가장 유사한 클래스를 선택합니다.

 

K-002.png

 

K-003.png

 

 

 

꼭 분류에만 CLIP을 사용하진 않습니다. 문장으로 사진을 검색할수도 있습니다. 미리 모든 사진을 벡터로 변환해 놓고, 검색 문장의 벡터와 가장 비슷한 사진 벡터를 찾으면 됩니다. '바다에 떠있는 배'라고 입력하면 그와 유사한 형태의 사진을 보여줍니다.

 

K-001.png

 

 

 

현재 OpenAI가 공개한 CLIP의 모델 파라미터는 BERT base와 비슷한 약 150M입니다. 만약 거대모델 크기로 CLIP을 만든다면 어느 정도의 성능이 나올까요. GPT-3처럼 이미지 분류도 곧 제로샷으로 하는 날이 올지도 모르겠네요.

 

 

 

< KoCLIP 데모 >

https://huggingface.co/spaces/flax-community/koclip

 

< CLIP 설명 >

http://aidev.co.kr/deeplearning/10254


 

List of Articles
제목 글쓴이 날짜 조회 수sort
딥러닝 웹서비스 개발 도전기 - 연예인 얼굴 판별기 깊은바다 2020-05-01 3100
자기지도학습 기반의 이미지 사전훈련 모델 - SimCLR 깊은바다 2020-03-10 3017
StyleGAN을 사용하여 새로운 얼굴을 생성하는 사이트 file 깊은바다 2019-02-17 3001
딥러닝을 사용한 포즈 인식 - Teachable Machine 깊은바다 2020-02-28 2954
이미지를 문장으로 설명하는 딥러닝 코드 file 깊은바다 2017-12-15 2930
OpenAI의 CLIP을 한글로 구현한 KoCLIP file 깊은바다 2021-11-02 2825
구글이 만든 딥러닝 자동그리기 - AutoDraw [2] 깊은바다 2017-04-13 2820
객체 검출 딥러닝 모델인 YOLO의 테드 영상 깊은바다 2019-05-22 2819
GAN을 이용한 염색 및 헤어 스타일 합성 - 꽤 GAN찮은 헤어살롱 깊은바다 2020-10-29 2817
GAN으로 얼굴사진을 생성하는 사이트 - Face Generator file 깊은바다 2021-04-28 2792
딥 러닝 이후, AI 알고리즘 트렌드 깊은바다 2019-03-11 2747
텐서플로우에서 구글의 이미지 인식 프로그램 사용하기 file [2] 깊은바다 2017-03-30 2719
StyleGAN을 이말년 웹툰으로 파인튜닝한 모델 깊은바다 2020-08-07 2713
딥러닝을 이용한 사용자 선호도 기반 의상 추천 알고리즘 깊은바다 2018-06-26 2682
딥러닝이 탄생할 수 있었던 진짜 이유 file 깊은바다 2019-02-01 2572