글 수 132

이미지를 문장으로 설명하는 딥러닝 코드

조회 수 1611 추천 수 1 2017.12.15 02:18:16


results-without-errors.jpg

 

https://daniel.lasiman.com/post/image-captioning/

 

 

 

이미지를 문장으로 변환하는 딥러닝을 케라스로 구현한 글입니다.

영어로 되어있지만 코드에 대한 설명까지 상당히 자세하게 나와있습니다. 

 

 

 

image-embedding-architecture.jpg

 

위의 사진처럼 이미지를 먼저 CNN의 한 모델인 구글의 Inception으로 분류를 하고

FC(Fully Connected) 신경망으로 연결합니다.

그 다음 RNN LSTM을 사용하여 최종적으로 텍스트를 출력합니다.

 

 

 

요즘 딥러닝에 대한 기술이 많이 공개되고 있습니다.

구글이 텐서플로를 오픈하고 관련기술을 공유하는 것은

인공지능이 좀 더 빨리 발전하기를 원해서인 것 같습니다.

 

같은 기술을 같고 있다면 어자피 중요한 것은 데이터입니다.

세상에서 가장 많은 데이터를 보유한 곳이 구글이니 최종 승자는 자기라고 생각하는 걸까요.

 

List of Articles
제목 글쓴이 날짜 조회 수
AutoML을 이용한 Architecture Search 소개 및 NASNet 논문 리뷰 깊은바다 2019-08-18 836
얀 르쿤의 자기지도학습 강의 - The Power and Limits Of Deep Learning file 깊은바다 2019-07-13 1281
딥러닝의 기본 깊은바다 2019-07-12 620
셀프 어텐션만으로 이미지를 인식하는 딥러닝 모델 file 깊은바다 2019-06-26 1086
Selfie, 비지도학습 이미지 사전훈련 모델 file 깊은바다 2019-06-15 2018
목소리와 입모양을 변경할 수 있는 GAN 모델 깊은바다 2019-06-13 677
딥러닝의 미래는 바로 비지도학습 깊은바다 2019-06-06 3366
YOLO, Object Detection Network - 알고리즘 설명 file 깊은바다 2019-06-02 8640
사진 한 장으로 GAN 영상 생성 깊은바다 2019-05-23 1100
객체 검출 딥러닝 모델인 YOLO의 테드 영상 깊은바다 2019-05-22 1973
스냅챕의 성별 변환 필터는 GAN을 사용했을까 깊은바다 2019-05-15 412
신경망에 활성화 함수가 필요한 이유 file 깊은바다 2019-05-14 1169
핸즈온 머신러닝 2판 영문 초고 다운로드 깊은바다 2019-05-12 1417
GTA5로 자율주행 구현 영상 깊은바다 2019-05-08 1090
전신 사진을 생성하는 GAN 깊은바다 2019-05-05 550