레플리
글 수 203

이미지를 문장으로 설명하는 딥러닝 코드

조회 수 2930 추천 수 1 2017.12.15 02:18:16


results-without-errors.jpg

 

https://daniel.lasiman.com/post/image-captioning/

 

 

 

이미지를 문장으로 변환하는 딥러닝을 케라스로 구현한 글입니다.

영어로 되어있지만 코드에 대한 설명까지 상당히 자세하게 나와있습니다. 

 

 

 

image-embedding-architecture.jpg

 

위의 사진처럼 이미지를 먼저 CNN의 한 모델인 구글의 Inception으로 분류를 하고

FC(Fully Connected) 신경망으로 연결합니다.

그 다음 RNN LSTM을 사용하여 최종적으로 텍스트를 출력합니다.

 

 

 

요즘 딥러닝에 대한 기술이 많이 공개되고 있습니다.

구글이 텐서플로를 오픈하고 관련기술을 공유하는 것은

인공지능이 좀 더 빨리 발전하기를 원해서인 것 같습니다.

 

같은 기술을 같고 있다면 어자피 중요한 것은 데이터입니다.

세상에서 가장 많은 데이터를 보유한 곳이 구글이니 최종 승자는 자기라고 생각하는 걸까요.

 

List of Articles
제목 글쓴이 날짜 조회 수sort
RNN과 LSTM에 대한 설명 [3] 깊은바다 2017-08-09 5873
구글의 새로운 딥러닝 강화학습인 월드 모델(World Models) file [4] 깊은바다 2018-04-01 5561
알파고의 딥러닝 알고리즘 file 깊은바다 2017-03-12 5494
배치 사이즈에 따라 GPU 메모리가 증가하는 이유 깊은바다 2020-07-28 5257
텐서플로우에서 딥러닝 CNN으로 숫자 인식 구현 file 깊은바다 2017-03-11 5010
구글 텐서플로우 첫걸음 - Tensorflow2.0 소개 [1] 깊은바다 2019-03-27 4561
딥러닝으로 2D 얼굴사진을 3D로 생성 file 깊은바다 2017-09-19 4471
Dall.E 2 Prompt Book - 프롬프트 작성 가이드 깊은바다 2022-07-14 4378
이젠 모델 구축도 학습도 필요없다, OpenAI의 이미지인식 모델 CLIP file 깊은바다 2021-03-07 4341
사진 한 장으로 움직이는 얼굴을 만드는 사이트 - Deep Nostalgia 깊은바다 2021-03-01 4272
이미지 탐지기 쉽게 구현하기 - Tensorflow Hub 깊은바다 2018-06-20 3988
Selfie, 비지도학습 이미지 사전훈련 모델 file 깊은바다 2019-06-15 3522
애니메이션을 자동으로 만들어주는 GAN 깊은바다 2018-05-11 3415
AI Duet - 피아노 반주를 자동으로 해주는 인공지능 깊은바다 2017-02-28 3399
텐서플로와 케라스 코드 비교 깊은바다 2018-06-06 3158