레플리
글 수 203

이미지를 문장으로 설명하는 딥러닝 코드

조회 수 2930 추천 수 1 2017.12.15 02:18:16


results-without-errors.jpg

 

https://daniel.lasiman.com/post/image-captioning/

 

 

 

이미지를 문장으로 변환하는 딥러닝을 케라스로 구현한 글입니다.

영어로 되어있지만 코드에 대한 설명까지 상당히 자세하게 나와있습니다. 

 

 

 

image-embedding-architecture.jpg

 

위의 사진처럼 이미지를 먼저 CNN의 한 모델인 구글의 Inception으로 분류를 하고

FC(Fully Connected) 신경망으로 연결합니다.

그 다음 RNN LSTM을 사용하여 최종적으로 텍스트를 출력합니다.

 

 

 

요즘 딥러닝에 대한 기술이 많이 공개되고 있습니다.

구글이 텐서플로를 오픈하고 관련기술을 공유하는 것은

인공지능이 좀 더 빨리 발전하기를 원해서인 것 같습니다.

 

같은 기술을 같고 있다면 어자피 중요한 것은 데이터입니다.

세상에서 가장 많은 데이터를 보유한 곳이 구글이니 최종 승자는 자기라고 생각하는 걸까요.

 

List of Articles
제목 글쓴이 날짜 조회 수sort
Text-to-Image 모델을 정리한 글 - The State of AI and Art 2022 깊은바다 2022-10-06 1195
GAN으로 만든 가짜 사진과 진짜 사진을 맞추는 사이트 file 깊은바다 2019-03-04 1199
텐서플로우 기초 이해하기 깊은바다 2017-03-11 1205
AutoML을 이용한 Architecture Search 소개 및 NASNet 논문 리뷰 깊은바다 2019-08-18 1207
빈 주차공간을 찾아서 알려주는 인공지능 만든 개발자 깊은바다 2019-02-09 1210
사진을 복원하는 딥러닝 모델 - DFDNet 깊은바다 2020-08-24 1223
모두를 위한 머신러닝/딥러닝 강의 깊은바다 2016-04-03 1224
쉽게 씌어진 GAN 깊은바다 2018-04-11 1224
최신 딥러닝 모델들의 학습 비용 깊은바다 2019-12-12 1266
전문가 수준의 사진을 생성하는 NVIDIA의 PoE-GAN 깊은바다 2022-02-16 1280
딥러닝 GAN으로 생성한 고해상도 사진 [2] 깊은바다 2017-06-08 1290
하나의 얼굴 이미지로 다양하게 변형된 얼굴을 만드는 StarGAN [1] NeuroWhAI 2017-12-30 1301
RNN(Recurrent Neural Network) 튜토리얼 깊은바다 2017-07-22 1303
아이폰에서 실행하는 Stable Diffusion 앱 - Draw Things 깊은바다 2022-11-11 1309
딥러닝 범용 모델 - Foundation Models 깊은바다 2021-09-06 1318