레플리
글 수 203

이미지를 문장으로 설명하는 딥러닝 코드

조회 수 2930 추천 수 1 2017.12.15 02:18:16


results-without-errors.jpg

 

https://daniel.lasiman.com/post/image-captioning/

 

 

 

이미지를 문장으로 변환하는 딥러닝을 케라스로 구현한 글입니다.

영어로 되어있지만 코드에 대한 설명까지 상당히 자세하게 나와있습니다. 

 

 

 

image-embedding-architecture.jpg

 

위의 사진처럼 이미지를 먼저 CNN의 한 모델인 구글의 Inception으로 분류를 하고

FC(Fully Connected) 신경망으로 연결합니다.

그 다음 RNN LSTM을 사용하여 최종적으로 텍스트를 출력합니다.

 

 

 

요즘 딥러닝에 대한 기술이 많이 공개되고 있습니다.

구글이 텐서플로를 오픈하고 관련기술을 공유하는 것은

인공지능이 좀 더 빨리 발전하기를 원해서인 것 같습니다.

 

같은 기술을 같고 있다면 어자피 중요한 것은 데이터입니다.

세상에서 가장 많은 데이터를 보유한 곳이 구글이니 최종 승자는 자기라고 생각하는 걸까요.

 

List of Articles
제목 글쓴이 날짜 조회 수sort
Transformer와 동급의 성능에 속도는 훨씬 빨라진 MLP-Mixer file 깊은바다 2021-06-11 1445
R-CNN 에서 부터 Mask R-CNN 까지 깊은바다 2019-09-03 1407
딥페이크로 일론 머스크인 척 친구들을 속이는 영상 깊은바다 2020-04-19 1389
목소리와 입모양을 변경할 수 있는 GAN 모델 깊은바다 2019-06-13 1388
텐서플로우에서 소프트맥스로 숫자 인식 구현 file 깊은바다 2017-03-09 1373
텐서플로우로 선형 회귀 구현 file 깊은바다 2017-03-09 1360
오픈소스로 공개된 Text-to-Image 모델 - Stable Diffusion 깊은바다 2022-09-07 1351
사진을 디즈니 만화로 바뀌주는 딥러닝 모델 - Toonify 깊은바다 2020-09-21 1343
딥러닝 범용 모델 - Foundation Models 깊은바다 2021-09-06 1319
아이폰에서 실행하는 Stable Diffusion 앱 - Draw Things 깊은바다 2022-11-11 1315
RNN(Recurrent Neural Network) 튜토리얼 깊은바다 2017-07-22 1303
하나의 얼굴 이미지로 다양하게 변형된 얼굴을 만드는 StarGAN [1] NeuroWhAI 2017-12-30 1301
딥러닝 GAN으로 생성한 고해상도 사진 [2] 깊은바다 2017-06-08 1290
전문가 수준의 사진을 생성하는 NVIDIA의 PoE-GAN 깊은바다 2022-02-16 1282
최신 딥러닝 모델들의 학습 비용 깊은바다 2019-12-12 1268