레플리
글 수 203

이미지를 문장으로 설명하는 딥러닝 코드

조회 수 2930 추천 수 1 2017.12.15 02:18:16


results-without-errors.jpg

 

https://daniel.lasiman.com/post/image-captioning/

 

 

 

이미지를 문장으로 변환하는 딥러닝을 케라스로 구현한 글입니다.

영어로 되어있지만 코드에 대한 설명까지 상당히 자세하게 나와있습니다. 

 

 

 

image-embedding-architecture.jpg

 

위의 사진처럼 이미지를 먼저 CNN의 한 모델인 구글의 Inception으로 분류를 하고

FC(Fully Connected) 신경망으로 연결합니다.

그 다음 RNN LSTM을 사용하여 최종적으로 텍스트를 출력합니다.

 

 

 

요즘 딥러닝에 대한 기술이 많이 공개되고 있습니다.

구글이 텐서플로를 오픈하고 관련기술을 공유하는 것은

인공지능이 좀 더 빨리 발전하기를 원해서인 것 같습니다.

 

같은 기술을 같고 있다면 어자피 중요한 것은 데이터입니다.

세상에서 가장 많은 데이터를 보유한 곳이 구글이니 최종 승자는 자기라고 생각하는 걸까요.

 

List of Articles
제목 글쓴이 날짜 조회 수sort
CNN 초보자가 만드는 초보자 가이드 깊은바다 2017-04-09 1041
메타AI의 멀티모달 자기지도학습 모델인 Data2vec 깊은바다 2022-01-26 1033
GAN으로 사진에서 특정 부분을 지워주는 서비스 - Cleanup.pictures file 깊은바다 2022-01-17 1027
딥러닝(Deep Learning)에 대한 소개 깊은바다 2016-03-21 1000
어떻게 컴퓨터가 사진을 이해하게 되었는가 깊은바다 2017-03-31 995
문장을 사진으로 변환하는 GPT-3 모델, DALL-E 깊은바다 2021-01-09 985
95생 천재 소녀가 만든 Pika가 빅테크들을 이길 수 있었던 이유 file [2] 깊은바다 2023-12-24 976
스케치를 사진으로 변환하는 딥러닝 - NVIDIA의 GauGAN 깊은바다 2019-03-20 968
원티드는 어떻게 AI로 채용 결과를 예측하고 매칭할까 깊은바다 2021-11-09 961
자신의 이름을 음성으로 만들어 주는 사이트 깊은바다 2019-02-04 956
딥러닝 라이브러리 텐서플로우의 기본 사용법 깊은바다 2017-03-03 949
책 읽어주는 딥러닝 깊은바다 2017-11-23 943
딥러닝의 기본 깊은바다 2019-07-12 942
가중치를 하나로 공유하고 모델의 구조만 찾는 WANN 깊은바다 2019-09-10 916
대학교 게시판을 크롤링하여 만든 GPT2 모델 file 깊은바다 2020-07-18 916