레플리
글 수 203

이미지를 문장으로 설명하는 딥러닝 코드

조회 수 2925 추천 수 1 2017.12.15 02:18:16


results-without-errors.jpg

 

https://daniel.lasiman.com/post/image-captioning/

 

 

 

이미지를 문장으로 변환하는 딥러닝을 케라스로 구현한 글입니다.

영어로 되어있지만 코드에 대한 설명까지 상당히 자세하게 나와있습니다. 

 

 

 

image-embedding-architecture.jpg

 

위의 사진처럼 이미지를 먼저 CNN의 한 모델인 구글의 Inception으로 분류를 하고

FC(Fully Connected) 신경망으로 연결합니다.

그 다음 RNN LSTM을 사용하여 최종적으로 텍스트를 출력합니다.

 

 

 

요즘 딥러닝에 대한 기술이 많이 공개되고 있습니다.

구글이 텐서플로를 오픈하고 관련기술을 공유하는 것은

인공지능이 좀 더 빨리 발전하기를 원해서인 것 같습니다.

 

같은 기술을 같고 있다면 어자피 중요한 것은 데이터입니다.

세상에서 가장 많은 데이터를 보유한 곳이 구글이니 최종 승자는 자기라고 생각하는 걸까요.

 

List of Articles
제목 글쓴이 날짜 조회 수
불쾌한 골짜기에서 대유쾌 마운틴으로 - 이미지 생성AI file 깊은바다 2023-03-08 6926
아카라이브 반실사 채널 - Stable Diffusion 실사 그림 file 깊은바다 2023-03-01 2103
사인필드 시트콤을 패러디한 AI 생성 애니메이션 방송 file 깊은바다 2023-02-01 402
글로 설명하면 음악을 만들어주는 딥러닝 모델 - MusicLM 깊은바다 2023-01-27 446
Stable Diffusion 포토샵 플러그인 깊은바다 2022-12-25 2392
GPT : 도래한 초거대 AI의 시대, 빅테크가 주도할 수 밖에 없는 이유 file 깊은바다 2022-12-22 329
Stable Diffusion을 사용한 사진 변환 앱 Lensa AI, 앱스토어 1위 달성 깊은바다 2022-12-09 785
NVIDIA가 발표한 Text-to-3D 모델 - Magic3D 깊은바다 2022-11-22 652
아이폰에서 실행하는 Stable Diffusion 앱 - Draw Things 깊은바다 2022-11-11 1285
일기를 쓰면 그림을 그려주는 그림일기 서비스 file 깊은바다 2022-11-08 1895
World Models를 만든 David Ha, 구글에서 StabilityAI로 이적 file 깊은바다 2022-10-11 361
인공지능 킬러앱의 등장, 그리고 모바일에서 인공지능으로 패러다임 변환 file 깊은바다 2022-10-10 511
Text-to-Image 모델을 정리한 글 - The State of AI and Art 2022 깊은바다 2022-10-06 1167
Text-to-3D인 DreamFusion과 Text-to-Video인 Make-A-Video 깊은바다 2022-10-01 438
Stable Diffusion으로 만든 뮤직비디오 영상 깊은바다 2022-09-25 1128