글 수 208
https://daniel.lasiman.com/post/image-captioning/
이미지를 문장으로 변환하는 딥러닝을 케라스로 구현한 글입니다.
영어로 되어있지만 코드에 대한 설명까지 상당히 자세하게 나와있습니다.
위의 사진처럼 이미지를 먼저 CNN의 한 모델인 구글의 Inception으로 분류를 하고
FC(Fully Connected) 신경망으로 연결합니다.
그 다음 RNN LSTM을 사용하여 최종적으로 텍스트를 출력합니다.
요즘 딥러닝에 대한 기술이 많이 공개되고 있습니다.
구글이 텐서플로를 오픈하고 관련기술을 공유하는 것은
인공지능이 좀 더 빨리 발전하기를 원해서인 것 같습니다.
같은 기술을 같고 있다면 어자피 중요한 것은 데이터입니다.
세상에서 가장 많은 데이터를 보유한 곳이 구글이니 최종 승자는 자기라고 생각하는 걸까요.