레플리
글 수 203


Image for post

 

https://towardsdatascience.com/how-to-break-gpu-memory-boundaries-even-with-large-batch-sizes-7a9c27a400ce

 

 

 

파라미터는 모든 배치마다 공유하기 때문에 하나만 있으면 됩니다. 하지만 오차역전파에서 각 노드마다 저장하는 activation output은 배치가 늘어날수록 커집니다. forward pass에서 activation output을 저장하고 있어야, backward pass에서 그래디언트 계산하고 파라미터를 업데이트할 수 있습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
딥러닝(Deep Learning)에 대한 소개 깊은바다 2016-03-21 1000
쉽게 풀어쓴 딥 러닝의 거의 모든 것 file 깊은바다 2016-03-21 1612
딥러닝의 전문가 세명 깊은바다 2016-03-21 669
모두를 위한 머신러닝/딥러닝 강의 깊은바다 2016-04-03 1224
사진을 텍스트로 설명 - CaptionBot file 깊은바다 2016-04-07 793
Quick, Draw! - 구글이 만든 그림 맞추기 깊은바다 2017-02-28 10713
기계학습 / 딥러닝이란 무엇인가 깊은바다 2017-02-28 660
AI Duet - 피아노 반주를 자동으로 해주는 인공지능 깊은바다 2017-02-28 3208
스탠포드 딥러닝 강의 한글화 프로젝트 깊은바다 2017-02-28 1555
딥러닝 라이브러리 텐서플로우의 기본 사용법 깊은바다 2017-03-03 948
딥러닝 합성곱 신경망(CNN) 개요 file 깊은바다 2017-03-05 7677
텐서플로우로 선형 회귀 구현 file 깊은바다 2017-03-09 1359
텐서플로우에서 소프트맥스로 숫자 인식 구현 file 깊은바다 2017-03-09 1373
텐서플로우에서 딥러닝 CNN으로 숫자 인식 구현 file 깊은바다 2017-03-11 5010
딥러닝의 종류 간단 설명 file 깊은바다 2017-03-11 25122