글 수 127


Image for post

 

https://towardsdatascience.com/how-to-break-gpu-memory-boundaries-even-with-large-batch-sizes-7a9c27a400ce

 

 

 

파라미터는 모든 배치마다 공유하기 때문에 하나만 있으면 됩니다. 하지만 오차역전파에서 각 노드마다 저장하는 activation output은 배치가 늘어날수록 커집니다. forward pass에서 activation output을 저장하고 있어야, backward pass에서 그래디언트 계산하고 파라미터를 업데이트할 수 있습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
셀카를 일반 사진으로 변환해주는 GAN 모델 - Unselfie newfile 깊은바다 2020-08-08 4
StyleGAN을 이말년 웹툰으로 파인튜닝한 모델 깊은바다 2020-08-07 47
배치 사이즈에 따라 GPU 메모리가 증가하는 이유 깊은바다 2020-07-28 96
말로 설명하면 사진을 만들어주는 딥러닝 모델 - RetrieveGAN 깊은바다 2020-07-26 134
자신의 사진과 선택한 옷들을 GAN으로 합성해서 보여주는 딥러닝 깊은바다 2020-07-21 172
대학교 게시판을 크롤링하여 만든 GPT2 모델 file 깊은바다 2020-07-18 238
딥페이크 알고리즘 설명 깊은바다 2020-07-16 202
GAN으로 만든 모델 사진을 판매하는 일본 회사 깊은바다 2020-07-08 147
생성 모델이 일반 인공지능(AGI)으로 가는 열쇠 file 깊은바다 2020-06-29 486
퓨샷 러닝(few-shot learning)과 메타 러닝(meta-learning) 깊은바다 2020-06-27 233
자동회귀(autoregressive)로 이미지를 생성하는 iGPT file 깊은바다 2020-06-18 202
GPT3를 기반으로한 OpenAI API 유료화 깊은바다 2020-06-12 882
스케치를 얼굴사진으로 변형하는 딥러닝 생성모델 - DeepFaceDrawing 깊은바다 2020-06-07 148
AI는 '스스로 학습'할 수 있을까? - 자기지도학습 깊은바다 2020-06-02 201
팩맨 게임을 딥러닝으로 시뮬레이션한 GameGAN 깊은바다 2020-05-23 189