레플리
글 수 203

최신 딥러닝 모델들의 학습 비용

조회 수 1268 추천 수 0 2019.12.12 21:23:49


https://syncedreview.com/2019/06/27/the-staggering-cost-of-training-sota-ai-models/

 

 

 

최근 SOTA(State-of-the-Art)를 찍은 모델들의 비용을 계산한 글입니다. 논문에서 공개한 리소스를 기반으로 클라우드에서 돌릴 경우를 가정했습니다. 이건 딱 한 번만 학습을 할 때의 비용입니다. 모델을 개발하기 위해서는 당연히 여러 번 돌려야 합니다. 아마 총 비용은 훨씬 높을 것 같습니다.

 

 

 

< XLNet >
TPU v3 512 * ($2 per hour) * 24 (hours) * 2.5 (days) = $61,440

 

< University of Washington’s Grover-Mega >
$0.30 per TPU v3 core-hour and two weeks = $25,000

 

< BERT Large >
TPU v2 16 (devices) * 4 (days) * 24 (hours) * 4.5 (US$ per hour) = $6,912

 

< BERT Base >
single preemptible Cloud TPU v2 * two weeks = $500

 

< GPT2 >
시간당 $256 (학습 기간 공개 안함)

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
CNN 초보자가 만드는 초보자 가이드 깊은바다 2017-04-09 1041
메타AI의 멀티모달 자기지도학습 모델인 Data2vec 깊은바다 2022-01-26 1034
GAN으로 사진에서 특정 부분을 지워주는 서비스 - Cleanup.pictures file 깊은바다 2022-01-17 1027
딥러닝(Deep Learning)에 대한 소개 깊은바다 2016-03-21 1000
어떻게 컴퓨터가 사진을 이해하게 되었는가 깊은바다 2017-03-31 995
문장을 사진으로 변환하는 GPT-3 모델, DALL-E 깊은바다 2021-01-09 986
95생 천재 소녀가 만든 Pika가 빅테크들을 이길 수 있었던 이유 file [2] 깊은바다 2023-12-24 977
스케치를 사진으로 변환하는 딥러닝 - NVIDIA의 GauGAN 깊은바다 2019-03-20 968
원티드는 어떻게 AI로 채용 결과를 예측하고 매칭할까 깊은바다 2021-11-09 961
자신의 이름을 음성으로 만들어 주는 사이트 깊은바다 2019-02-04 956
딥러닝 라이브러리 텐서플로우의 기본 사용법 깊은바다 2017-03-03 949
책 읽어주는 딥러닝 깊은바다 2017-11-23 943
딥러닝의 기본 깊은바다 2019-07-12 942
가중치를 하나로 공유하고 모델의 구조만 찾는 WANN 깊은바다 2019-09-10 918
대학교 게시판을 크롤링하여 만든 GPT2 모델 file 깊은바다 2020-07-18 916