레플리
글 수 203

최신 딥러닝 모델들의 학습 비용

조회 수 1268 추천 수 0 2019.12.12 21:23:49


https://syncedreview.com/2019/06/27/the-staggering-cost-of-training-sota-ai-models/

 

 

 

최근 SOTA(State-of-the-Art)를 찍은 모델들의 비용을 계산한 글입니다. 논문에서 공개한 리소스를 기반으로 클라우드에서 돌릴 경우를 가정했습니다. 이건 딱 한 번만 학습을 할 때의 비용입니다. 모델을 개발하기 위해서는 당연히 여러 번 돌려야 합니다. 아마 총 비용은 훨씬 높을 것 같습니다.

 

 

 

< XLNet >
TPU v3 512 * ($2 per hour) * 24 (hours) * 2.5 (days) = $61,440

 

< University of Washington’s Grover-Mega >
$0.30 per TPU v3 core-hour and two weeks = $25,000

 

< BERT Large >
TPU v2 16 (devices) * 4 (days) * 24 (hours) * 4.5 (US$ per hour) = $6,912

 

< BERT Base >
single preemptible Cloud TPU v2 * two weeks = $500

 

< GPT2 >
시간당 $256 (학습 기간 공개 안함)

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
딥러닝(Deep Learning)에 대한 소개 깊은바다 2016-03-21 1000
쉽게 풀어쓴 딥 러닝의 거의 모든 것 file 깊은바다 2016-03-21 1612
딥러닝의 전문가 세명 깊은바다 2016-03-21 669
모두를 위한 머신러닝/딥러닝 강의 깊은바다 2016-04-03 1225
사진을 텍스트로 설명 - CaptionBot file 깊은바다 2016-04-07 795
Quick, Draw! - 구글이 만든 그림 맞추기 깊은바다 2017-02-28 10727
기계학습 / 딥러닝이란 무엇인가 깊은바다 2017-02-28 661
AI Duet - 피아노 반주를 자동으로 해주는 인공지능 깊은바다 2017-02-28 3455
스탠포드 딥러닝 강의 한글화 프로젝트 깊은바다 2017-02-28 1555
딥러닝 라이브러리 텐서플로우의 기본 사용법 깊은바다 2017-03-03 949
딥러닝 합성곱 신경망(CNN) 개요 file 깊은바다 2017-03-05 7775
텐서플로우로 선형 회귀 구현 file 깊은바다 2017-03-09 1360
텐서플로우에서 소프트맥스로 숫자 인식 구현 file 깊은바다 2017-03-09 1373
텐서플로우에서 딥러닝 CNN으로 숫자 인식 구현 file 깊은바다 2017-03-11 5012
딥러닝의 종류 간단 설명 file 깊은바다 2017-03-11 25168