레플리
글 수 203


K-001.png

 

http://aidev.co.kr/chatbotdeeplearning/8881

 

 

 

며칠 전 구글에서 Meena라는 일상대화 모델을 공개했습니다. 파라미터나 데이터셋의 크기가 기존 모델들보다 압도적으로 많습니다. TPU-v3 2048 코어로 한 달이나 돌렸는데요. 구글 클라우드로 대충 13억 정도입니다. 개발을 위해서 여러 번 학습한다는 것을 감안하면 총 비용은 훨씬 올라갑니다.

 

최근 IT 기술이 딥러닝으로 이동하는 추세입니다. 몇 년전에는 딥러닝 모델을 만들때 컴퓨터 한 대로 하루 이틀 학습하면 충분했었는데요. 이제는 작은 스타트업이 감당하기 점점 어려워지고 있습니다. 아무리 개인 역량이 뛰어나다고 해도 충분한 자원이 없으면 경쟁에 불리합니다.

 

소규모 업체는 보통 GPU 달린 컴퓨터에 모델을 돌려놓고 다음 날 확인을 합니다. 결과를 보고 조금 수정하고 실행시켜고 또 한참을 대기합니다. 반면에 구글 같은 기업들은 TPU Pod 같은 고성능 머신을 동시에 여러개 운영하며 테스트합니다. 당연히 개발 속도에서 따라잡기가 불가능합니다. 앞으로 딥러닝 시대에는 글로벌 대기업과 나머지 업체들간의 차이가 점점 커질거라 생각합니다.

엮인글 :
List of Articles
제목 글쓴이 날짜sort 조회 수
딥페이크 알고리즘 설명 깊은바다 2020-07-16 1785
대학교 게시판을 크롤링하여 만든 GPT2 모델 file 깊은바다 2020-07-18 916
자신의 사진과 선택한 옷들을 GAN으로 합성해서 보여주는 딥러닝 깊은바다 2020-07-21 1889
말로 설명하면 사진을 만들어주는 딥러닝 모델 - RetrieveGAN 깊은바다 2020-07-26 632
배치 사이즈에 따라 GPU 메모리가 증가하는 이유 깊은바다 2020-07-28 5257
StyleGAN을 이말년 웹툰으로 파인튜닝한 모델 깊은바다 2020-08-07 2714
셀카를 일반 사진으로 변환해주는 GAN 모델 - Unselfie file 깊은바다 2020-08-08 894
사진 한장으로 딥페이크 영상을 만드는 앱 - Reface 깊은바다 2020-08-18 27017
사진을 복원하는 딥러닝 모델 - DFDNet 깊은바다 2020-08-24 1223
3초 분량의 100만개 동영상 데이터셋 - Moments in Time 깊은바다 2020-09-05 575
AI 없이 힘낼 수 없는 엔비디아 지포스 RTX - 딥러닝 DLSS 기술 깊은바다 2020-09-07 517
사진을 디즈니 만화로 바뀌주는 딥러닝 모델 - Toonify 깊은바다 2020-09-21 1343
앤드류 응의 YOLO 강의 영상 깊은바다 2020-09-23 838
파이토치 버전 YOLO Colab 테스트 코드 file 깊은바다 2020-09-25 597
이미지 생성모델에서 특징 벡터를 추출하여 사진을 조작하는 방법 file 깊은바다 2020-10-09 1575