레플리
글 수 282

여러 한국어 GPT 모델들

조회 수 3320 추천 수 0 2021.11.21 18:01:22


kogpt2.png

https://github.com/SKT-AI/KoGPT2

https://huggingface.co/skt/kogpt2-base-v2

 

지난 5월에는 SKT의 KoGPT2 v2.0 모델이 공개됐습니다. 학습에 사용된 데이터셋이 기존 20GB에서 40GB으로 두 배 증가했고, 혼잡도(Perplexity)도 45% 감소했습니다.

 

 

gpt2trinity.png

 

https://huggingface.co/skt/ko-gpt-trinity-1.2B-v0.5

 

마찬가지로 5월에 GPT-3의 구조를 모방한 Ko-GPT-Trinity라는 모델이 공개됐습니다. 파라미터의 수가 1.2B로 125M이었던 KoGPT2에 비해 크게 늘어났습니다.

 

 

kogpt.png

https://github.com/kakaobrain/kogpt

https://huggingface.co/kakaobrain/kogpt

https://huggingface.co/spaces/akhaliq/kogpt

 

그리고 며칠 전 카카오에서도 GPT 모델을 공개했습니다. 파라미터의 수가 6B로 가장 큽니다. 카카오는 앞으로 GPT 모델의 크기와 성능을 100배 규모로 키울 예정이라고 밝혔습니다.

 


깊은바다

2021.11.22 18:16:50
*.106.133.166

좋은 정보 감사합니다!

List of Articles
제목 글쓴이 날짜sort 조회 수
사진을 인식할 수 있는 ChatGPT 멀티모달 버전 공개 file 깊은바다 2023-09-26 276
Poe에 추가된 업스테이지의 LLM, Solar-70b file 깊은바다 2023-09-18 428
RAG 아키텍처를 위한 임베딩 모델의 선택에 대해 깊은바다 2023-09-14 511
LLM의 미래는 자율행동과 멀티 에이전트 깊은바다 2023-08-30 298
LLM이 서로 협력하여 프로그램을 개발 - ChatDev file 깊은바다 2023-08-16 743
GPT-4에 CoT 프롬프를 적용하여 2023 수능 국어 1등급 달성 file 깊은바다 2023-08-08 608
LLM의 창발적인 현상인 CoT(Chain of Thouht) 소개 file 깊은바다 2023-07-27 697
RAG 아키텍처의 이해 깊은바다 2023-07-23 1317
GPT-4 세부구조에 대한 정보 유출 깊은바다 2023-07-20 455
Llama 2의 RLHF 구현 방법 깊은바다 2023-07-19 711
한국어 LLM 민주화의 시작 KoAlpaca file 깊은바다 2023-07-17 1043
레포트를 써주는 LLM - GPT Researcher file 깊은바다 2023-07-13 389
LLM 챗봇의 특징 2가지 - RAG와 Function 깊은바다 2023-07-06 1184
RAG(Retrieval-Augmented Generation) - LLM의 환각을 줄이는 방법 file 깊은바다 2023-07-04 9545
Generative AI — 시장 구조, 기회, moat에 대한 몇 가지 생각 깊은바다 2023-06-27 301