레플리
글 수 283

Word2Vec 테스트 사이트

조회 수 1197 추천 수 0 2019.01.13 00:24:51


K-001.png

http://w.elnn.kr/

 

 

 

딥러닝 자연어처리의 기본인 워드 임베딩(word embedding)을 한글로 테스트하는 사이트입니다. 첨부한 그림처럼 x라는 벡터의 차이만큼 새로운 단어를 찾을 수 있습니다. 주의할 점은 '한국-서울+도쿄 = 일본' 처럼 'A-B+C'에서 C는 B와 같은 종류(여기서는 수도)를 가져야 한다는 것입니다.

 

 

 

몇가지 예를 들어보면 다음과 같습니다. 하지만 모든 경우에 대해서 완벽하게 동작하지는 않습니다^^;

 

여자-여왕+왕 = 남자
개그맨-유재석+아이유 = 가수
유재석-개그맨+가수 = 김경호(?)
일본-우동+불고기 = 한국
우동-일본+한국 = 짜장

List of Articles
제목 글쓴이 날짜sort 조회 수
소설을 생성하는 NarrativeKoGPT2 file 깊은바다 2020-06-19 2195
주석을 프로그램으로 변환하는 GPT 모델 깊은바다 2020-06-21 480
KoGPT2를 파인튜닝하여 만든 챗봇 깊은바다 2020-06-23 3520
오픈소스 한국어 딥러닝 챗봇 - Kochat 깊은바다 2020-07-03 2501
GPT2에서 문장 생성 시 단어를 확률에 따라 선택하는 방법 깊은바다 2020-07-16 2202
GPT3로 하는 리액트 프로그래밍 file 깊은바다 2020-07-19 769
네이버 뉴스 댓글로 사전훈련한 구어체 모델 - KcBERT 깊은바다 2020-07-20 814
GPT3 튜링 테스트 깊은바다 2020-07-23 668
GPT3가 상식을 가지고 있을까 깊은바다 2020-07-24 741
KoGPT2, KoBERT, KoELECTRA로 만든 심리상담 챗봇 file 깊은바다 2020-08-05 6364
한국어로 대화하는 생성 모델의 학습을 위한 여정 - Transformer와 GPT2 깊은바다 2020-08-13 3565
그림으로 아주 쉽게 설명한, The Illustrated GPT-2 깊은바다 2020-08-15 2777
GPT-3의 다섯 가지 한계 깊은바다 2020-08-23 1053
GPT3 유료화 가격 공개 file 깊은바다 2020-09-04 1748
GPT-3 패러다임을 바꿀 미친 성능의 인공지능 등장 및 활용 사례 10가지 깊은바다 2020-09-14 799