글 수 181

Word2Vec 테스트 사이트

조회 수 937 추천 수 0 2019.01.13 00:24:51


K-001.png

http://w.elnn.kr/

 

 

 

딥러닝 자연어처리의 기본인 워드 임베딩(word embedding)을 한글로 테스트하는 사이트입니다. 첨부한 그림처럼 x라는 벡터의 차이만큼 새로운 단어를 찾을 수 있습니다. 주의할 점은 '한국-서울+도쿄 = 일본' 처럼 'A-B+C'에서 C는 B와 같은 종류(여기서는 수도)를 가져야 한다는 것입니다.

 

 

 

몇가지 예를 들어보면 다음과 같습니다. 하지만 모든 경우에 대해서 완벽하게 동작하지는 않습니다^^;

 

여자-여왕+왕 = 남자
개그맨-유재석+아이유 = 가수
유재석-개그맨+가수 = 김경호(?)
일본-우동+불고기 = 한국
우동-일본+한국 = 짜장

List of Articles
제목 글쓴이 날짜 조회 수
워드 임베딩에 대한 아주 쉬운 설명 - The Illustrated Word2vec 깊은바다 2019-04-09 653
대화 인공지능 대회 - ConvAI file 깊은바다 2019-03-25 596
문장의 유사성을 예측하고 평가하는 AI - 카카오 심슨 깊은바다 2019-03-20 1379
OpenAI Transformer GPT2로 만든 언어 모델 깊은바다 2019-02-17 2921
텐서플로에서 사전 훈련된 임베딩을 사용하는 예제 깊은바다 2019-02-02 437
목적지향 대화 학습 - Learning End-to-End Goal-Oriented Dialog file 깊은바다 2019-02-02 1008
문장을 입력하면 비슷한 짤방을 보여주는 프로젝트 file 깊은바다 2019-01-28 5900
Word2Vec의 학습 방식 깊은바다 2019-01-17 853
Word2Vec 테스트 사이트 file 깊은바다 2019-01-13 937
딥러닝 자연어처리 - RNN에서 BERT까지 [2] 깊은바다 2019-01-07 1678
BERT를 이용한 챗봇 구현 file 깊은바다 2019-01-07 3891
사전훈련 자연어처리 모델의 발전과정 - The Illustrated BERT, ELMo, and co. 깊은바다 2019-01-01 1309
2018 Amazon Prize에서 우승한 Gunrock 소셜봇 file 깊은바다 2018-12-26 499
BERT 톺아보기 깊은바다 2018-12-17 24026
한국어 형태소 분석기 성능 비교 - khaiii 깊은바다 2018-12-10 1355