레플리
글 수 293

Word2Vec 테스트 사이트

조회 수 1327 추천 수 0 2019.01.13 00:24:51


K-001.png

http://w.elnn.kr/

 

 

 

딥러닝 자연어처리의 기본인 워드 임베딩(word embedding)을 한글로 테스트하는 사이트입니다. 첨부한 그림처럼 x라는 벡터의 차이만큼 새로운 단어를 찾을 수 있습니다. 주의할 점은 '한국-서울+도쿄 = 일본' 처럼 'A-B+C'에서 C는 B와 같은 종류(여기서는 수도)를 가져야 한다는 것입니다.

 

 

 

몇가지 예를 들어보면 다음과 같습니다. 하지만 모든 경우에 대해서 완벽하게 동작하지는 않습니다^^;

 

여자-여왕+왕 = 남자
개그맨-유재석+아이유 = 가수
유재석-개그맨+가수 = 김경호(?)
일본-우동+불고기 = 한국
우동-일본+한국 = 짜장

List of Articles
제목 글쓴이 날짜 조회 수
Word2Vec 테스트 사이트 file 깊은바다 2019-01-13 1327
딥러닝 자연어처리 - RNN에서 BERT까지 [2] 깊은바다 2019-01-07 1835
BERT를 이용한 챗봇 구현 file 깊은바다 2019-01-07 4172
사전훈련 자연어처리 모델의 발전과정 - The Illustrated BERT, ELMo, and co. 깊은바다 2019-01-01 1424
2018 Amazon Prize에서 우승한 Gunrock 소셜봇 file 깊은바다 2018-12-26 591
BERT 톺아보기 깊은바다 2018-12-17 26581
한국어 형태소 분석기 성능 비교 - khaiii 깊은바다 2018-12-10 1484
카카오 형태소 분석기(khaiii) 설치와 은전한닢(mecab) 형태소 분석기 비교 깊은바다 2018-12-02 2855
카카오의 딥러닝 기반 형태소 분석기 깊은바다 2018-11-30 516
위키정보를 찾아 잡담을 하는 딥러닝 모델 - Wizard Of Wikipedia file 깊은바다 2018-11-29 943
구글 듀플렉스(Duplex) 상용화 시작 [2] 깊은바다 2018-11-26 669
딥러닝 자연어처리 튜토리얼 - DLK2NLP [1] 깊은바다 2018-11-24 1242
커뮤니케이션과 AI - Multi-channel CNN을 이용한 한국어 감성분석 깊은바다 2018-11-22 1187
개체명인식 with Naver 깊은바다 2018-11-20 2352
사전학습을 통한 구글의 자연어처리 언어 모델 - BERT file 깊은바다 2018-11-03 4337