레플리
글 수 284

Word2Vec 테스트 사이트

조회 수 1200 추천 수 0 2019.01.13 00:24:51


K-001.png

http://w.elnn.kr/

 

 

 

딥러닝 자연어처리의 기본인 워드 임베딩(word embedding)을 한글로 테스트하는 사이트입니다. 첨부한 그림처럼 x라는 벡터의 차이만큼 새로운 단어를 찾을 수 있습니다. 주의할 점은 '한국-서울+도쿄 = 일본' 처럼 'A-B+C'에서 C는 B와 같은 종류(여기서는 수도)를 가져야 한다는 것입니다.

 

 

 

몇가지 예를 들어보면 다음과 같습니다. 하지만 모든 경우에 대해서 완벽하게 동작하지는 않습니다^^;

 

여자-여왕+왕 = 남자
개그맨-유재석+아이유 = 가수
유재석-개그맨+가수 = 김경호(?)
일본-우동+불고기 = 한국
우동-일본+한국 = 짜장

List of Articles
제목 글쓴이 날짜 조회 수sort
OpenAI Transformer GPT2로 만든 언어 모델 깊은바다 2019-02-17 2980
카카오 형태소 분석기(khaiii) 설치와 은전한닢(mecab) 형태소 분석기 비교 깊은바다 2018-12-02 2828
구글 딥러닝 자연어 처리 오픈소스 SyntaxNet file 깊은바다 2017-12-28 2784
그림으로 아주 쉽게 설명한, The Illustrated GPT-2 깊은바다 2020-08-15 2783
추론이 가능한 딥러닝인 Relational Networks [2] 깊은바다 2017-06-11 2740
Python과 Tensorflow를 활용한 AI Chatbot 개발 및 실무 적용 깊은바다 2017-08-25 2582
GPT-3를 강화학습으로 업그레이드한 InstructGPT file 깊은바다 2022-01-30 2569
오픈소스 한국어 딥러닝 챗봇 - Kochat 깊은바다 2020-07-03 2503
딥러닝을 사용하여 의도 및 엔티티를 파악하는 챗봇 소스코드 file 깊은바다 2019-06-25 2329
개체명인식 with Naver 깊은바다 2018-11-20 2320
BERT로 토익 문제를 푸는 프로젝트 file 깊은바다 2019-04-30 2283
GPT2에서 문장 생성 시 단어를 확률에 따라 선택하는 방법 깊은바다 2020-07-16 2206
소설을 생성하는 NarrativeKoGPT2 file 깊은바다 2020-06-19 2198
GPT2로 만든 텍스트 어드벤처 게임 깊은바다 2019-12-09 2010
딥러닝으로 욕설 탐지하기 깊은바다 2018-08-06 1881