레플리
글 수 283

쉽게 씌어진 Word2Vec

조회 수 1178 추천 수 0 2017.12.25 11:13:03


https://dreamgonfly.github.io/machine/learning,/natural/language/processing/2017/08/16/word2vec_explained.html

 

 

 

자연어처리를 할때 룰베이스 기반이라면 바로 문자열을 사용하여 비교를 할 수 있습니다. 하지만 딥러닝에서 문장을 입력으로 받으려면 우선 숫자 형식으로 변환을 해야 합니다.

 

One-Hot encoding 같은 단순한 방법도 있지만 보통은 Word2Vec처럼 단어 임베딩을 사용합니다. 이에 대해서 정말 쉽고 자세하게 설명한 글입니다.

 

 

 

http://w.elnn.kr/search/

 

위의 링크는 Word2Vec를 테스트해 볼 수 있는 페이지입니다. 예를 들어, '한국 - 서울 + 도쿄 = 일본' 같이 벡터로 표현된 단어의 연산을 통해 비슷한 의미의 단어를 찾을 수도 있습니다. 

 

엮인글 :

NeuroWhAI

2017.12.25 20:52:44
*.64.194.131

오 감사합니다. 마침 필요했는데.

깊은바다

2017.12.25 23:08:08
*.68.247.188

^_^

List of Articles
제목 글쓴이 날짜 조회 수sort
스캐터랩의 오픈도메인 챗봇 루다 육아일기 - 모델의 구조 및 동작방식 file 깊은바다 2020-12-30 1191
메타, GPT-3와 동급인 175B의 초거대모델 무료 공개 깊은바다 2022-05-04 1189
최신 자연어처리 모델 소개 file 깊은바다 2022-07-11 1180
딥러닝 기반 자연어 언어모델 BERT - Colab 실습 코드 포함 file 깊은바다 2019-09-02 1179
쉽게 씌어진 Word2Vec [2] 깊은바다 2017-12-25 1178
커뮤니케이션과 AI - Multi-channel CNN을 이용한 한국어 감성분석 깊은바다 2018-11-22 1156
퓨샷(few-shot) 러닝에 최적화된 GPT3 모델 file 깊은바다 2020-05-30 1156
유저 피드백을 받아 지속적으로 학습을 하는 챗봇 - BlenderBot 3 file 깊은바다 2022-08-06 1154
LLM의 새로운 기법 - Merge와 DPO file 깊은바다 2024-01-02 1152
딥러닝 질의응답 시스템인 cdQA-suite 깊은바다 2020-03-08 1144
WizardLM의 Evol-instruct로 직접 한글 데이터셋을 만든 모델 file 깊은바다 2023-06-19 1136
다이나믹 메모리 네트워크 정리 file 깊은바다 2018-09-29 1135
딥러닝을 이용한 자연어 처리 입문 - 위키독스 깊은바다 2018-09-21 1108
Dialog-BERT: 100억건의 메신저대화로 일상대화 인공지능 서비스하기 file [1] 깊은바다 2020-04-19 1093
딥러닝으로 욕설 탐지하기 file [2] 깊은바다 2018-05-04 1073