https://dreamgonfly.github.io/machine/learning,/natural/language/processing/2017/08/16/word2vec_explained.html
자연어처리를 할때 룰베이스 기반이라면 바로 문자열을 사용하여 비교를 할 수 있습니다. 하지만 딥러닝에서 문장을 입력으로 받으려면 우선 숫자 형식으로 변환을 해야 합니다.
One-Hot encoding 같은 단순한 방법도 있지만 보통은 Word2Vec처럼 단어 임베딩을 사용합니다. 이에 대해서 정말 쉽고 자세하게 설명한 글입니다.
http://w.elnn.kr/search/
위의 링크는 Word2Vec를 테스트해 볼 수 있는 페이지입니다. 예를 들어, '한국 - 서울 + 도쿄 = 일본' 같이 벡터로 표현된 단어의 연산을 통해 비슷한 의미의 단어를 찾을 수도 있습니다.
오 감사합니다. 마침 필요했는데.