글 수 200

word2vec 질문입니다.

조회 수 181 추천 수 0 2021.09.13 15:39:30


Skip-Gram 모델에서 input 값을 원핫 인코딩을 할 때 학습할 모든 단어에 대한 원핫 인코딩하는 것인가요 아님 특정 문장이나 스라이딩 윈도우에 대한 원핫 인코딩인가요

이부분이 햇갈리네요

엮인글 :

깊은바다

2021.09.14 18:00:44
*.106.133.224

입력과 출력의 원핫인코딩은 같은 딕셔너리를 사용합니다. 학습 데이터의 전체 단어집합으로 구성되어 있습니다. 이 원핫인코딩의 1 위치의 w가 해당 단어의 벡터값이 됩니다. 특정 문장의 원핫인코딩이면 10~20개 정도의 단어(벡터의 차원수)로 될텐데요. 문장마다 윈핫인코딩의 각 단어 역시 달라지고요. 그러면 word2vec을 만들 수가 없습니다.

List of Articles
제목 글쓴이 날짜 조회 수
2021 판교 AI Challenge 경진대회 개최 안내 file 운영사무국 2021-09-16 85
word2vec 질문입니다. [1] 노력하는돌 2021-09-13 181
[판교 AI Camp] 온라인 인공지능 대회 - 온라인 교육 진행 file 운영사무국 2021-08-27 636
안녕하세요. 제가 속해있는 회사에서 딥러닝 엔지니어를 채용합니다. 깊은바다 2021-08-02 802
딥러닝에 대한 질문드려용 [1] 병쥐 2021-05-17 123
GPT-3를 사용한 AI Dungeon, 문장 필터링에 문제 발생 깊은바다 2021-05-07 132
최근에 KoGpt2 모델 써보신분 있으신가요? [2] 안녕하세영 2021-04-15 296
기존 RNN, Transformer 보다 강력한 시계열 망 입니다. 가을전설 2021-04-08 158
일상대화 챗봇에 도전하실 서버 개발자분을 CTO로 모십니다 깊은바다 2021-04-01 261
데이터 종류에 대해서 궁금합니다. [2] 노력하는돌 2021-03-22 144
외국인 인공지능 개발 분야 국내 취업이 어려울까요? [2] 삼바 2021-02-15 326
인공지능으로 인간의 행동을 통제 [1] dlrjsanjswl 2021-02-11 282
정규표현식이 어려워서 제가 자주사용하는 기능만 만들어놨습니다. Nike 2021-02-05 185
텍스트 전처리시 RAM 스펙 질문 [2] Nike 2021-02-03 148
Text Summarization에 관련한 질문 [2] Nike 2021-01-28 210