레플리
글 수 283

딥러닝을 활용한 뉴스 메타 태깅

조회 수 379 추천 수 0 2019.08.26 02:22:21


뉴스 기사 분석을 위한 고려 사항들
뉴스 기사 콘텐츠를 “있는 그대로” 분석에 활용
• 형태소 분석, Word Embedding 보다는 Character 단위 처리

==> 기사 제목이나 본문의 특징적 기호 활용 (예:...

 

https://www.slideshare.net/ifkakao/ss-113740929

 

 

 

뉴스의 종류나 성격 같은 메타를 딥러닝으로 구분하는 방법에 대한 자료입니다. 이렇게 텍스트를 통해 메타를 추출한 다음, 사용자에게 맞는 뉴스를 추천하는데 활용할 수 있습니다.

 

캐릭터 글자 기반의 1D Convolution으로 딥러닝 모델을 구성하였습니다. 이후 정확도를 높이기 위해 여러가지 방법을 테스트하였습니다. 입력을 600글자에서 1014글자로 늘리고, 학습 데이터의 클래스가 편중되지 않게 보강한 것이 효과적이었다고 합니다.

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
KoGPT2 v2.0 공개 깊은바다 2021-05-03 1589
GPT2로 글을 작성하는 사이트 - StoryAI file 깊은바다 2019-10-11 1582
KoNLPy를 이용하여 Huggingface Transformers 학습하기 깊은바다 2020-09-20 1571
Java에서 Word2vec 사용하기 깊은바다 2018-05-05 1562
글쓰는 법을 배우는 신경망 깊은바다 2016-03-25 1539
딥러닝 자연어처리 라이브러리 - Pororo file 깊은바다 2021-02-03 1529
일상대화 챗봇 레플리카(Replika)의 구현 방식 file 깊은바다 2020-12-22 1508
딥러닝으로 미소녀 챗봇 만들기 깊은바다 2018-06-01 1497
챗봇의 슬롯 채우기(Slot Filling)와 DST(Dialogue State Tracking) file 깊은바다 2021-08-19 1471
GPT-3로 NPC와 대화를 할 수 있는 게임 시뮬레이터 깊은바다 2021-02-22 1463
문장의 유사성을 예측하고 평가하는 AI - 카카오 심슨 깊은바다 2019-03-20 1461
한국어 형태소 분석기 성능 비교 - khaiii 깊은바다 2018-12-10 1447
GPT가 스스로 계획을 세워서 실행한다면 - AutoGPT와 LangChain file 깊은바다 2023-04-18 1446
문장을 사진으로 변환하는 StackGAN [1] 깊은바다 2018-09-17 1435
페이스북이 발표한 사전훈련 언어모델 RoBERTa file 깊은바다 2019-07-30 1429