레플리
글 수 222

안녕하세요 seq2seq에 대한 질문 있습니다...

조회 수 204 추천 수 0 2018.05.31 12:32:10


안녕하세요 저는 현재 seq2seq를 이용하여 문단에서 특정 내용을 추출하여 문장을 생성하는 것을 러닝을 통해 시도해 보고자 하는 학생입니다. 새로운 문단을 통해 문장을 생성하려고 하니 원하는 문장을 추출하는데 막혀서 질문을 올리게 되었습니다..
가령 1번문단에서 1번의 문장을 추출하였고 2번문단에서 2번의 문장을 추출하는 과정의 반복을 통해 1000번문단에서 1000번의 문장까지 추출한 데이터를 통해 학습을 시켰을 때 테스트를 위해 1001번문장을 넣어주었을 때 알맞은 1001번의 문장이 나오도록 해주려면 이 1000개의 학습데이터 수를 단지
10000 혹은 그 이상으로 수만 증가시켜도
되는 것인가요, 아니면 테스트에 활용되는 문단에서 사용되는 단어가 들어있는 문단들을 위주로 더 학습을 시켜야 하는 것인가요...
엮인글 :

깊은바다

2018.05.31 12:53:46
*.68.247.188

https://ratsgo.github.io/natural%20language%20processing/2017/03/12/s2s/

 

이걸 참조해보시는게 좋을 것 같네요. 테스트에 활용되는 문장들 위주로 학습하는건 안될 것 같습니다. 그렇게 하면 일반적인 문장에서 결과가 잘 안나올테니까요. 링크에서도 나와있다시피 문서요약을 Seq2Seq로 하는건 성능이 좋지 않다고 합니다. 번역 같은 경우 거의 1:1 대응이 될 정도로 의미가 일치하지만, 요약은 너무 범위가 넓기 때문인 것 같습니다. 

jjdh

2018.06.11 19:36:46
*.246.242.115

답변 감사합니다. 

제가 추출하려는게 문단에서 주된 일정을 찾아보려고 하는 건데요.

혹시 특정 좁은 주제(제한된 조건)에서라도 축소해서 해보려고 하면 테스트에 활용되는 문장들 위주로 학습하는 것이 도움이 될까요. 결국에는 러닝시에 요약 결과는 학습된 데이터들의 결과 중 하나가 나오게 되는데 이에 대해 원하는 결과가 나오려면 테스트 데이터가 학습이 되어있지 않고서는 나오기가 어려울 것 같아서요. 이렇게 되면 러닝을 이용해서 작성하는 것보다 알고리즘을 통한 추출이 정확도가 좀더 높게 나올 수도 있을 것 같고...

List of Articles
제목 글쓴이 날짜sort 조회 수
카톡 대화를 학습하는 AI 아바타 챗봇 - 레플리 file 깊은바다 2024-01-17 373
국제인공지능대전 페르소나AI 부스 체험! 다오 2024-05-01 31
♥ 청년취업사관학교 새싹(SeSAC) 영등포캠퍼스 SW과정 올해 마지막 모집 (~ 06.09) ♥ file 새싹SeSAC 2024-04-30 9
제3회 ETRI 휴먼이해 인공지능 논문경진대회 file 인공지능팩토리1 2024-04-22 33
서울시 AI 자동화 로봇 교육 인턴 교육생 모집 (알바말고 인턴어때? 인턴급여 총 717만원 지급, 교육여비 총 100만원 지급) file 싱킹가든 2024-04-19 34
안녕하세요 ^^ [1] kajun2 2024-04-13 61
[전액국지비원] [빅데이터/AI] [2024 채용연계형 SW 전문인재양성 무료 교육과정 교육생 모집] file 벡스 2024-04-11 51
서울시 AI 자동화 교육 인턴교육생 모집 (알바말고 인턴어때? 인턴급여 3개월 지급, 교육여비 100만원 지급) 싱킹가든 2024-04-09 85
가입인사 드립니다. [1] 리얼허브 2024-04-02 66
논문 이해의 필요성(질문) [1] 썸머ai 2024-01-08 203
메타버스+초거대AI 서비스 기획 공모전 file [1] 깊은바다 2023-08-16 179
음성 데이터셋 정보를 한 번에 탐색 할 수 있는 아카이브를 만들었습니다! (SODA) file ODA 2023-06-14 93
딥러닝 관련 질문 (CPU -> GPU 설정 변환후, keras-tuner 돌릴때 error 발생) J814 2023-06-14 111
(주)레플리에서 일상대화 AI에 도전하실 분을 찾습니다 깊은바다 2023-01-19 220
안녕하세요 처음으로 만들어본 챗봇 공유해봅니다. [1] KimYH 2023-01-18 271