레플리
글 수 222

방향을 잡지못해 질문 드립니다.

조회 수 286 추천 수 0 2019.07.10 08:55:14


안녕하세요.

머신러닝을 이제 시작하는 아무것도 모르는 새내기 입니다.

 

다름이 아니라, 하고자하는 목표를 달성하기 위해서 

어떤 방식으로 접근해야 할지 명확치 않아 질문 드립니다.

 

PDF 나 워드 또는 한글 파일에서 텍스트를 추출하여 

추출된 내용으로 

표지,
항목, 
 항목의 내용 등을  
학습을 통하여 인지 하려고 합니다.

ex ) 

//============== 이런유형은 목차 ================

개인신용정보 제공·이용에 대한 고객 권리 안내 ··································7 
메리츠금융그룹 고객정보의 취급방침 ···················································10 
보험금 지급절차 안내장 ···········································································14 
안내말씀 ·······································································································17 
유의사항 ·······································································································17 
=========================================//

//=== 이런 유형은 항목 ==========

1. 금융서비스 이용 범위  

==========================//

//===== 이런 유형은 항목의 내용 ==================================

가. 고객의 개인신용정보는 금융거래의 설정 ․ 유지여부 판단 목 적 및 고객이 동의한 목적만으로 이용됩니다.  
나. 고객은 영업장 ․ 인터넷 등 다양한 채널을 통해 금융거래를 체결하거나 금융서비스를 제공받는 과정에서 
1) 금융회사가 본인의 개인신용정보(이하 ‘본인정보’)를 제휴 ․ 부가서비 스 등을 위해 제휴회사 등에 제공하는 것 및 
2) 당해 금융회 사가 금융상품 소개 및 구매권유(이하 ‘마케팅’) 목적으로 이용하는 것에 대해 동의를 하지 않는 경우에도 금융거래를 체결하거나 금융서비스를 이용하실 수 있습니다. 

=========================================================//

제 생각엔 비지도 학습으로 접근하는게 맞는거 같은데.
명확치 않고, 비지도 학습이 맞아면 어떤 알고리즘으로 접근하는것이 맞는것인지.
아니면 다른 학습 방으로 접근 하는것이 맞는지.

조언 부탁 드립니다.

감사합니다.

 

엮인글 :

깊은바다

2019.07.10 15:27:35
*.68.247.186

비지도학습보다는 지도학습이 더 적합할 것 같습니다. 각 문장마다 라벨을 달고, 분류 모델로 학습하는게 어떨까요. 만약 1, 1) 등 형식이 일정하다면 굳이 학습을 적용할 필요가 없을 수도 있습니다. 그냥 룰베이스도 해도 충분할 듯 합니다.

몽이삼촌

2019.07.10 17:30:46
*.98.2.63

형식이 일정하지 않은 비 정형 데이터가 기준이기에 학습을 적용 하려 합니다.

방향을 잡을수 있을것 같습니다.

답변 감사드립니다.

 

 

sspuha

2019.07.31 14:21:45
*.237.126.90

굳이 머신런닝을 넣으셔야한다면 지도학습이겠지만, 정답셋을 만드는 노력으로 룰베이스 기반으로 만드시는게 훨씬 쉬울 겁니다.

List of Articles
제목 글쓴이 날짜 조회 수sort
카톡 대화를 학습하는 AI 아바타 챗봇 - 레플리 file 깊은바다 2024-01-17 371
안녕하세요, 가입 인사 겸 질문 올립니다. [2] 칼슘 2019-03-22 98
안녕하세요! 가입인사 드립니다. [1] EdenGloria 2019-07-22 102
ChatScript 관련 궁금한 것이 있습니다. [3] ranma 2018-02-23 104
요즘 부대 도서관에 인공지능 책이 자주 들어와서 좋네요. [1] NeuroWhAI 2018-02-24 105
오픈 컨트리뷰터의 코드 참고법에 대해 질문드립니다. [2] Roger 2020-10-19 109
딥러닝 관련 질문 (CPU -> GPU 설정 변환후, keras-tuner 돌릴때 error 발생) J814 2023-06-14 111
안녕하세요 [1] 이근섭 2018-08-08 112
다시 질문드립니다... [1] 칼슘 2019-04-12 112
사람들이 많지는 않네요 [3] 맛동산 2018-02-01 114
seq2seq train과 test 분리에 대한 질문 [4] Nike 2020-09-03 116
봉이 김선달의 대동강 비트워터 판매기 깊은바다 2018-01-13 117
가입인사겸 질문입니다! [1] 핵초보개발자 2018-08-02 119
안녕하세요 오늘 가입했습니다. [1] 복복 2019-08-06 119
삼성전자 '소프트웨어 개발회사 적극 사들일 것' 깊은바다 2016-03-26 121
가입 인사드립니다. [2] 민주아빠 2020-08-04 121