레플리
글 수 219

방향을 잡지못해 질문 드립니다.

조회 수 286 추천 수 0 2019.07.10 08:55:14


안녕하세요.

머신러닝을 이제 시작하는 아무것도 모르는 새내기 입니다.

 

다름이 아니라, 하고자하는 목표를 달성하기 위해서 

어떤 방식으로 접근해야 할지 명확치 않아 질문 드립니다.

 

PDF 나 워드 또는 한글 파일에서 텍스트를 추출하여 

추출된 내용으로 

표지,
항목, 
 항목의 내용 등을  
학습을 통하여 인지 하려고 합니다.

ex ) 

//============== 이런유형은 목차 ================

개인신용정보 제공·이용에 대한 고객 권리 안내 ··································7 
메리츠금융그룹 고객정보의 취급방침 ···················································10 
보험금 지급절차 안내장 ···········································································14 
안내말씀 ·······································································································17 
유의사항 ·······································································································17 
=========================================//

//=== 이런 유형은 항목 ==========

1. 금융서비스 이용 범위  

==========================//

//===== 이런 유형은 항목의 내용 ==================================

가. 고객의 개인신용정보는 금융거래의 설정 ․ 유지여부 판단 목 적 및 고객이 동의한 목적만으로 이용됩니다.  
나. 고객은 영업장 ․ 인터넷 등 다양한 채널을 통해 금융거래를 체결하거나 금융서비스를 제공받는 과정에서 
1) 금융회사가 본인의 개인신용정보(이하 ‘본인정보’)를 제휴 ․ 부가서비 스 등을 위해 제휴회사 등에 제공하는 것 및 
2) 당해 금융회 사가 금융상품 소개 및 구매권유(이하 ‘마케팅’) 목적으로 이용하는 것에 대해 동의를 하지 않는 경우에도 금융거래를 체결하거나 금융서비스를 이용하실 수 있습니다. 

=========================================================//

제 생각엔 비지도 학습으로 접근하는게 맞는거 같은데.
명확치 않고, 비지도 학습이 맞아면 어떤 알고리즘으로 접근하는것이 맞는것인지.
아니면 다른 학습 방으로 접근 하는것이 맞는지.

조언 부탁 드립니다.

감사합니다.

 

엮인글 :

깊은바다

2019.07.10 15:27:35
*.68.247.186

비지도학습보다는 지도학습이 더 적합할 것 같습니다. 각 문장마다 라벨을 달고, 분류 모델로 학습하는게 어떨까요. 만약 1, 1) 등 형식이 일정하다면 굳이 학습을 적용할 필요가 없을 수도 있습니다. 그냥 룰베이스도 해도 충분할 듯 합니다.

몽이삼촌

2019.07.10 17:30:46
*.98.2.63

형식이 일정하지 않은 비 정형 데이터가 기준이기에 학습을 적용 하려 합니다.

방향을 잡을수 있을것 같습니다.

답변 감사드립니다.

 

 

sspuha

2019.07.31 14:21:45
*.237.126.90

굳이 머신런닝을 넣으셔야한다면 지도학습이겠지만, 정답셋을 만드는 노력으로 룰베이스 기반으로 만드시는게 훨씬 쉬울 겁니다.

List of Articles
제목 글쓴이 날짜 조회 수
카톡 대화를 학습하는 AI 아바타 챗봇 - 레플리 file 깊은바다 2024-01-17 354
데이터 종류에 대해서 궁금합니다. [2] 노력하는돌 2021-03-22 204
외국인 인공지능 개발 분야 국내 취업이 어려울까요? [2] 삼바 2021-02-15 401
인공지능으로 인간의 행동을 통제 [1] dlrjsanjswl 2021-02-11 342
정규표현식이 어려워서 제가 자주사용하는 기능만 만들어놨습니다. Nike 2021-02-05 235
텍스트 전처리시 RAM 스펙 질문 [2] Nike 2021-02-03 195
Text Summarization에 관련한 질문 [2] Nike 2021-01-28 298
안녕하세요 이제 막 공부하기 시작한 학부생입니다. sk211 2021-01-16 192
파일을 AI를 통해 자동 분류가 가능할까요? [1] ghghgh 2021-01-10 408
Dialogflow로 이미지 불러오기가 가능할까요? [2] 재앤더플루이드 2021-01-06 380
웹 상에서 그래프 그리기 nari 2021-01-05 189
[가입인사] AI STARTUP 기업과 개발자 자료를 검색하다가 등록합니다. [1] hornet 2020-12-07 177
데이터 라벨링 후 궁금증 [1] fex5360 2020-11-26 193
딥러닝 어플리케이션을 쉽게 만들수있는 서비스 DLBuilder file DLBuilder 2020-11-20 192
스타트업 관련 인공지능 머신러닝 궁금증 Kyle13 2020-11-10 189
오픈 컨트리뷰터의 코드 참고법에 대해 질문드립니다. [2] Roger 2020-10-19 109