레플리
글 수 497


 

https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=102&oid=005&aid=0001369774

 

 

 

"실습 훈련 나흘째였던 9월 14일, 11장짜리 과학 논문을 데이터로 편집하는 동안 띄어쓰기 오류 194개를 발견했다. PDF 형태의 논문을 HTML 데이터로 바꾸는 과정에서 피할 수 없는 일이었다. 교육시간에 강사는 “데이터에 오탈자가 있으면 AI가 올바르게 학습할 수 없다”고 말했다. AI의 작동을 위해 잘못된 띄어쓰기를 일일이 이어붙이는 게 기자와 같은 ‘데이터 구축자’의 일이었다."

 

디지털 뉴딜 사업의 일환으로 KISTI에서 데이터 구축 업무를 진행 중입니다. 기자가 직접 참여를 하여 그 과정을 자세히 보여주고 있습니다. 역시 학습 데이터를 만드는게 쉽지 않은 것 같습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
시티은행, 지점 80% 폐쇄하고 온라인 거래에 집중 [2] 깊은바다 2017-04-14 60
인공지능으로 콜센터 직원 사라질까? 깊은바다 2019-04-02 70
가정용 로봇 시장 비상은 가능한가? 깊은바다 2019-06-04 74
요리 로봇, 셰프를 대체할 것인가? 깊은바다 2019-03-22 78
페이스북, 알렉사 대항마 만든다 깊은바다 2019-04-19 82
인지 과학자 AI 의식 열린 가능성 인정 깊은바다 2020-11-30 85
미국, 6명중 1명 인공지능 스피커 사용 [4] 깊은바다 2018-01-21 86
인공지능, 노동을 지배한다 깊은바다 2020-02-17 86
코로나로 부쩍 늘어난 식품점 로봇 깊은바다 2020-05-05 86
월마트,'로봇의 역습' 시작됐나? 깊은바다 2019-07-22 87
기사 로봇 '기자들은 편히 쉬세요' 깊은바다 2019-06-22 88
'AI가 인류 위협' vs '무책임한 주장', 날선 공방 벌인 머스크와 저커버그 [2] 깊은바다 2017-07-26 89
가정에 '소셜로봇'이 없다고? 깊은바다 2019-02-18 90
소셜로봇과의 대화가 갖는 의미 깊은바다 2020-01-25 90
인공지능 '왓슨', IBM에 10조원 벌어줬다 깊은바다 2017-04-17 93