레플리
글 수 497


 

https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=102&oid=005&aid=0001369774

 

 

 

"실습 훈련 나흘째였던 9월 14일, 11장짜리 과학 논문을 데이터로 편집하는 동안 띄어쓰기 오류 194개를 발견했다. PDF 형태의 논문을 HTML 데이터로 바꾸는 과정에서 피할 수 없는 일이었다. 교육시간에 강사는 “데이터에 오탈자가 있으면 AI가 올바르게 학습할 수 없다”고 말했다. AI의 작동을 위해 잘못된 띄어쓰기를 일일이 이어붙이는 게 기자와 같은 ‘데이터 구축자’의 일이었다."

 

디지털 뉴딜 사업의 일환으로 KISTI에서 데이터 구축 업무를 진행 중입니다. 기자가 직접 참여를 하여 그 과정을 자세히 보여주고 있습니다. 역시 학습 데이터를 만드는게 쉽지 않은 것 같습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
게리 마커스, 지식그래프와 딥러닝을 결합한 하이브리드 모델 제안 깊은바다 2020-12-13 987
현대차, 美 보스턴다이내믹스 인수한다 깊은바다 2020-12-10 256
언택트 시대의 ‘디지털 직원’, 챗봇+RPA 깊은바다 2020-12-06 183
국내 게임사들, 왜 AI로 향하나 깊은바다 2020-12-05 144
챗봇과 인문학 깊은바다 2020-12-04 129
How GPUs Ate Up The World: 병렬 컴퓨팅과 딥러닝의 급부상에 대한 단상 깊은바다 2020-12-02 186
AI 스피커는 어떻게 인간 언어를 이해할까 깊은바다 2020-12-02 172
韓 SW업계, '챗봇' 수요 증가에도 '인력 부족' 고심 깊은바다 2020-11-30 174
인지 과학자 AI 의식 열린 가능성 인정 깊은바다 2020-11-30 85
플랫폼과 로봇에 갇힌 21세기 중국의 전태일들 깊은바다 2020-11-30 150
친구처럼 소통하는 'AI 인플루언서' 나온다 깊은바다 2020-11-22 196
유초중고 인공지능 교육 도입…내년 2학기 고교 진로선택 과목 개설 깊은바다 2020-11-20 1004
AI 도입한 기업들, 실효성 떨어져 속앓이 깊은바다 2020-11-19 183
롯데쇼핑 실험작 '보이스 커머스' AI스피커 사업 대폭 축소 깊은바다 2020-11-16 177
교황 11월 기도지향, 왜 인공지능인가? 깊은바다 2020-11-14 151