글 수 342


 

https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=102&oid=005&aid=0001369774

 

 

 

"실습 훈련 나흘째였던 9월 14일, 11장짜리 과학 논문을 데이터로 편집하는 동안 띄어쓰기 오류 194개를 발견했다. PDF 형태의 논문을 HTML 데이터로 바꾸는 과정에서 피할 수 없는 일이었다. 교육시간에 강사는 “데이터에 오탈자가 있으면 AI가 올바르게 학습할 수 없다”고 말했다. AI의 작동을 위해 잘못된 띄어쓰기를 일일이 이어붙이는 게 기자와 같은 ‘데이터 구축자’의 일이었다."

 

디지털 뉴딜 사업의 일환으로 KISTI에서 데이터 구축 업무를 진행 중입니다. 기자가 직접 참여를 하여 그 과정을 자세히 보여주고 있습니다. 역시 학습 데이터를 만드는게 쉽지 않은 것 같습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
드라마 '스타트업'에 중요한 역할로 등장한 AI 스피커 깊은바다 2020-10-21 25
MS, '자동 이미지 캡션' 고도화 - Seeing AI 깊은바다 2020-10-19 35
애플, 스마트홈 시장 노린 스피커 '홈팟 미니' 공개 깊은바다 2020-10-15 32
'내가 로봇의 비서라니…' 인간 노동이 일구는 AI 깊은바다 2020-10-14 37
SK텔레콤, 'T전화' AI 접목시킨 'T전화x누구' 서비스 선봬 깊은바다 2020-10-13 42
AI챗봇 일상의 시대, 진화의 끝은? 깊은바다 2020-10-10 75
모든 단과대에 'AI 융합과목'…숭실대 AI 비전선포식 개최 깊은바다 2020-10-07 55
소비자 삶으로 들어온 LG 로봇…추격 속도내는 삼성 깊은바다 2020-10-06 62
AI 챗봇 아직은 일렀나… 유통업계 챗봇 서비스 속속 종료 깊은바다 2020-10-03 117
일론 머스크, MS GPT-3 독점 라이선스 계약 비판 깊은바다 2020-10-02 73
인공지능 챗봇 '토닥이', 공황장애 치료에 효과적 깊은바다 2020-09-28 88
야생 동물의 침입을 탐지하는 객체검출 카메라 깊은바다 2020-09-27 62
2020년 국내 AI스피커 판매량 46% 상승 깊은바다 2020-09-26 63
카카오, 음성인식 컨트롤러 '미니링크' 출시…'내 손안의 AI 친구' 깊은바다 2020-09-24 51
KT, 어린이·어르신 위한 AI 반려로봇 선보인다 깊은바다 2020-09-22 58