레플리
글 수 497


 

https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=102&oid=005&aid=0001369774

 

 

 

"실습 훈련 나흘째였던 9월 14일, 11장짜리 과학 논문을 데이터로 편집하는 동안 띄어쓰기 오류 194개를 발견했다. PDF 형태의 논문을 HTML 데이터로 바꾸는 과정에서 피할 수 없는 일이었다. 교육시간에 강사는 “데이터에 오탈자가 있으면 AI가 올바르게 학습할 수 없다”고 말했다. AI의 작동을 위해 잘못된 띄어쓰기를 일일이 이어붙이는 게 기자와 같은 ‘데이터 구축자’의 일이었다."

 

디지털 뉴딜 사업의 일환으로 KISTI에서 데이터 구축 업무를 진행 중입니다. 기자가 직접 참여를 하여 그 과정을 자세히 보여주고 있습니다. 역시 학습 데이터를 만드는게 쉽지 않은 것 같습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수sort
'가장 높은 금리 적금 알려줘'...5개 은행 챗봇 답은? 깊은바다 2019-11-17 470
감성대화 챗봇 '심심이', AI 응용 실시간 악플 99% 탐지 깊은바다 2019-10-27 469
딥마인드 2019년 7000억 적자 깊은바다 2020-12-22 467
넷플릭스 최대 경쟁자는 여기다, Z세대가 열광하는 메타버스 깊은바다 2021-02-19 453
ChatGPT에게 물어보는 걸 당연하게 여기는 AI 네이티브 세대 깊은바다 2023-01-04 445
왜 통신·전자·배달 모두 ‘서빙로봇’에 투자할까 깊은바다 2021-07-06 442
김일성大, AI·얼굴인식·지문스캔 제품개발…해외 밀수출 깊은바다 2019-11-11 433
감에 의지했던 공정, AI한테 맡겼더니 불량률 32→5%로 뚝 깊은바다 2020-12-15 430
인공지능, 머신러닝, 딥러닝의 차이는 깊은바다 2021-06-28 429
인공지능이 만든 가짜뉴스는 인공지능이 더 잘 알아 깊은바다 2019-07-30 424
세계적 인공지능 석학, AI의 편향을 말하다 깊은바다 2021-12-04 421
인간 뇌세포가 인공지능보다 컴퓨터게임 빨리 배웠다 깊은바다 2021-12-21 418
크래프톤, 인터랙티브 콘텐츠 제작사 ‘띵스플로우’ 인수 깊은바다 2021-06-29 418
文대통령, 인공지능은 인류 동반자...연내 '국가전략' 발표 깊은바다 2019-10-28 417
상담원의 대화 기록을 자동으로 분석하는 챗봇 툴 - Pathfinder 깊은바다 2019-02-14 417