레플리
글 수 497


 

https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=102&oid=005&aid=0001369774

 

 

 

"실습 훈련 나흘째였던 9월 14일, 11장짜리 과학 논문을 데이터로 편집하는 동안 띄어쓰기 오류 194개를 발견했다. PDF 형태의 논문을 HTML 데이터로 바꾸는 과정에서 피할 수 없는 일이었다. 교육시간에 강사는 “데이터에 오탈자가 있으면 AI가 올바르게 학습할 수 없다”고 말했다. AI의 작동을 위해 잘못된 띄어쓰기를 일일이 이어붙이는 게 기자와 같은 ‘데이터 구축자’의 일이었다."

 

디지털 뉴딜 사업의 일환으로 KISTI에서 데이터 구축 업무를 진행 중입니다. 기자가 직접 참여를 하여 그 과정을 자세히 보여주고 있습니다. 역시 학습 데이터를 만드는게 쉽지 않은 것 같습니다.

 

엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
NYT, OpenAI에 뉴스 저작권 소송 file 깊은바다 2024-01-02 156
생성AI 국가별 관심도 순위 file [1] 깊은바다 2023-12-14 174
스캐터랩 F 같은 이루다, T 같은 챗GPT와 다른 근본적인 이유는 깊은바다 2023-11-20 152
스택 오버플로, ChatGPT 때문에 전체 직원의 28% 감원 file [1] 깊은바다 2023-10-17 201
메타, 자사의 SNS에 AI 챗봇 도입 예정 깊은바다 2023-08-02 135
구글 어시스턴트, 생성 AI 기반으로 바뀐다 깊은바다 2023-08-01 167
AI 가정교사 온다, 美사교육기업 초토화 깊은바다 2023-05-10 178
오픈AI, 130조 투자 유치하겠다... 생성AI 돈 싸움 시작되나 깊은바다 2023-05-07 211
마이크로소프트 빙 일일 사용자 1억명 돌파 깊은바다 2023-03-16 149
챗GPT 자소서, 삼성은 신경 껐다 깊은바다 2023-03-05 301
스타트업도 챗GPT 열풍…발빠른 도입 이어져 깊은바다 2023-02-23 200
로블록스, 게임제작에 생성AI 도입 예정 깊은바다 2023-02-19 145
빌 게이츠 '챗GPT 같은 AI, PC·인터넷 만큼 영향줄 것' 깊은바다 2023-02-05 208
버즈피드, 챗GPT로 맞춤형 콘텐츠·퀴즈 만든다 깊은바다 2023-01-27 161
카카오브레인 김일두 대표 'AI, 결국 모두의 비서 될 것' 깊은바다 2023-01-25 211