경북도가 현재의 한글과 모양이 다른 옛한글을 식별할 수 있는 인공지능 학습용 데이터를 구축하는 사업을 벌인다.27일 경북도에 따르면 과학기술정보통신부와 한국지능정보사회진흥원이 추진하는 ‘2021년 인공지능 학습용 데이터 구축 지원사업’에 도가 제출한 ‘옛한글 문자인식(OCR) 데이터셋 구축사업’이 신규 대상사업으로 선정돼 국비 19억원을 확보했다.이번 국비 확보는 지난 3~4월 공고 기간 중 한국지능정보사회진흥원에 접수된 84개 사업을 대상으로 사업계획서, 프레젠테이션, 질의응답 등의 과정을 거쳐 지난 24일 최종 확정됐다.‘옛한글 문자인식(OCR) 데이터셋 구축사업’은 올해말까지 21억원(국비 19억, 도비 2억원)을 투입해 경북도내 1000만개 이상의 옛한글 자료를 학습시켜 획, 크기, 형태가 모두 다른 옛한글을 식별해낼 수 있는 AI(인공지능)학습용 데이터를 구축하고자 추진된다.이를 위해 경북도와 안동대를 거점으로 포스텍, 한국국학진흥원, ㈜인플랫 등 5개 기관이 컨소시엄을 구성했다.경북도는 사업진행 전반을 관리하며 안동대는 총괄 품질관리 및 검수와 다양한 옛 한글 이미지 분석, 포스텍은 원천데이터 의미태깅 도구 개발과 딥러닝 기반 기술 개발, 국학진흥원은 옛한글 자료 수집과 제공, ㈜인플랫은 옛한글 이미지와 텍스트 구축 및 원시 데이터 정제도구 개발에 나서게 된다.경북도는 이 사업으로 한글 고서적 자료를 체계적으로 정리해 옛한글의 문화가치 연구와 활용 서비스를 전국으로 빠르게 확산시킬 수 있을 것으로 보고 있다.
주메뉴 바로가기 본문 바로가기