테스트웍스가 과학기술정보통신부가 주관하고, 한국지능정보사회진흥원(NIA)이 추진하는 ‘인공지능 학습용 데이터 구축 사업’의 지정공모과제 중 ‘재난안전정보 수어 영상 데이터’ 구축 사업의 주관기업으로 선정되었습니다.
‘인공지능 학습용 데이터 구축 사업’은 민간에서 활용도가 높은 인공지능 학습용 데이터를 구축-개방-활용하여 국가 산업 사회 전반에 지능화 혁신을 촉진하고, 인공지능 학습용 데이터 수집, 정제, 가공, 검증 등에 대규모 일자리 창출을 극대화하는 것을 목적으로 하는 디지털 뉴딜 ‘데이터 댐’의 핵심 사업입니다.
테스트웍스는 지난 해 ‘인공지능 학습용 데이터 구축 사업’ 중 ‘수어 영상 데이터’ 구축 사업의 주관기업으로서 수어 영상 데이터 생성, 가공, 시범 서비스까지 경험을 쌓아왔으며, 수어 키포인트 추출 및 형태소 가공에 우수한 기술력을 보유하고 있습니다.
올해는 ‘재난안전정보 수어 영상 데이터’ 구축 사업의 주관기업으로 선정되어, 다년간 쌓아온 데이터 구축 경험 및 기술력을 바탕으로 재난안전정보를 수어로 번역해 주는 인공지능 서비스 개발을 위한 ‘재난안전정보 수어 영상 데이터셋’을 구축하게 됩니다.
테스트웍스는 주관기업으로 전체 사업을 관리하며, 자사 스튜디오를 활용해 수어 영상데이터를 직접 촬영 방식으로 수집하고, 자사의 데이터 수집 가공 플랫폼 aiworks와 데이터 가공 관리 솔루션 blackolive를 활용하여 데이터 수집, 데이터 라벨링, 데이터 검증 및 개선 업무를 수행합니다.
본 사업 수행을 위해 테스트웍스는 국내 대표 수어 교육 및 연구기관인 강남대학교와 인공지능 기반 수어 아바타 모델 솔루션을 보유하고 있는 ㈜이큐포올과 컨소시엄을 구성했습니다. 본 사업을 통해 강남대학교와 함께 수어에 대한 전문성을 기반으로 수어 및 언어학적 측면에서 데이터를 분석하고 설계하며, 재난정보 문자를 한국수어로 표현한 영상을 촬영하고, 수집된 영상 데이터를 가공하고 검수합니다. ㈜이큐포올은 구축된 데이터셋을 활용해 재난정보 문자를 한국수어로 변환하는 모델과 실증서비스를 개발할 예정입니다.
농인(청각장애를 가진 사람으로서 농문화 속에서 한국수어를 일상어로 사용하는 사람)들은 사회 전반에 걸친 청인 중심의 정보 전달 체계로 인해 일상생활, 경제활동, 긴급상황 등 거의 모든 분야에 걸쳐 다양한 고충을 겪으며 제한을 겪고 있습니다. 특히, 재해와 재난 상황 등에서 자유롭지 않은 정보 접근으로 인해 경제적 피해, 심각한 위험 및 차별에 노출 빈도 및 확률이 청인에 비해 더욱 높습니다.
이번 재난안전정보 수어 영상 데이터 구축을 통해 한국어와 한국수어의 차이로 코로나19 상황 속 긴급재난문자와 안내 문자 재난안전정보 획득에 어려움을 겪었던 농인들에게 수어를 통한 번역 서비스를 제공하여 차별 없는 소통이 이루어지기를 기대합니다.