‘인도 보행 영상’ 데이터셋 구축 사례

한국정보화진흥원(NIA)의 “2019 인공지능 학습용 데이터셋 구축 사업” 공모의 “인도 보행 영상 과제” 주관 기업으로 데이터 셋을 구축한 사례를 소개합니다.

<2019년 ‘인도 보행 영상’ 데이터셋 구축 주관 기업 – 테스트웍스>

인도 보행 영상 데이터셋 구축 사업

인도 보행 영상 데이터셋 구축사업은 장애인 보행에 위협 요소인 각종 장애물(자동차, 사람, 가로등, 가로수 등)과 파손 등으로 위험한 보행 노면에 대한 데이터셋을 구축하는 사업으로, 장애인의 이동권 신장을 위한 인공지능 서비스 개발의 기반을 구축한 사업입니다.

본 사업으로 구축된 인도 보행 영상 데이터셋은 기존 자율주행차량 데이터셋과 달리 국내 현실에 맞는 인도를 중심으로 구축한 데이터셋이며, 주체 및 규모면에서 국/내외 유례가 없다는 점에서 국내 공개 데이터셋의 독창성과 다양성 확보에 기여를 했습니다.

인공지능 생태계 형성 및 사회적 가치 창출

테스트웍스는 국내 최초로 국내 환경에 맞는 인도 보행 영상 데이터셋을 구축하여, 기술을 통한 장애인 이동권 문제를 해결하는 토대를 마련하였습니다. 그리고 구축한 데이터셋을 공개하여, 자본과 자원이 부족한 중소기업 및 스타트업이 데이터 수집과 가공에 들어가는 비용을 줄임으로써, 관련한 인공지능 기술 생태계를 조성하는데 일조하였습니다.

또한 대규모 데이터셋을 구축하는 과정에서 척수장애인협회와 연계하여 기술의 수혜자가 직접 기술 개발에 참여하였으며, 경력단절여성, 발달장애인, 청년 등 취업취약계층 고용도 함께 수행하였습니다. 이를 통해, 테스트웍스는 취업취약계층에게 4차 산업혁명 시대의 노동환경 변화에 능동적으로 대응하는 새로운 고용모델을 제시하였습니다.

인도 보행 영상 데이터셋 구축 사업 = 단기간 + 대규모 + 고품질

<인도 보행 영상 데이터엣 구축 사업 성과 및 달성 지표>

테스트웍스는 인도 보행 영상 데이터셋 구축 사업을 통해 6개월 동안 56명의 신규 인력을 투입하였습니다. 발달장애훈련센터, 동부여성인력센터, 은평여성인력센터 등과 연계를 통해 단기간에 인력을 확보할 수 있었습니다. 또한 체계적인 데이터 가공 및 관리자 교육을 통해 신규 인력에게 빠르게 데이터 가공의 전문성을 향상시켜 데이터의 품질을 확보하였습니다.

‘자동 + 수동’ 패키지 가공과 3단계 검수로 효율적인 데이터셋 구축

테스트웍스는 자체 개발한 자동화 및 작업자 친화적인 웹 기반 가공 도구와 Peer Review-Manager Review-Final Audit의 3단계 검수프로세스를 통해 데이터 가공 작업을 수행하여 120개 체크리스트를 활용한 제3자 검증에서 모든 해당 항목 all Pass 평가를 받는 대규모 고품질 데이터셋을 구축하였습니다.

테스트웍스의 크라우드 소싱 플랫폼 aiworks와 데이터 가공 관리 플랫폼 blackolive

인도 보행 영상 데이터셋 활용 서비스

구축된 데이터셋은 시각장애인 보행 위험 알림 서비스, 휠체어 사용자를 위한 안전경로 안내 서비스 등 장애인 보행권 확보를 위한 공익성 높은 AI 서비스 개발 뿐만 아니라 노면 안정성 모니터링 서비스, 음식 배달 서비스를 위한 한국형 딜리버리 로봇 등 다양한 서비스 개발에 활용됩니다.

<인도 보행 영상 AI 데이터셋으로 활용 가능한 서비스 예시> 

참여기관의 시범 서비스

인도 보행 영상 데이터셋 구축사업의 참여기관인 카이스트 RCV Lab은 높은 성능의 인도 보행 환경에서의 객체/거리 인식 인공지능 모델을 개발하였고, 셀렉트스타 김윤기 학생은 보행 가능 구역 인식 모델 프로타입, 디투리소스는 노면 안전성 시스템 시범 서비스를 개발하였습니다.

<참여 기관 AI 모델 시범 서비스>

테스트웍스 시범서비스 – 딥러닝 기반 보행 보조 시스템

테스트웍스는 인도 보행 영상 데이터셋을 활용하여, 전방 객체, 노면 상태, 주변 보행 방해 장애물 등의 인식 정보를 딥러닝을 기반으로 스마트폰 어플을 통해 안내하는 보행 보조 시스템을 시범 서비스로 개발하였습니다. 이는 NIA 인공지능 학습용 데이터 활용 우수 사례로 선정되었습니다.

<보행시스템 구성>

<출처: 한국정보화진흥원(NIA) 인공지능 학습용 데이터 활용 우수 사례>

위 시범 서비스는 한국정보화진흥원(NIA)의 인공지능 학습용 데이터 활용 우수 사례로 선정되었습니다.

테스트웍스는 기술 기반의 성장과 함께 사회적 가치 창출을 위해 지속적으로 고민하며 사회 문제 해결에 기여하고자 합니다.