귀사의 인공지능 도입 현황은 어떻습니까?

스마트테크 코리아 2022

인공지능 학습용 데이터의 선두주자인 테스트웍스는 그간의 노하우로 고도화된 제품군과 활용 사례를 선보이고, 다양한 산업 군의 시장 동향을 알아보기 위해 스마트테크 코리아 2022의 주요 행사인 ‘인공지능&빅데이터쇼’에 참가했습니다.

이번에 11회를 맞은 ‘스마트테크 코리아’는 ‘미래를 연결하다(Connect the Future)’라는 주제로, ▲스마트테크쇼(SMART TECH SHOW) ▲인공지능&빅데이터쇼(AI&BIG DATA SHOW) ▲디지털 유통대전쇼(RETAIL TECH SHOW) ▲메타버스쇼(METAVERS SHOW) ▲로보테크쇼(ROBOT TECH SHOW) 분야로 구성 되어 다양한 산업에서 약220여개 기업 700 부스 규모로 약 4만 여명이 방문했다고 밝혔습니다.

이번 행사를 통해 테스트웍스를 비롯한 인공지능 솔루션 기업 및 제조현장의 스마트 로봇 도입, 센서 기술, 유통 현장의 스마트 물류, 스마트 데일리 라이프 체험관 등 다양한 스마트 기술 시연을 체험해 볼 수 있었습니다.



테스트웍스 전시 부스

테스트웍스는 최신 인공지능 데이터 구축 사례를 통해 학습 데이터 트렌드 및 기술을 조망하는 전시 부스를 운영했습니다. 최근 ‘Data-Centric AI’가 대세인 가운데, 인공지능 상용화의 핵심인 데이터 품질 확보를 위한 데이터 수집 가공 품질 검증의 원스탑 솔루션 데모와 활용 사례를 함께 선보였습니다. 특히, 3D Point Cloud/LiDAR 데이터를 위한 Muti-Sensor Calibration 기술의 실시간 데이터 수집 현황 데모 시연으로 관람객들의 눈길을 끌었습니다.



스마트테크 관람 기업의 인공지능 도입 및 학습 데이터 현황

테스트웍스는 스마트테크 코리아가 다양한 산업 내 많은 기업들이 참여하는 만큼 시장 동향 파악을 위해 인공지능 도입과 관련된 설문조사 이벤트를 진행했습니다. 설문조사 결과 전시 기간인 3일 동안 약 900여명이 참여해 폭넓은 인사이트를 확인할 수 있었습니다.

전체 설문조사 응답자 기준으로 보면, 대기업/중견기업/중소기업/공공기관을 포함해 399개 기업이 참여했으나, 그 중 인공지능 서비스를 활용하고 있거나 도입하고자 하는 지에 대해서는 245개 기업의 458명이 그렇다고 답변했습니다. 따라서 이번 블로그 글에서는 인공지능 서비스를 도입 및 고려하고 있다고 답변한 458개 대상자를 기준으로 도출된 결과를 공유해 드립니다.


전체 응답자 수 : 841명 (소속 기업 및 기관 등 명시 응답자 기준. 대기업 및 중견기업 22%, 중소기업 55%, 공공 12%, 대학 3%, 기타 7%)

이번 설문조사는 주요 10개 질문을 통해 인공지능의 활용 단계, 인공지능 서비스에 대한 기대, 데이터 수집/가공 서비스에 대한 협업 니즈, 데이터 수집/가공 서비스의 주요 요소를 확인할 수 있었습니다.

[AI 도입, 관심 분야는?]

전체 응답자 수 : 458명 (대기업 및 중견기업 27%, 중소기업 55%, 공공 13%, 대학 2%, 기타 4%) 이하 생략

이번 설문조사에 응답자들이 가장 관심을 보여준 분야는 메타버스 26%로 1위, 스마트 팩토리가 19%로 2위였습니다. 복수 답변을 고려한다 해도 관심 분야를 보면 스마트테크 코리아에 참가한 기업의 성격이 드러납니다. 특히, 유통/리테일의 스마트 물류, 로봇 팔과 같은 산업 현장의 기술 활용을 보여준 스마트테크 코리아의 성격을 보여줬습니다.

[AI의 활용 단계는?]

(복수 답변 가능)

인공지능의 도입은 기획단계가 72%로 가장 많았고, 신성장 동력으로 고려됨 36%, 신규 사업의 일환으로 고려됨이 31%로 인공지능의 활용 단계와 함께 인공지능 활용 사업에 대한 시장의 기대를 확인할 수 있었습니다.

[인공지능 개발을 위해 어떤 서비스를 가장 필요로 할까?]

인공지능 서비스 개발을 위해 외부와 협력하고자 하는 서비스는 데이터 수집과 라벨링이 가장 많았습니다. 또 응답자중 84%가 인공지능 학습용 데이터를 수집/가공할 계획이 있다고 답변했습니다. 학습용 데이터의 중요성이 대두 되고 있는 ‘Data-Centric AI’의 트렌드를 보여주는 조사 결과였습니다. 인공지능 모델개발을 위해 유사한 데이터에 대하여 71%의 응답자가 구매의사가 있다고 답하였습니다. 테스트웍스는 기존 구축한 데이터셋을 기존 고객사와 합의하여, 신규 고객에게 재 판매하는 협업도 진행하고 있습니다. 이 때 개인정보, 민감정보가 포함된 데이터셋의 구축 경험으로 비식별화 노하우와 기술력이 활용됩니다. 기존 레퍼런스를 활용할 수 있는 점은 풍부한 데이터 가공 수행 경험을 갖고 있는 테스트웍스와 협업하는 장점이기도 합니다.

협력 기업으로 선호하는 기업은 일부 서비스를 전문적으로 제공하는 기업이 34%, 전체 서비스를 제공하는 기업이 47%로 ‘One-Stop Solution’에 대한 니즈를 확인할 수 있었습니다. 테스트웍스는 커스터마이즈 된 데이터의 수집 가공 서비스와 함께 모델링 서비스 또한 제공하고 있습니다.

모델 개발 서비스는 수집 가공된 데이터의 품질을 검증하면서, 모델 자체로 활용될 수 있고, 고객사에서 개발하는 모델의 사전 학습 모델로 기능할 수 있는 활용도 높은 서비스입니다.

[3D 데이터의 활용 증대]

이번 조사에서는 활용하는 학습용 데이터의 유형이 다양해지고 있는 것을 확인할 수 있었습니다. 테스트웍스는 이런 3D데이터에 대한 수요에 맞춰 멀티센서 캘리브레이션 기술을 적용하여 3대의 LiDAR 장비에서 수집된 데이터를 한 번에 라벨링 하는 기술과 저작 도구를 개발하였습니다. 또 3D데이터에 대한 Depth 추정 연구 및 Edge 장비 활용 수집 체계 구축 연구도 함께 하고 있는데요, 이번 설문에서도 이런 특수 데이터에 대한 관심이 늘어난 것을 확인할 수 있었습니다.

영상 데이터에 대한 관심도 확인할 수 있었습니다. 유튜브나 OTT산업의 성장으로 나타나듯 영상 콘텐츠의 지위가 확장되고 있기도 하고, 스마트 관제, 스마트 팩토리, 스마트 CCTV의 확장과 고도화로 영상으로 수집되는 데이터에 대한 활용도 늘어나고 있습니다. 특히 관제용 영상 촬영의 경우 중요한 장면을 놓치지 않으면서, 반복되는 장면을 어떻게 줄이는지가 관심사인데요. 테스트웍스는 피처(Feature) 추출과 같은 기법을 적용하기도 하고, 최적의 프레임을 분석하여 데이터 품질의 최전방에 있다는 사명감으로 직접 샘플링 하며 중요한 정보를 최대한 살리는 중복제거(Deduplication) 작업을 수행합니다.

[데이터 수집/가공 서비스 사용해봤더니?]

데이터 수집/가공 서비스에 대한 만족도 조사를 통해 데이터 수집/가공 서비스에서 중요하게 여겨지는 요소를 함께 알아보았습니다. 외부로부터 데이터 수집 가공 서비스를 이용한 응답자 중 만족했다고 응답한 비율은 59%였습니다. 평가 항목 중 단연 두드러진 것은 ‘가격’으로 만족의 원인에서도, 불만족의 원인에서도 각각 49%, 50%로 가장 주된 요소로 선택되었습니다. 데이터의 다양성과 품질은 가격 다음으로 많은 응답을 받았고, ‘라벨링 자동화’는 5%로 응답을 받아 데이터 수집가공 서비스의 주요 요소로 여겨지지는 않고 있었습니다.

데이터의 품질을 지키면서도 합리적인 가격을 만들기 위하여 테스트웍스는, ‘라벨링 자동화’를 비롯하여 ‘작업자 훈련’, 자체 저작도구의 최적화로 작업자 생산성 향상 등 다양한 관점에서 문제를 해결하고 있습니다.

결론

테스트웍스는 이번 설문조사를 통해 확인한 바와 같이, 이제 막 도입되고 있는 인공지능 개발의 활성화 및 성능 향상을 위한 품질 높은 데이터 양산에 기여하기 위해 지속적으로 협업 및 연구 개발을 하고 있습니다.

여러 보고서와 사례에 따르면 인공지능 개발 비용의 약 80%가 데이터 전처리 과정에 소요됩니다. 전체 비용에서 비중이 큰 것과 더불어, 약 30%가량의 효과적인 데이터를 선별하여 전체 데이터를 활용한 것과 동일 성능에 도달하는 Active learning 연구 사례들도 있습니다. 이런 점을 생각해 보면 소프트웨어 개발에서 원료 품질이라고 부르는 ‘데이터’의 품질이 굉장히 중요하다는 의미로 볼 수 있습니다. 여기서 비용을 가장 아낄 수 있는 부분은 바로 데이터가 아닐까요. 일관되게 품질 좋은 데이터를 지속적으로 학습시킬 수 있다면 제품 개발 시 발생할 수 있는 실패 비용을 최소화 시키고 더 빠르게 상용화에 성공할 수 있습니다. 다시 말하면, 파이프라인의 앞 단계에서 좋은 품질의 데이터를 확보하는 것이 시간과 비용을 가장 효과적으로 절감할 수 있는 방법입니다.

인공지능 개발 및 서비스 상용화에 성공하기 위해 데이터 전처리의 전 과정을 단일 기업이 혼자서 하기는 어려운 게 현실입니다. 경험 많고 믿을 만한 파트너를 확보하는 것도 중요합니다. 테스트웍스는 인공지능 분야의 전문인력과 최신 기술을 통해 고객이 개발하고자 하는 비즈니스 환경에 최적화된 맞춤형 서비스를 제공하며, 고객의 인공지능 서비스 상용화를 지원합니다.