인공지능 학습 데이터 구축에 필요한 ‘데이터 라벨링’이란?

데이터 라벨링이란 이미지, 영상, 텍스트 등의 데이터에 사람이 데이터 가공 도구를 활용하여 인공지능이 학습할 수 있도록 다양한 정보를 목적에 맞게 입력하는 것을 의미합니다.

데이터 라벨링 예시

먼저, 사진 이미지 상의 사물에 대한 객체인식 데이터 라벨링 예시를 들어 보겠습니다.

인공지능이 학습할 수 있도록 만드는 데이터 라벨링을 위해서는, 데이터 이미지 위에 사람 또는 자동차 등의 객체의 위치를 표시할 수 있는 박스를 그리고, 해당 박스가 사람인지 자동차인지 분류하기 위해 주석을 다는 작업이 필요합니다.

아래의 이미지로 쉽게 이해하실 수 있습니다. 자동차에 박스를 그리고 ‘자동차’로 표시를 해 주는 것이 데이터 라벨링입니다.

[블랙올리브] Bounding Box 데이터 라벨링 작업 예시

데이터 라벨링을 위한 도구

위와 같이 데이터 라벨링을 효과적으로 하기 위해 가장 좋은 방법은 학습 데이터에 맞게 라벨링 기능을 가진 도구를 활용하는 것 입니다.

데이터 라벨링이 쉬워 보일 수도 있지만, 데이터 입력 기준에 맞춰 라벨링을 진행해야 하기 때문에 집중력과 섬세함이 요구됩니다. 인공지능을 학습시키기 위해서는 정확한 데이터가 필요하며 잘못된 학습 데이터는 인공지능을 망치는 데이터가 될 수 있기 때문입니다.

인공지능 학습을 위한 데이터 형식은 이미지, 영상, 소리, 문서 등과 같이 다양합니다. 데이터 라벨러는 각 데이터 형식에 맞는 도구의 기능과 가이드를 따라 양질의 데이터 라벨링 작업을 할 수 있습니다.

무엇보다, 사용자 입장에서 쉽고 빠르게 활용할 수 있는 도구를 활용하면 다양한 형식의 데이터를 고객이 요청하는 파일 형식으로 빠르게 생성할 수 있습니다.

블랙올리브 주요 기능

현재 테스트웍스의 데이터 가공 도구인 블랙올리브에서 제공하는 라벨링 기능은 아래와 같이 8가지가 있습니다.

1. Bounding Box – 물체를 직사각형 모양의 박스 안에 포함되도록 그리는 라벨링 방법으로 데이터 라벨링 작업에서 가장 일반적으로 사용됩니다.

2. Polygon – 다각형 모양으로 객체의 가시 영역 외곽선을 따라 점을 찍어 그리는 라벨링 방법입니다. 개체 이외의 포함된 빈공간으로 인해 발생할 수 있는 오류에 대응할 수 있는 기능입니다.

3. Polyline – 여러 개의 점을 가진 선을 활용하여 특정 영역을 라벨링 함으로써 인도, 차선 등을 구분하기 위해 사용됩니다.

4. Point – 특정 지점을 라벨링 하는 작업으로 안면 인식을 통한 감정 분석과 같이 정밀하고 섬세한 작업을 요구하는 기술입니다.

5. Cuboid – 2D로 작업할 수 없는 3D 객체들을 정육면체로 생성하는 라벨링 형태입니다.

6. Body – 전체적인 모션 캡쳐나 이상행동 등 사람의 움직임을 검출할 필요가 있는 경우 몸에 객체를 생성하는 방식입니다.

7. Face – 얼굴의 특징점을 검출할 필요가 있는 경우 얼굴에 객체를 생성하는 방식입니다.

8. Hands – 수어 등의 손의 움직임을 파악하기 위해 손의 마디를 검출할 필요가 있는 경우 사용합니다.

크라우드-소싱 방식의 데이터 수집 가공 프로젝트

테스트웍스는 크라우드 소싱 방식의 aiworks 플랫폼을 통해 데이터 수집 및 가공 프로젝트를 오픈하고 있습니다. 온라인 알바 및 디지털 신생 일거리로 핫한 데이터 라벨링, 누구나 언제 어디서나 aiworks 플랫폼 상에서 이미지 영상 음성 데이터 수집 부터 데이터 라벨링 작업까지 원하는 시간에 참여할 수 있습니다.

크라우드 소싱 데이터 수집 가공 플랫폼

또한 실무와 연계된 인공지능 데이터 전문가 양성 교육 이수자는 인공지능 데이터 전문 가공 도구인 blackolive를 활용하여 난이도별 다양한 데이터 라벨링 프로젝트에 참여하여 수익을 얻을 수 있습니다.

누구나 전문 라벨러 및 검수자로 새로운 경력을 쌓을 수 있습니다.

시간이나 장소에 상관없이 온라인으로 작업 가능한 전문 데이터 라벨러에 도전해 보세요!

▶ [인공지능 따라잡기] 3강 인공지능 학습 데이터 만들기

인공지능과 데이터, 더 쉽고 재미있게 테스트웍스와 함께 알아가는 AI & Data 이야기

▶ 데이터 라벨러의 시작, 맞춤형 교육 aiworks academy

▶ 데이터 라벨링 도구 블랙올리브 체험하기