[blackolive] 데이터 분포 시각화 업데이트

blackolive의 데이터 분석과 관련된 업데이트 기능을 소개합니다.

📌데이터 분포 시각화 업데이트

AI 모델 학습 과정 중에는 데이터 분석 단계가 필요합니다. 특히 데이터가 고르게 분포되어 있는지 확인 및 파악하는 것이 중요한 과정에 포함됩니다. blackolive에서는 scatter plot 그래프의 형태로 데이터 분포도를 시각화하여 제공하고 있습니다.


1. 데이터 라벨 분포도 시각화

blackolive는 라벨링 된 데이터들의 시각적 특징의 유사도에 따른 분포를 직관적으로 확인할 수 있게 제공합니다.

1. Plot 생성 : 작업 완료된 라벨링 데이터의 라벨과 이슈의 분포도를 분석한 데이터 셋을 생성
2. Similarity 탭 : 라벨의 분포도를 scatter plot(산점도) 그래프로 시각화

  • 포인트 선택
  • 포인트 라벨 확인 (선택한 포인트의 정보 확인)
    • task id
    • frame
    • label
    • image
<그림 1 : 데이터 라벨 분포도 차트 화면>


💡Tip : 각 클래스의 데이터가 군집을 이루어 밀집되어 있을수록, 모델 학습 시 높은 성능의 예측 모델을 구축할 수 있습니다.

<그림 2 : 클래스 별 군집 분포도>




2. 데이터 이슈 분포도 시각화

데이터 라벨링 작업 시 이미지 자체의 퀄리티도 매우 중요합니다. 이를 위해 이미지에 대한 퀄리티 이슈(너무 밝거나 어두운 이미지 또는 중복 이미지 등)를 파악하기 위해서는, 이미지를 개별로 확인하는 작업이 필요합니다. 하지만 blackolive에서는 이러한 이슈를 하나의 화면에서 확인할 수 있습니다.

1. Issue 탭 : 이미지(frame)의 이슈를 보여줍니다.

  • 이슈 타입 : 해당 이슈 타입이 존재하는 이미지 개수 표기
  • 이슈 이미지 : 이슈가 존재하는 이미지의 정보 확인
<그림 3 : 이미지 이슈 분포도 화면>

🌍 테스트웍스는 인공지능 데이터 및 소프트웨어 검증 솔루션 전문기업으로,
인공지능 개발 및 상용화의 전 과정에서 고객 맞춤형 솔루션을 제공합니다.

blackolive를 직접 경험해 보세요!