WHY – 메타버스 알아가기 step 2

박윤정

일전에는 메타버스(Metaverse)를 이해하기 위한 가상현실(VR)/증강현실(AR)/융합현실(MR)에 대한 기술과 메타버스의 일반적인 개념에 대해 알아 보았습니다. 메타버스는 가상과 현실에 대한 정보를 모두 담을 수 있고 가상 콘텐츠/정보/객체와도 상호작용할 수 있는 하나의 세계였습니다. 그렇다면 메타버스 관련 주, 메타버스 관련 기술 투자 등 한국 뿐 아니라 전세계적으로 왜 메타버스가 이렇게 큰 관심을 받는 걸까요?

메타버스의 구성 요소는 크게 세가지로 볼 수 있습니다. 첫째, 현실 세계와 연동되는 가상 환경이 존재하며, 둘째, 가상 객체 및 콘텐츠와 실시간으로 상호작용 가능하며, 셋째, 경제 활동도 하고 문화 생활을 즐기는 시티즌이 있어야 합니다.

즉, 메타버스는 가상 아바타를 통해서 사용자가 실제로 소비도 하고 여가 생활을 즐기기 위한 세컨드 라이프(Second life)를 누리는 하나의 세계입니다. 이러한 구성 요소들이 충족되는 플랫폼 및 서비스는 로블록스, 네이버의 제페토가 대표적입니다.

[그림2] 로블록스

로블록스와 제페토에서는 친구들과 실시간으로 광장에서 만나자는 약속을 하고 함께 시내를 돌아다닐 수 있습니다. 물론 제페토에서는 물건도 구매할 수 있고 직접 물건을 만들어서 팔 수 있습니다. 구찌, 루이비통, 버버리 등 실제 글로벌 명품 브랜드가 파는 명품 아바타 옷을 사서 꾸밀 수 있습니다.

[그림3] 제페토 & 구찌 콜라보

하지만 메타버스는 절대로 새로운 기술이 아닙니다. 실제로 동물의 숲 게임도 메타버스라고 할 수 있습니다. 동물의 숲에서도 아바타가 입을 옷을 만들고 친구의 옷을 가져올 수도 있습니다. 잡은 물고기를 전시하여 수족관을 만들어서 친구들이 자신의 공간으로 놀러 와서 문화 생활을 즐길 수 있습니다.

그렇다면 80~90년생들의 흑역사의 무덤 싸이월드, 추억의 마비노기 및 다수 게임과 현재 메타버스 플랫폼은 무엇이 그렇게 다를까요?

[그림 4] 싸이월드 미니룸(좌측)과 아스가르드(우측)
출처 : 싸이월드 미니룸, 아스가르드

일반적인 게임에서는 드랍 된 아이템을 팔거나 교환하는 정도의 거래가 이루어지거나 이것을 현금화하기 위해서는 게임 캐쉬를 파는 정도였습니다. 게임 유저가 직접 옷을 디자인하거나 새로운 무기를 제련할 수 없습니다. 즉, 게임 제작사에서 사전에 제작한 아이템들이 게임 세계에서만 거래 및 경제 활동이 이루어지는 것입니다. 이러한 점으로 인해 가상 공간에서의 세컨드 라이프를 경험하기 보다는 게임 콘텐츠를 즐기기 위한 오락 정도에 그치게 됩니다.

현재 2021년은 코로나19 팬더믹으로 인한 언택트 시대로 오프라인 활동에 대한 제약을 매우 크게 받고 있습니다. 그리고, 오프라인에서의 만남과 행동 제약이 있었기 때문에, 오프라인세계(현실세계)가 온라인으로 옮겨진 것이 메타버스 부흥의 시초라고 여겨집니다. 즉, 오프라인에서 활동하던 행동들인 업무, 회의, 사교 활동 등을 편하게 하기 위해서 온라인 가상 공간을 인터랙티브하게 설계하고 구현하기 위한 기술들이 더욱 활발하게 개발 및 적용되고 있습니다.

[그림5] 가상 오피스 – 게더 타운
출처 : 브런치 경험수집잡화점

저희는 인공지능의 인텔리전스를 한 층 더 올리기 위한 프로젝트와 연구를 하고 있기 때문에 메타버스 기술과 인공지능의 연관성과 활용 방향에 대해서도 살펴보고자 합니다.

tvN 드라마 ‘알함브라 궁전의 추억’과 같이 자신을 직접 투영하는 가상 부캐가 메타버스에 존재하거나 지금 자신이 있는 공간을 메타버스로 그대로 옮기기 위해서는 어떤 기술이 기반 되어야 할까요?

[그림6] tvN 드라마 ‘알함브라 궁전의 추억’

마우스/키보드/스마트폰을 통해서 캐릭터를 조정 및 제어하는 것이 아닌 자기 자신의 행동이 그대로 가상 캐릭터에 투영되게 하기 위해서는 행동 및 얼굴을 지속적으로 검출 및 추적하고 움직임을 그대로 표현할 수 있어야 합니다.

[그림7] 행동 검출 및 트레킹 예시
출처 : Testing ThreeDPoseTracker and MediaPipe (USB cam motion capture and hand tracking), created in Unity
青柳幸彦 유튜브 채널
[그림8] 얼굴 검출 및 트레킹 예시
출처 : MediaPipe Iris: Real-time Iris Tracking & Depth Estimation
[그림9] 포즈를 따라하는 아바타 AR
출처 : AR Poser: Automatically Augmenting Mobile Pictures with Digital Avatars Imitating Poses
DisneyResearchHub 유튜브

여기서 pose estimation, face modeling을 위한 인공지능 모델은 다수의 프로젝트 경험과 기술력이 담긴 테스트웍스의 Key point, landmark 기반 가공 데이터를 학습할 경우 더 효율적으로 정확도를 높일 수 있습니다.

또한 크게는 공간, 작게는 실제 객체를 인식하고 3차원 가상 공간/객체로 표현할 수 있다면 실세계를 가상 세계에 그대로 옮길 수 있습니다. 이러한 공간 정보를 인식하기 위해서 LiDAR, Depth sensor를 통해 입력된 공간 정보를 토대로 3차원 공간으로 재구축(reconstruction)하기 위한 연구가 기반이 되고 있습니다.

[그림10] 구글 탱고(좌측) – 공간 인지 스마트폰 / MS 홀로렌즈(우측) -공간 매핑 기술

아직까지는 메타버스를 송출하기 위한 하드웨어, 실제와 매우 유사한 3차원 객체 표현, 물리 엔진, 인공지능의 정확도 및 처리 속도, 네트워크 속도, 자연스러우며 실감적인 가상 인터랙션(후각/미각/촉각의 한계) 등 많은 기술들의 낮은 성숙도 및 한계점이 존재합니다. 하지만 곧 버츄얼 인플루언서 로지, 릴 미켈라, 이마, 김래아를 메타버스에서 만나서 대화하며 자신만의 세컨드 라이프를 즐길 수 있을 것으로 기대됩니다. 😊

[그림11] 비주얼 인플루언서 (왼쪽부터 로지, 릴 미켈라(Lil Miquela), 이마(Imma), 김래아.)
출처 : 1년에 130억원 버는 가상 인간… ‘버추얼 인플루언서’ 마케팅 인기 조선비즈 정민하 기자

박윤정

선임 연구원/컨설턴트, 컨설팅기술영업팀

연세대학교 컴퓨터과학 박사

증강현실 환경 구성과 인터랙티브 상호작용 연구를 수행하였다. 실감적 증강현실 환경을 구성하기 위해 딥러닝 기반의 상황 인식 연구에 대해 관심을 갖고 있다. 현재 테스트웍스 컨설팅기술영업팀에서 컨설팅 및 기술 제안서 작성을 맡고 있다.