如果說HTC Vive、索尼PSVR這樣的產品給我們打開了邁入虛擬世界的一扇門的話,那么它們裝配的控制手柄則是我們與這個虛擬世界進行交互的雙手。但拿著手柄與世界的交互終究會破壞這種置身于另一個世界的沉浸感,無時無刻不在提醒著我們這是一個虛擬世界。為了解決這個問題,一些公司將廣泛應用在影視行業里的動作捕捉技術帶到來VR領域,讓用戶能夠扔掉手柄,通過真實的觸摸、抓起、走動以及各種動作來與虛擬世界進行交互。
這種統稱為“動作捕捉”的交互技術成為VR產品體驗提升、產品大量普及極為關鍵的一環,無論是PC主機類VR設備,還是被認為有更大市場空間的移動VR市場,比如VR一體機或配合手機用的VR盒子,這類產品正是因為缺少低成本易用的交互技術方案,讓現在移動VR的交互體驗還顯得那么糟糕;現在已經有一批創業公司在進行這方面的創業探索,而且現在競爭已經非常白熱化,可以說,誰先走在前列,誰就能占領下一波VR發展的高地。
與大多數VR創業者集中在頭顯、游戲以及全景視頻領域不同,針對VR的動作捕捉細分領域并不那么擁擠,但競爭同樣激烈,智東西今天就全面解讀一下目前動作捕捉技術應用于VR領域的兩大技術路徑、其中的主要創業公司玩家以及其發展前景和面臨的困境,為你描繪出一副全面明了的VR動捕創業江湖圖景。
動作捕捉:實現全沉浸的第一步
大家都知道目前的VR設備只能夠做到部分沉浸,即當你戴上VR頭顯之后能夠感覺自己進入到了一個新的虛擬世界,但是在這個世界里的你卻僅剩下了一雙手以及半個胳膊,在你低頭往下看的時候是看不到自己身體的。此外,雖然HTC Vive類的設備也會給你提供一個控制手柄來讓你與虛擬世界進行一定的交互,但是當你把攥著Vive手柄的雙手伸向一個物體的時候,卻發現還需要按下側鍵才能將其“拿”起來,這與真實世界里面的拿的概念可大不相同。上述兩點正是目前VR設備無法實現更高沉浸感的原因。
而體感交互技術則可以解決這兩個問題。當有了體感交互技術之后,我們的整個身體都能夠被映射到虛擬世界之中,現實中的你做出什么樣的動作,虛擬世界中的你也會做出同樣的動作。而在與虛擬世界的交互方面,我們也不再依賴于Vive控制器或是其他的手柄,只需要跟現實一樣即可,例如伸出手拿起一個虛擬物品,亦或是用腳去踹開一個準備把你吃掉的虛擬僵尸。而這則正是一種更高級別的沉浸體驗。
VR動作捕捉的兩種主流技術路徑:光學方案與慣性方案
而想要在VR交互中實現體感交互的體驗,我們需要解決一個關鍵問題——人體動作捕捉。動作捕捉技術在電影中的應用由來已久,像是《加勒比海盜》《生化危機》等好萊塢大片中的科幻人物,其外表都是由電腦特效合成而來,而這些科幻人物在熒幕上的一舉一動則完全來自于真實演員的動作。
動作捕捉技術的本質其就是把現實中人物的動作復制到虛擬人物身上。目前,存在著兩種主流動作捕捉方案:
一、通過攝像機進行的動作捕捉技術,因為攝像機運用的是光學技術,所以攝像機動作捕捉方案也被稱為光學動捕方案。
二、IMU(Inertial measurement unit)慣性傳感器單元進行的動作捕捉,通常被稱為慣性動捕方案。
不管是光學動捕方案還是慣性動捕方案,其核心原理都是對人體關鍵運動部位動作的測量。光學方案是通過計算機視覺技術來分析攝像機抓取的人體關鍵運動部位的動作,而慣性方案則直接通過IMU慣性傳感器單元對人體關鍵運動部位的動作進行測量。
由于光學動捕方案容易被物體遮擋或是受到光照條件的影響,所以應用在影視領域的光學動捕系統一般都會在一個偌大的攝影棚里架設上一圈高性能攝像機,并讓動作演員穿上擁有許多光標點的動作捕捉服才能工作。正式由于對場地的要求以及需要大量的高性能攝像機,這類方案的整體價格非常之高,往往都在數百萬元之間,所以基本也只有財大氣粗的電影劇組有錢使用。
而慣性動捕技術的核心部件IMU慣性單元其實就是整合了陀螺儀、加速計以及磁力計的傳感器模塊,其一個模塊的價格甚至可以低至十幾塊錢,并且比光學動捕方案擁有更高的幀速率也不受場地與光照條件的限制,但是慣性動捕方案也有一個弊端,就是通過各種傳感器的數據測算出的動作數據會有一些誤差,而隨著使用時間增長,這些誤差也會被持續放大,而影視級光學方案則不存在這個問題。
?
雖然影視級的動捕方案擁有絕佳的精準與效果,但是其諸多的環境要求以及高昂的售價就決定了其難以在普通消費者市場進行推廣。而微軟在2010年則為其Xbox游戲機推出了一款名為Kinect的體感攝像頭,允許站在其前面的玩家通過簡單動作進行游戲。這種攝像頭能夠感知畫面的深度(距離)信息,并且一般擁有兩個或以上的攝像頭,因此一般被稱為深度攝像頭或者雙目攝像頭。深度攝像頭能夠識別環境的距離信息,再通過相應的算法就能夠識別出人類的簡單動作或者是手勢。
在微軟將這一技術推向消費市場之后,深度攝像頭這類低水平光學動捕技術逐漸推廣開來,幾乎所有手勢識別、動作識別或是體感交互的技術都是基于這種原理,本文所有提及的所有應用于VR領域的光學動捕技術也都是指基于深度攝像頭的光學動捕技術而應用與影視領域的專業光學動捕。
VR動捕技術江湖的核心玩家
傳統的動作捕捉技術主要應用在電影、模擬仿真、訓練等專業領域,而當VR行業開始興起之后,一些人看到了動作捕捉技術與VR頭顯結合的美好前景,開始針對VR行業推出相應的解決方案,并因此涌現出了一批希望將動作捕捉(體感交互)引入VR領域的公司。
光學方案領域:
1.微軟——第一次讓消費者了解到體感交互的意義。
微軟在2010年11月為Xbox游戲機推出了名為Kinect的體感交互外設,讓玩家不再需要手柄,僅僅是站在電視機前通過自己的身體動作即可進行游戲,正式這款設備讓全球玩家們首次認識到了體感交互的魅力,直到現在,一提起體感交互,微軟Kinect都是一個繞不開的名字,從某種程度上說,微軟幾乎就是消費級體感交互設備的鼻祖。
而在VR技術興起之后,微軟又研發了AR眼鏡Hololens。由于搭載有深度攝像頭,用戶可以通過手勢對其進行操作。
2.英特爾——致力于讓所有設備都能用上體感交互的大哥。
英特爾在2014年正式推出了RealSense技術方案,該方案包括一個深度攝像頭模塊以及配套的軟件、SDK等內容,并希望讓電腦、手機、無人機、機器人、汽車等所有設備都用上體感交互技術。
英特爾在這之后一直努力想要激活整個信息產業的力量去推廣RealSense方案,并逐漸出現在了電腦、谷歌Project Tango手機上面。就在剛剛過去的IDF2016上,英特爾也推出了一款名為Alloy的VR頭顯,在這個頭顯上增加RealSense模塊之后,Alloy的用戶能夠實現無需任何外設的前提下實現空間定位以及手勢交互的功能。
3.Leap Motion——努力想往VR靠的硅谷新秀。
Leap Motion成立于2012年,由前美國航空航天局技術人員大衛霍茲以及硅谷連續創業者巴克沃德兩人聯合發起,在成立之后就迅速獲得了華納集團的天使投資,并被《連線雜志》評為“有史以來我們測試過的最棒的手勢交互系統”,隨后又相繼獲得美國多家知名風投機構的A/B輪超過4000萬美元的投資,一時間聲名大噪。
Leap Motion的產品最開始主要面向PC領域,用戶將PC與Leap Motion的攝像模塊連接之后,就可以在這個模塊上面通過手勢進行操了。但是由于體感交互對于PC的用處暫時不大,Leap Motion又將目光轉向了VR領域,希望能夠旗下的產品整合進VR頭顯上面,目前暴風旗下VR盒子暴風魔境5Plus已經采用了這一模塊。
4.uSens淩感——中國版Leap Motion。
uSens淩感于2013年中旬成立于硅谷,在完成初期的算法與硬件開發之后,又相繼在杭州、北京、深圳三地設立了分部,并先后獲得了由IDG領投的550萬美元Pre-A以及由復星昆仲領投的2000萬美元A輪融資,在光學方案新秀里面,其融資額直逼Leap Motion。
uSense于近期京剛剛發布了旗下名為“Fingo”的體感交互方案,包括三款硬件以及配套的SDK,能夠實現手勢識別、位置追蹤以及AR/VR場景切換三大功能。
5.IMG英梅吉——國內唯一一家用單目攝像頭做動作識別的公司。
IMG英梅吉成立于2013年,最開始在從事基于英特爾RealSense方案的AR試眼鏡方案研發,在VR興起之后又轉向了基于VR產品的手勢識別領域。與其他所有光學方案的動作捕捉技術都需要使用雙目攝像頭不同,英梅吉的Hand CV方案僅需要使用普通的手機攝像頭即可完成手勢動作識別功能。
因為不需要任何的額外設備,這種基于單目攝像頭就能夠實現的手勢識別技術非常容易應用在基于手機的移動VR盒子上面。據悉,英梅吉目前已經與優酷土豆、三目VR、VR熱播等內容平臺達成了合作意向。
慣性方案:
1.Xsens——慣性動捕領域的領先廠商。
荷蘭Xsens成立于2000年,主要產品為MEMS傳感器以及基于傳感器的運動捕捉方案,其最早也做光學動捕方案,但隨后又轉型到了慣性動捕領域。目前是全球慣性動捕領域的領軍企業。該公司于2014年被半導體工業先驅Fairchild以6000萬美金價格收購。
2.Noitom諾亦騰——中國版的Xsens。
自2012年成立之初,諾亦騰就致力于研發基于MEMS慣性傳感器的動作捕捉技術。其早期產品主要應用于體育訓練以及影視動作捕捉領域,知名美劇《權力的游戲》就曾使用過該公司的技術。在VR興起之后,諾亦騰又開始將其動作捕捉技術與VR產業相結合,并推出了一套全沉浸的VR解決方案——Project Alice。
諾亦騰于2014年8月獲得A輪數百萬美元的融資,并與2015年11月再次獲得由奧飛領投的2000萬美元B輪融資,目前有面向高爾夫訓練的mySwing Pro、面向高級動作捕捉領域的Perception Legacy、面向中低端動捕的Perception Neuron以及全沉浸式VR方案Project Alice。
3.G-wearables國承萬通——從可穿戴設備轉型到VR解決方案。
G-wearables國承萬通成立于2013年,該公司最開始在從事可穿戴設備的研發,于2015年轉型到了VR領域,并推出了一套名為STEP VR的全沉浸式解決方案,該方案包括頭顯、空間定位、背包電腦以及基于MEMS慣性傳感器的動作捕捉方案。不過據其官網介紹,STEP VR的動作捕捉方案分為兩套,其對身體的動作捕捉是基于MEMS慣性傳感器的方案,而對手部動作的捕捉則采用了光學方案。
4.幻境——輸入輸出都關注的公司。
廣州幻境科技成立于2015年,成立之初即獲得了由廣州動捕恒準投資的數百萬元天使輪融資。其團隊核心成員自2009年開始研究基于MEMS傳感器的交互手套(數據手套)方案,并希望通過該方案來幫助聾啞人群體發出“聲音”。隨后又將其技術應用到VR領域,并將手部動作識別的方案擴展到了全身動作識別層面。
除了關注人機交互的輸入之外,幻境還關注輸出方面。幻境在其動捕方案內還配備有一個力反饋背心,在將人體的動作輸入到虛擬世界的同時還能夠讓佩戴者獲得相應的輸出感受。與此同時,幻境也在研發通過溫度、電壓等因素進行反饋的相關技術。幻境目前已經與VR線下體驗店
5.布塔——號稱校準最快的慣性動捕方案。
南京布塔成立于2015年,由三名游戲開發領域的老兵發起成立,最開始在為軍隊提供動作捕捉技術,隨后開始研發面向普通消費者的動作捕捉產品GUNGNIR。該公司稱其產品僅需用戶擺出一個動作,耗費零點幾秒的時間即可完成設備的校準步驟。布塔的產品目前已經與南京的VR線下體驗店方案提供商Nibiru睿悅達成了合作協議。
VR動捕技術的市場展望
在分析了總結兩種主流的動作捕捉技術以及相應的公司之外,智東西認為動作捕捉技術在VR上的應用上會呈現出這樣一種格局:光學方案會占據大部分普通市場,而慣性方案則會在線下體驗店與專業用戶領域勝出。
光學動捕方案:靠輕便搶占大部分普通市場
大部分的VR用戶都是輕度用戶,其使用場景基本就是觀看全景視頻或是玩一些輕量級的VR游戲,所以這類用戶對于VR人機交互的訴求基本都是點擊、拿起、觸碰、揮舞、拖拽等簡單動作。而光學動捕方案又有一個得天獨厚的優勢就是無需用戶穿戴任何設備。
與此同時,很多原廠頭顯如英特爾Alloy、微軟Hololens、暴風魔鏡5 Plus、uSense的Fingo一體機本身就都帶有深度攝像頭與手勢識別功能,用戶在使用這些VR頭顯進入虛擬世界的時候直接舉起雙手即可操作,所以基于深度攝像頭的光學動捕方案擁有了使用的便利性、設備的易獲得性等優勢,更易于在大眾市場進行普及推廣。
而從目前軟硬件廠商的市場行為上來看,我們也能夠看出一些端倪。一方面,如英特爾Alloy、微軟Hololens、暴風魔鏡5 Plus等產品都已經裝備了深度攝像頭并且擁有了手勢識別功能,而像是從事VR視頻內容制作與分發的VR熱播、三目VR等公司也正在與英梅吉進行合作,將英梅吉基于單目攝像頭的手勢識別方案Hand CV引入到自己的APP之中,從而讓用戶能夠在使用手機盒子類的VR產品時無需摘下眼鏡,也能夠完成快進、暫停、推出等操作。
最后,光學方案還有一個附加優勢,就是通過其深度攝像頭還能實現空間定位方案,例如英特爾在IDF2016上展出的MR設備Alloy,在不需要任何定位系統的前提下,Alloy的佩戴者便可在虛擬世界中實現空間行走的體驗。
“目前來看,針對C端以及輕B端的光學方案更適合我們,所以我們選擇了與英梅吉進行合作,但是像諾亦騰之類的慣性傳感器方案在將來一定也會用的到。”在問及如何看待兩種不同的動捕技術以及交互手段時,VR熱播CEO 張慶浩這樣說道。
uSens CTO時馳則表示,“從用戶可接受形態上來說,光學方案更具優勢,下一代面向普通消費者的動捕技術肯定是光學方案。” 在時馳看來,普通用戶的使用場景多在室內,且光學方案無需穿戴,所以絕大多數用戶會選擇光學動捕產品,并且像是英特爾的Alloy、微軟的Hololens等VR/AR產品也都已經選擇了光學方案。
慣性方案:靠低價與全面占據專業市場
在大部分普通用戶多使用輕量級VR應用的同時,也仍然有一部分專業與重度用戶的存在,他們希望將一個完整的自己帶入到虛擬世界中去,希望可以在其中自由走動、拿起物品、用腳踹僵尸或者是用拳頭跟敵人進行搏斗等操作,而這些動作捕捉技術對于VR頭顯上自帶的深度攝像頭,或者是在外部架設一兩個Kinect是無法完成的,必須請來動輒幾十乃至數百萬影視級光學動作捕捉方案才能實現,而將這種天價設備拿來玩游戲顯然是不現實的。
這個時候,貴則數萬,低則千元的慣性方案就能夠派上用場了,用戶在身體的重要運動部位綁上傳感器模塊,擺出幾個標準姿勢即可實現在虛擬世界里拳打敵人、腳踹僵尸的全沉浸式體驗了。正是由于需要穿戴傳感器并進行動作標定,所以業內普遍認為這類設備多會被VR線下體驗店、重度游戲玩家或行業用戶所采用。
此外,慣性方案也有一個附加優勢,即因為慣性方案的用戶必須進行穿戴,所以還可以將力反饋、溫度反饋等輸出效果融合進方案之中,如廣州幻境的全套慣性動捕方案中就包含一個力反饋背心,能夠通過振動讓用戶獲得反饋。
對此,VR游戲開發商魔視互動CEO王科表示,“自然輸入一定是人機交互的未來,光學方案適用于輕度游戲的體驗,重度體驗一定是將自然輸入與力反饋等輸出方式融合起來的方案。”
動作捕捉技術的隱憂:沒有普及一切都是白搭
雖然兩種動作捕捉方案都能夠豐富VR的交互手段,帶來更加的沉浸感,但是動作捕捉技術在VR領域的普及也并非一帆風順。
移動VR眼鏡廠商焰火工坊CEO婁池表示,由于可通過動作捕捉技術的VR內容相當匱乏,焰火工坊目前并不考慮在自己的極幕頭顯上增加深度攝像頭以實現動作捕捉功能。“消費者購買擁有某種產品的原因并不是因為技術本身,而是基于這項技術的優質內容。”婁池如是說。
反過來,在擁有動作捕捉技術的VR頭顯或是慣性動捕設備并沒有大量出貨的時候,內容廠商也不會貿然投入資源為其開發相應的內容,而內容的缺失又進一步阻礙了消費者對于硬件產品的購買欲望。這種先有雞還是先有蛋的問題在技術之外,成了阻礙動作捕捉技術在VR領域進行應用的一個關鍵性問題。
而這一問題的解法更多的還得依靠大公司以及線下體驗店去推廣。一方面,像是英特爾、微軟這類巨頭公司有更多的可能推出一款受到市場追捧的產品從而讓動作捕捉技術走進千家萬戶,另一方面,巨頭們也有制定VR動作捕捉技術行業標準的欲望與義務,當標準統一起來的時候,各家的產品定位才能夠明確,內容廠商們也才能夠以此去開發內容。
此外,線下體驗店是讓消費者接觸并了解VR技術以及動作捕捉技術的最佳途徑,豐富的設備、寬闊的體驗空間與定制開發的VR游戲,會讓消費者最大程度地了解到動作捕捉技術與VR技術相結合會帶來怎樣的體驗,而這種體驗反過來又會促進消費者購買相應的設備。
結語:目前正是各家公司的沖刺階段
在VR興起之后,我們看到了諸多創業者涌入其中,雖然絕大部分的創業者都集中在VR頭顯、游戲/應用以VR視頻領域,但是也有一小撮團隊選擇聚焦定位、動作捕捉、力反饋等輔助技術領域。雖然這些領域的玩家比頭顯、游戲/應用以及VR視頻領域要少的多,但是其競爭的激烈狀況也并沒有因為玩家較小而減弱絲毫。
其中, 諾亦騰與淩感是國內創業公司在慣性傳感器動捕方案與光學動捕方案兩個路徑上的典型代表,雙雙獲得了超過2000萬美元的融資,而其他公司也不甘示弱,相繼出現了英梅吉、幻境、國承萬通、布塔等創業公司,在硬件、算法、識別準確度、操作便捷性等多個方面與其展開了激烈的競爭,并獲得了一定的市場空間。
雖然動作捕捉技術與VR的結合看起來前景一片大好,但是其發展與普及的過程也并不會一帆風順,還得依賴英特爾、微軟、索尼、HTC這類大公司與成千上萬個線下體驗店的帶動作用才能真正幫助用戶實現一個更好的VR交互。
不出一年,哪種VR交互動作捕捉技術方案最終會在大眾市場應用中勝出,哪家公司會成為贏家,最大市場占有者,市場都將給出答案,現在正是各路英豪沖刺的階段。
(本文內容和圖片來自智東西微信號,本文只作為轉載分享,感謝作者付出!)
評論