電子發(fā)燒友網(wǎng)報道(文/李彎彎)由于比2D更精準(zhǔn)、更安全,3D視覺逐漸在一些行業(yè)中得到應(yīng)用,不過新技術(shù)在成長初期,都會有技術(shù)不夠成熟、成本過高的問題,那么3D如何跨越規(guī)模應(yīng)用的鴻溝,的盧深視創(chuàng)始人兼CEO戶磊日前在第四屆全球人工智能創(chuàng)業(yè)者大會上做了精彩分享。
的盧深視2015年8月成立,專注于三維機器視覺和人工智能領(lǐng)域,是國內(nèi)唯一打通“真三維全棧技術(shù)、并實現(xiàn)國家級項目落地應(yīng)用的公司。的盧在高精度深度感知成像、三維實時高精度重建、三維跟蹤識別及感知等技術(shù)方向上,都處于業(yè)界領(lǐng)先水平。
戶磊表示,從技術(shù)賽道來看,的盧深視以人為對象,實現(xiàn)3D機器視覺智能架構(gòu),比如將人的身份、行為軌跡精準(zhǔn)數(shù)字化。最初從3D人臉切入,比如表情捕捉,通過人臉高精度重建、精準(zhǔn)識別,現(xiàn)在開始做人體重建,包括動作、手勢識別以及人體特征體系,后面會進(jìn)一步做人體動作特征,拓展到更多推理和大數(shù)據(jù)應(yīng)用。
技術(shù)升級、成本降低,3D視覺逐漸走向規(guī)模應(yīng)用
3D和2D的區(qū)別,除了通常講的數(shù)據(jù)、算法外,還有3D相機傳感器。3D最終是數(shù)據(jù)、算法、相機傳感器通過各種各樣的模塊形態(tài),或解決方案形成規(guī)模應(yīng)用。那么3D視覺規(guī)模應(yīng)用存在哪些問題?
數(shù)據(jù)方面,2D圖像數(shù)據(jù)在現(xiàn)實生活中比較普遍,戶磊介紹道,“以人臉識別為例,我們比較容易通過公開數(shù)據(jù)或社交網(wǎng)絡(luò)搜索圖像,標(biāo)注實現(xiàn)還不錯的人臉識別算法研究數(shù)據(jù)集,但3D數(shù)據(jù)現(xiàn)在比較稀少,需要從源頭開始積累。同時,好的3D數(shù)據(jù)沒有公開標(biāo)準(zhǔn)。”
圖形算法方面,2D圖像是規(guī)則的矩陣,比較容易用神經(jīng)網(wǎng)絡(luò)的方式處理,而3D數(shù)據(jù)是不規(guī)則數(shù)據(jù),3D和2D在網(wǎng)絡(luò)結(jié)構(gòu)和算法設(shè)計上會有所不同。
相機傳感器方面,現(xiàn)在近距離、高精度已經(jīng)比較成熟,并且已經(jīng)走向應(yīng)用,而遠(yuǎn)距離、高精度,包括復(fù)雜光照下的抗光性等方面,還有很多問題需要解決。
雖然如此,現(xiàn)在隨著各種各樣應(yīng)用的深入,3D其實開始逐步走向規(guī)模應(yīng)用,以人臉識別為例,人臉識別技術(shù)本身的應(yīng)用就非常普遍,不管從管理、服務(wù)、體驗來看,身份認(rèn)證都是各行業(yè)開展業(yè)務(wù)時需要用到的重要環(huán)節(jié)。只不過最初大家普遍通過圖像方式進(jìn)行人臉識別,比如照片。
人臉身份認(rèn)證技術(shù),還需要一個更完善的人臉識別身份認(rèn)證方案。在戶磊看來,一個完善的身份認(rèn)證方案需要有幾個元素:一是有很好的威信;二是有很好的體驗;三是有很強的安全性,主要是指有防攻擊、防偽的能力;四是要快,并且在各種環(huán)境下,比如各種光照下都可以準(zhǔn)確識別。
在前期的應(yīng)用中,人臉識別也逐漸呈現(xiàn)出對唯一性、安全性有更高的要求,因此就有了3D技術(shù)的應(yīng)用,3D技術(shù)的優(yōu)勢在目前的一些應(yīng)用案例中,有很好的體現(xiàn)。
比如金融刷臉支付,因為刷臉支付直接和錢相關(guān),如果要解決在支付過程中,不被照片、平面的一些物體攻擊,就需要引入3D相機,從數(shù)據(jù)的源頭上百分之百杜絕低成本的攻擊方式。
再比如在一些大場景支付中的應(yīng)用,軌交刷臉進(jìn)站,戶磊表示,“這可能就是千萬級用戶的應(yīng)用,每天都有千萬級的人流量,在千萬級用戶下做精準(zhǔn)識別,就需要有更多特征和更準(zhǔn)確的識別率。”
3D應(yīng)用要涉及到3D數(shù)據(jù)、3D的庫以及3D前端設(shè)備,3D設(shè)備必然會帶來成本的增加,但是隨著規(guī)模化應(yīng)用,3D應(yīng)用也會逐步走向平民化。事實上,通過應(yīng)用普及和規(guī)模化量產(chǎn),以及產(chǎn)業(yè)的努力、技術(shù)迭代和更新,現(xiàn)在3D相機在成本上已經(jīng)和很多傳感器成本非常接近了。
戶磊認(rèn)為,除了產(chǎn)業(yè)鏈的發(fā)展,應(yīng)用能夠規(guī)模化以外,3D在技術(shù)上還有很多需要探究的地方。在他看來,技術(shù)升級帶來成本下降和規(guī)模應(yīng)用帶來成本下降一定是交織狀態(tài),兩者不斷交織往前推進(jìn),最終跨越規(guī)模應(yīng)用的鴻溝。
的盧深視完備的工程化能力助力3D跨越規(guī)模應(yīng)用鴻溝
從技術(shù)本身來看,的盧是創(chuàng)新基因與市場需求結(jié)合的團隊,戶磊介紹道,“的盧提供光電和算法一體設(shè)計的整體解決方案,從市場需求出發(fā),通過科學(xué)家團隊和高校緊密合作,把所有系統(tǒng)研發(fā)分成實現(xiàn)領(lǐng)先性的技術(shù)規(guī)劃和支撐產(chǎn)品的技術(shù)規(guī)劃,并通過新技術(shù)預(yù)研,到產(chǎn)品原型驗證,再到產(chǎn)品研發(fā)的突破式迭代,最終實現(xiàn)可規(guī)模量產(chǎn)的產(chǎn)品。”
這一套體系由一個三維視覺工程化平臺支撐,包括光學(xué)驗證、仿真平臺,算法驗證、仿真和測試平臺,機械和電氣驗證、仿真和測試平臺。
戶磊認(rèn)為,光學(xué)和算法一體化設(shè)計非常重要,算法和光學(xué)一定要做交互設(shè)計。
光學(xué)部分,包括設(shè)計仿真平臺,有散射仿真,隨機點針仿真、光學(xué)表面設(shè)計和激光器件仿真設(shè)計,還包括原型驗證平臺和可靠性驗證平臺。
算法部分,包括結(jié)構(gòu)光系統(tǒng)驗證平臺、雙目系統(tǒng)驗證平臺、深度數(shù)據(jù)質(zhì)量評測平臺和復(fù)雜光照模擬系統(tǒng)等,還包括100萬標(biāo)準(zhǔn)3D人像數(shù)據(jù)庫,千萬標(biāo)準(zhǔn)3D人像數(shù)據(jù)庫、十萬標(biāo)準(zhǔn)3D人體數(shù)據(jù)庫,活體檢測驗證系統(tǒng)等。
機械、電氣部分相對來說會更常見一些,包括要做大規(guī)模的百萬級、千萬級量產(chǎn)所必需的一些基本驗證和仿真測試的工具。
所有這些構(gòu)成了一個完備的工程化能力。
在產(chǎn)業(yè)鏈的定位上,的盧是三維視覺感知系統(tǒng)整體解決方案提供商,提供從3D相機成像系統(tǒng)設(shè)計、3D算法、以及這兩個融合在一起形成的完整3D感知技術(shù)模組,和在一些行業(yè)中,根據(jù)行業(yè)屬性,提供3D終端產(chǎn)品。
在提升易用性和性價比方面,的盧還自研結(jié)構(gòu)光深度恢復(fù)算法,有完整的FPGA、ARM、GPU平臺方案,了解算法需求;有自研的散斑增強算法,提升模組的環(huán)境適應(yīng)性;有自研的光學(xué)系統(tǒng)補償算法,可以對溫漂、裝配誤差進(jìn)行補償,保證一致性和良率。
的盧的相機目前已經(jīng)廣泛應(yīng)用于刷臉支付、地鐵軌交刷臉過閘、以及現(xiàn)在醫(yī)保身份認(rèn)證等很多場景中。
高精度結(jié)構(gòu)光RGBD相機,可用于刷臉支付終端、銀行ATM、無人機貨柜、地鐵刷臉閘機、AR/VR、物品體積測量等場景,該款產(chǎn)品體積小巧易于集成,同時內(nèi)置低功耗AI加速芯片,可支持Face ID、活體檢測。
在刷臉支付方面,的盧與金融頭部企業(yè)合作共同推進(jìn)刷臉支付建設(shè)。
另外的盧還面向其他智能家居場景推出了3D Face ID智能模組,可應(yīng)用于家庭智能門鎖、只能保險柜、酒店公寓智能鎖、智能門禁等場景中。該模組集成了3D結(jié)構(gòu)光深度恢復(fù)算法、人臉識別算法等,不需要任何主控,直接對接硬件和軟件接口即可。
該產(chǎn)品使門鎖可以長期低功耗工作,實現(xiàn)在電池供電的情況下,至少9個月不需要充電,戶磊認(rèn)為,我們已經(jīng)真正具備了可以成熟應(yīng)用的能力,現(xiàn)在正在和一些互聯(lián)網(wǎng)巨頭合作智能門鎖項目,預(yù)計今年年底或者明年就可以在市場上大規(guī)模普及。
總結(jié)
整體而言,在戶磊看來,3D要跨越規(guī)模應(yīng)用鴻溝,需要具備幾大特質(zhì):技術(shù)成熟、安全升級、體驗升級、成本極致。
戶磊認(rèn)為,在技術(shù)成熟方面,技術(shù)方案一定要能夠滿足真正的應(yīng)用需求,或者遠(yuǎn)高于應(yīng)用需求,其在應(yīng)用場景中要比較容易落地;在安全升級方面,目前隨著應(yīng)用的普及,越來越多的應(yīng)用被發(fā)現(xiàn)容易受到攻擊,而3D的安全性則比2D更高;在體驗升級方面,即需要考慮在更大角度的情況下,復(fù)雜光線、完全黑暗等的情況下,是否可以達(dá)到一致的識別體驗;在成本方面,一個好的方案同時一定也要做到成本的極致,它的成本一定不能給用戶或者場景帶來更多負(fù)擔(dān)。
-
3D視覺
+關(guān)注
關(guān)注
4文章
447瀏覽量
28134 -
的盧深視
+關(guān)注
關(guān)注
0文章
5瀏覽量
1544
發(fā)布評論請先 登錄
人形機器人 3D 視覺路線之爭:激光雷達(dá)、雙目和 3D - ToF 誰更勝一籌?
對于結(jié)構(gòu)光測量、3D視覺的應(yīng)用,使用100%offset的lightcrafter是否能用于點云生成的應(yīng)用?
從2D走向3D的視覺傳感器
3D打印技術(shù),推動手板打樣從概念到成品的高效轉(zhuǎn)化
洛微科技3D視覺引導(dǎo)軟包拆垛解決方案

一文理解2.5D和3D封裝技術(shù)

適用于3D機器視覺的高度可擴展的TI DLP技術(shù)

微視傳感高性能3D視覺產(chǎn)品亮相2024上海機器視覺展

3D視覺技術(shù)廣闊的應(yīng)用前景

居然還有這樣的10.1寸光場裸眼3D視覺訓(xùn)練平板電腦?

評論