2016年是人工智能崛起的一年,隨著人臉識別、駕駛輔助等人工智能應用的普及,眾多互聯網(Google、Facebook、百度等)和半導體巨頭(Nvidia,Qualcomm,Intel等)都相繼在人工智能領域布局發力。自然地,在2017年CES展最受人關注的熱點當然也是人工智能。在各類人工智能應用層出不窮時,我們也應當注意到站在這些應用背后,以低廉價格提供應用運行平臺以加速人工智能普及的恰恰是半導體廠商。今天,我們來盤點一下各大半導體廠商在CES展上的表現。
1. 高通
高通毫無疑問是移動端芯片的主導者。高通此次在CES上發布的產品主要是驍龍835 SoC。驍龍835 SoC使用三星10nm工藝制造,搭載了8核心Kyro 280處理器(包括峰值主頻可達 2.45GHz 的 4 顆高性能核心,以及峰值主頻可達 1.9GHz 的 4 顆低功耗核心)。
除了處理器之外,驍龍835還包含了X16 LTE Modem,Adreno GPU,Hexagon DSP,Spectra ISP等等核心模塊。其中,和人工智能關系最密切的當屬Hexagon DSP和Adreno GPU。
目前,在移動端的深度學習應用越來越多。例如最近風靡一時的風格遷移App(將一張圖片變成另一張圖片的風格)。
在移動端的深度學習應用中,往往對于計算的精度要求不高,使用定點數計算也可滿足大部分應用的需求。驍龍系列中的Hexagon DSP就能高效率地完成定點數運算,然而在之前的版本中,DSP對于深度學習應用并不友好,開發者想要調用DSP完成深度學習中的定點數運算并不容易。針對這一點,高通在逐漸加強DSP對于深度學習應用的支持。在驍龍835中,對具有 Hexagon 向量擴展(HVX)特性的 Hexagon DSP 進一步增強,包括了對定制神經網絡層更好的支持。
另外,Adreno GPU是驍龍SoC中可以實現SIMD(單指令流多數據流)高效率并行計算的模塊。GPU的SIMD特性使得其可以高效完成深度學習計算,但是需要提供給深度學習開發者一套完善的編程接口。Nvidia的編程接口是CUDA,憑借其易用性成為了深度學習開發者首選的開發語言之一。在非Nvidia的GPU中,類似CUDA的接口是OpenCL。這次驍龍835中的Adreno GPU可以完美支持OpenCL 2.0,對于想要借助高通SoC中GPU進行深度學習計算的開發者是個好消息。
最后,高通升級了包含了升級過的神經處理引擎軟件框架,其中增加了對 Google TensorFlow 的支持,以及對驍龍異構核心的功耗與性能的優化。這進一步使得深度學習開發者可以更高效地利用高通驍龍SoC的計算能力完成不同的應用。
點評
高通作為一個通信行業起家的半導體巨頭,此次CES上仍然以無線通訊為主要戰略重點,其在自動駕駛方面的布局也主要在車聯網方面而非人工智能運算。不過隨著人工智能漸漸向移動(嵌入式)端靠攏,高通也在驍龍SoC中逐漸增加對深度學習的支持。這次驍龍SoC中對深度學習的支持主要體現在指令級以及應用框架上,即可以讓開發者更高效地利用現有SoC資源完成深度學習計算。高通的專用的深度學習硬件(如加速器模塊)在實驗性質的Zeroth之后尚無下文,可見高通對于深度學習的投入尚屬保守,這也給其他專注于嵌入式深度學習硬件的廠商一個超越的機會。
2.Intel
之前的Intel已經錯失了移動設備的機會,這次Intel不愿意再次錯過人工智能。在本屆CES,Intel發布了GO平臺,顯示了其在自動駕駛領域的決心。GO平臺包括了車聯網、車內運算與云端計算服務。在車內運算,Intel將使用符合汽車電子標準的Atom和Xeon CPU,并配合Altera最新的FPGA技術。在云端,Intel GO將提供包括高效能Intel Xeon處理器、Intel Arria 10 FPGA、SSD以及Intel Nervana平臺在內的眾多技術,建構出強大的主機與深度學習訓練與模擬基礎設施,滿足自動駕駛產業的需求。另外,Intel還發布了針對GO平臺的SDK,讓開發者可以充分利用GO平臺的計算能力。
無人駕駛是英特爾聚焦的重要領域之一。2016年底,英特爾將汽車團隊從物聯網事業部剝離,單獨成立自動駕駛事業部。更重要的是,去年Intel與寶馬及Mobileye達成聯盟,計劃在2021年前推出無人駕駛汽車。在這項結盟合作中,BMW集團將負責駕駛操控與動力機件,以及評測整體功能安全性,包括設定高效能模擬引擎、整體零組件整合、生產原型車款。Intel GO平臺為各種關鍵功能提供可擴充的開發與運算平臺,包括感測器融合、駕駛策略、環境建模、路徑規劃、以及決策制定。Mobileye貢獻其EyeQ 5專利高效能電腦視覺處理器,提供汽車等級的功能安全性以及低功耗的表現。EyeQ 5負責處理與轉譯360度環景視覺感測器以及地域性的資料。Mobileye更將進一步與BMW集團合作,著手開發感測器融合解決方案,匯集視覺、雷達、光達感測器搜集到的資料,針對車輛周圍環境建立一個完整模型,結合其人工智能算法,讓汽車能安全應付各種復雜的駕駛情境。
在本屆CES,寶馬、Intel和Mobileye聯盟在展前發布會上宣布,大約40輛寶馬無人駕駛汽車將于2017年下半年開始路測。這是三家公司攜手實現無人駕駛目標,所邁出的重要一步。三家公司披露,這些BMW 7系列汽車將采用英特爾和Mobileye的技術,從美國和歐洲開始全球路測之旅。
點評
Intel對于人工智能的投入目前主要顯示在云端,其收購的Altera FPGA和Nervana已經在為Intel的云端人工智能業務提供強大的性能。在無人駕駛方面,Intel與BMW、Mobileye組成的聯盟各司其職,Intel負責計算平臺,Mobileye負責算法、環境感知和大數據采集,而BMW則負責汽車。Intel在移動端人工智能領域還是很低調,但去年收購Movidius動作讓我們相信Intel正在這一方面積極布局,不久的將來一定會有更大的作為。
3.Nvidia
借著人工智能的風頭,Nvidia的股價在去年飛升三倍有余,令人驚嘆。今年CES更是請Nvidia的黃仁勛作為開幕前夜最重頭的專場演講的嘉賓。毫無疑問Nvidia已經成為了本屆CES的焦點。今年CES展上,Nvidia發布的產品中有兩款與人工智能相關,一款是用于家庭物聯網的Shield+Spot,另一款是車載人工智能平臺Xavier。
首先我們來看一下Shield+Spot。Shield是Nvidia于幾年前發布的游戲主機,而這次在CES發布的則是最新版Shield。新Shield除了擁有常規的游戲和互聯網視頻播放功能外,最大的亮點是引入了Google助手。Google助手可以通過語音識別完成用戶的各種指令,如在CES演講的演示視頻中,就出現了用戶通過與Google助手語音交談從而讓Shield播放視頻,展示照片等。
然而,Nvidia對Shield的野心遠不止“支持語音交互的智能機頂盒”,而是智能家庭中心。為了讓Shield能接收用戶從家里任何地方發出的語音指令,黃仁勛在發布新Shield的同時還展示了與新Shield搭配使用的Nvidia Spot。Nvidia Spot是經過特別設計的麥克風,可以放置在家里的任何地方,并且通過局域網與Shield連接起來,把用戶的語音指令傳輸到Shield。
同時,在Nvidia的計劃中,Shield可以控制的也遠遠不止電視機,而是可以控制各種智能家電(如Nest的產品)。這樣,在Nvidia提供的智能家庭方案中,Nvidia Spot作為用戶指令的接收者遍布家的每一個角落,用戶在任何地方下的語音指令通過Spot傳回物聯網中心節點Shield,而Shield則根據指令來控制家庭的智能家電,如打開空調,啟動掃地機器人等等。
Nvidia發布會第二個重頭戲是Xavier。是Nvidia預期在2017年正式發售的車載超級計算機模組。Xavier包含了擁有512 CUDA核的Volta GPU,8核心的Nvidia定制ARM64 CPU。最令業界震驚的,可謂是其性能:在峰值性能達到30TOPS的情況下,僅僅消耗30W!也就是說,其能量效率達到了1TOPS/W。相形之下,2017年發布在半導體領域最頂級會議ISSCC Deep Learning Processor Session的第一篇paper,ST最頂尖的深度學習專用ASIC也僅僅實現了2.9TOPS/W。ST的深度學習加速器是專為深度學習開發,一般而言只能做深度學習計算;而Xavier是一款通用的計算平臺,1TOPS/W的性能除了可以計算深度學習外還可以做其他計算,因此通用性遠好于ASIC。通常專用的ASIC的能量效率應當比通用計算平臺好一個數量級左右,而現在這個差距被縮小到了3倍不到,可見Xavier性能之強大。在性能相差不大的情況下,大多數人都會選擇通用計算平臺而非ASIC,因此相信從事深度學習加速器ASIC研發的工程師們看到Xavier這個指標真的是壓力很大。
另一個有趣的細節是,Xavier的性能并沒有用常規GPU的FLOPS(每秒浮點運算量)做單位,而是OPS(每秒定點數運算量)。在往常的GPU中,深度學習計算通常用浮點數運算來完成,這樣的做法在保證計算精度的同時卻損失了計算速度,因此深度學習硬件的一個很熱門的方向就是如何用定點數運算來代替浮點數運算,在保證計算精度損失可控的情況下大幅提升速度。Nvidia在Pascal GPU上已經做了一些對于定點數計算的支持,而根據CES的主題演講透露出的蛛絲馬跡,下一代Volta GPU上想必會加強對定點數運算的支持。而Nvidia作為深度學習硬件領域的絕對統治者,其對于定點數運算的大力支持又會倒逼深度學習算法開發者加強對于使用定點數的深度學習框架的開發。在可預計的將來,使用定點數的深度學習網絡將會變得越來越流行。
Xavier的性能和功耗都完美符合無人駕駛市場的需求,而無人駕駛是Nvidia在人工智能市場布局的重中之重。黃仁勛提到,目前的運輸市場規??蛇_一萬億美元,全球共有十億量跑在路上的汽車,而汽車運輸市場又是一個損耗嚴重的市場,主因就是人類駕駛員容易犯錯。一旦駕駛員犯錯,車禍帶來的損失非常大。如果用人工智能幫助駕駛,那么這些損耗可以被大大降低。
Nvidia還發布了配合Xavier的無人駕駛和協同駕駛應用。在無人駕駛方面,Nvidia發布了搭載BB2無人駕駛車,BB2目前能實現根據路況自動變道,減速轉彎,避讓行人等等。Nvidia與奧迪合作,預期在2020年實現第四級無人駕駛(即僅僅在極少情況下需要人工干預的自動駕駛系統)。
在協同駕駛方面,Nvidia發布了四項技術,包括面部識別,頭部追蹤,視線追蹤以及讀唇技術。面部識別首先可以通過深度學習判斷駕駛員的表情從而進一步判斷駕駛員的情緒狀況,在發現情緒不穩時提醒駕駛員即使休息調整情緒以避免發生沖動駕駛。頭部追蹤和視線追蹤可以幫助協同駕駛系統判斷駕駛員注意力是否集中,并在駕駛員分神時及時提醒。讀唇技術則可以在環境較吵鬧的情況下根據駕駛員嘴唇的動作判斷其發出的語音指令并予以執行。根據黃仁勛的解釋,Nvidia正在和英國牛津大學LipNet團隊合作研發用于讀唇的深度學習網絡模型,目前該模型已經能達到93.4%的正確率,可望很快就能用在真正的汽車中。最后,協同駕駛系統還能為駕駛行為打分,在督促駕駛員安全駕駛的同時也能夠成為保險公司制定保費的依據。
點評
有意思的是,在CES上Nvidia并沒有像AMD一樣發布GPU,而是直接發布應用平臺,可見Nvidia對自己的角色定位已經從原來的半導體廠商慢慢轉型到人工智能平臺提供商。另外,如果說高通的芯片主要定位在移動端,Intel的芯片主要服務于云服務器端,那么Nvidia的產品則是介于高通和Intel之間,服務于車載以及家用端。
在數據量巨大的數據中心,Nvidia的GPU是服務器不可或缺的一部分,但是Nvidia自己的服務器目前還在試水階段,因此在大數據人工智能市場Nvidia提供的是硬件而非平臺。在另一個極端,即數據量不大,對運算能力要求不高但是對功耗有極大限制的嵌入式深度學習領域,Nvidia基于GPU的人工智能平臺一方面功耗太大,另一方面過高的計算能力反而導致成本過高,因此無法與ASIC(如高通的SoC)抗衡。而在ADAS與家用電器市場,Nvidia的人工智能平臺無論計算能力(10-100TOPS)還是功耗(10-100W)都能完美地符合要求,因此Nvidia主打自動駕駛與家用物聯網中心并不奇怪。
4.中國廠商
在本屆CES上,中國廠商展出的人工智能相關產品主要還是使用國外半導體廠商的芯片并進一步開發,例如地平線基于Intel開發的駕駛輔助(ADAS)技術,以及大疆的無人機。
目前,中國在人工智能專用芯片方面相對國際先進水平并不落后。中科院寒武紀的技術在獲得國際學術界和業界的極大認可,在2016年的ISCA(國際計算機架構大會)發表的論文總評分排名第一?;谄浼夹g開發的系列芯片已經經過流片驗證,目前正在積極進入商業化軌道。深鑒科技則專注于神經網絡壓縮,其深度學習處理器架構(DPU)也得到了國際認可,去年下半年剛剛在HotChips發布了Aristole(用于卷積神經網絡)和Descartes(用于語音識別)的加速器。
寒武紀芯片
深鑒發布的DPU架構
除此之外,華為、大疆等公司也在積極開發人工智能方面的硬件。人工智能專用硬件對于國內外而言處于相近的起跑線,加上國內廠商相對國外半導體巨頭而言包袱比較少,因此國內廠商有超越國外巨頭的機會。然而,國內的人工智能芯片廠商不能只開發深度學習加速器,而必須要提供整套解決方案才能有足夠競爭力。中國半導體廠商在這方面還任重而道遠。
評論
查看更多