神經(jīng)網(wǎng)絡(luò)計(jì)算芯片已經(jīng)引起了全球各個(gè)學(xué)院/企業(yè)的廣泛關(guān)注,“軟件定義芯片”相關(guān)研究,適應(yīng)AI算法不斷變化的重要研究方向。但是芯片的性能跟通用性常常是一個(gè)“魚和熊掌不可兼得”的選項(xiàng),如何讓AI芯片兼?zhèn)湫阅芎屯ㄓ眯裕?/p>
在機(jī)器學(xué)習(xí)算法不斷變化、人工智能應(yīng)用不斷增多的當(dāng)下,神經(jīng)網(wǎng)絡(luò)計(jì)算芯片(AI芯片)的設(shè)計(jì)者們所思考的一個(gè)關(guān)鍵問題開始浮出水面——如何在保證AI芯片性能/功耗表現(xiàn)優(yōu)秀的同時(shí),盡可能的在更多人工智能算法上通用。
目前市面上陸續(xù)涌現(xiàn)的AI芯片中,有不少都采用了重新設(shè)計(jì)芯片底層架構(gòu)的方式,來平衡AI芯片的性能與AI算法通用性之間“魚與熊掌不可兼得”的矛盾,突出玩家有寒武紀(jì)、谷歌TPU項(xiàng)目等等。
產(chǎn)業(yè)界如此熱火產(chǎn)天的發(fā)展,離不開學(xué)術(shù)界此前的長久積累。在過去的十幾年里,清華微電子所的可重構(gòu)計(jì)算團(tuán)隊(duì)一直在研究一項(xiàng)核心技術(shù)——“軟件定義芯片”,前年,他們推出了一款代號(hào)為Thinker 1的AI芯片,這款芯片不僅能夠支持人臉識(shí)別、語音識(shí)別的AI算法,而且芯片的功耗非常小——只需要7號(hào)AA電池就夠讓它運(yùn)行一整年。
在2018年的春節(jié)前夕,記者專門來到清華大學(xué)校園里,與GTIC 2018重磅嘉賓之一,清華大學(xué)微電子研究所所長、中國半導(dǎo)體行業(yè)協(xié)會(huì)IC設(shè)計(jì)分會(huì)理事長、我國半導(dǎo)體行業(yè)“男神”級(jí)人物魏少軍教授圍繞著AI芯片的話題展開了獨(dú)家對(duì)話。魏少軍教授有著數(shù)十年半導(dǎo)體行業(yè)經(jīng)驗(yàn),對(duì)我國半導(dǎo)體產(chǎn)業(yè)有著深刻的認(rèn)識(shí),看法往往一針見血。
他認(rèn)為,目前芯片架構(gòu)創(chuàng)新已經(jīng)引起了全球各個(gè)學(xué)院/企業(yè)的廣泛關(guān)注,尤其是“軟件定義芯片”相關(guān)研究,更是提升AI芯片的應(yīng)用范疇、適應(yīng)AI算法不斷變化的重要研究方向。在今明兩年之內(nèi)AI芯片將持續(xù)火熱,但是到了2020年前后則會(huì)行業(yè)洗牌,出現(xiàn)第一批出局者。
一、性能 vs 靈活:魚與熊掌不可兼得
芯片的性能跟通用性常常是一個(gè)“魚和熊掌不可兼得”的選項(xiàng),傳統(tǒng)架構(gòu)下,一個(gè)芯片在某些特定領(lǐng)域的性能越強(qiáng)、功耗越低,它往往就越不靈活、越不通用。舉個(gè)例子,華為Mate 10里的麒麟970芯片用于手機(jī)的性能非常強(qiáng)大,但是它并不適用于安防攝像頭、可穿戴手環(huán)等場景;同理,一個(gè)CPU能夠靈活地處理眾多不同任務(wù),但是它在某些特定任務(wù)上往往性能不夠強(qiáng)大,比如在深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練上的性能不如GPU。
而ASIC這類專用芯片的位置,則介乎于手機(jī)SoC這類標(biāo)準(zhǔn)芯片、與CPU這類通用芯片之間——這是一個(gè)非常尷尬的地位,標(biāo)準(zhǔn)芯片雖然單個(gè)開發(fā)成本高,但是單一品類出貨量非常大,很大程度上降低了芯片的單個(gè)價(jià)格;而通用芯片則相反,雖然總體出貨量不高,但是單一品類的價(jià)格很高,也能夠分?jǐn)傃邪l(fā)成本。
隨著芯片制造工藝的日益先進(jìn)(目前已經(jīng)逼近7nm),芯片制造成本也水漲船高,如今設(shè)計(jì)制造一顆10nm芯片的成本要幾千萬美元,綜合成本高達(dá)上億美元。
因此,如果不能保證某款單一應(yīng)用場景下能夠大量出貨,專用芯片需要保持一定的通用性與靈活度。
最近兩年間,產(chǎn)業(yè)界開始陸續(xù)涌現(xiàn)出神經(jīng)網(wǎng)絡(luò)計(jì)算專用芯片(AI芯片),寒武紀(jì)、深鑒科技、中星微電子等玩家的AI芯片產(chǎn)品采用的都是28nm的芯片工藝,前期從投入到流片的成本超過400萬美元,單一品類出貨量沒有百萬的級(jí)別將很難收回成本。
而除了成本之外,AI算法的演進(jìn)也需要納入考慮。由于目前人工智能算法還在不斷變化、不斷演進(jìn)的過程中,人工智能經(jīng)歷了六十多年的發(fā)展才迎來了深度學(xué)習(xí)的大規(guī)模爆發(fā),然而現(xiàn)在深度學(xué)習(xí)算法還有眾多有待優(yōu)化的方面,比如稀疏化、低功耗、小數(shù)據(jù)訓(xùn)練等,算法尚未定型。
此外,目前語音/文字/圖像/視頻等不同應(yīng)用無法使用統(tǒng)一算法,然而許多實(shí)際生活中的AI應(yīng)用程序(識(shí)別圖像中的對(duì)象或理解人類語言)需要不同類型的具有不同層數(shù)的神經(jīng)網(wǎng)絡(luò)的組合。
因此,在確保AI應(yīng)用性能的前提下,AI芯片需要盡可能地保持芯片通用性。
目前AI芯片企業(yè)們采用的技術(shù)方案各不相同,如果將芯片通用性作為評(píng)測坐標(biāo)軸,最左邊、最激進(jìn)的企業(yè)會(huì)采用算法固化方案,這一做法成本低、芯片落地時(shí)間短、單一算法的性能與功耗比能夠做到極致,但是極大減少了芯片的通用型和靈活性;最右邊的團(tuán)隊(duì)(比如寒武紀(jì)、谷歌TPU等)則會(huì)設(shè)計(jì)一款全新的芯片架構(gòu),這一做法成本高昂、芯片研發(fā)周期長,但是能夠在性能與芯片通用性上達(dá)到極好的平衡。
▲清華微電子所所長魏少軍教授
清華微電子所的可重構(gòu)計(jì)算團(tuán)隊(duì)就屬于坐標(biāo)軸右邊的一類,從2006年開始,清華微電子所所長魏少軍教授就帶領(lǐng)著團(tuán)隊(duì)在持續(xù)深入研究這項(xiàng)重要技術(shù)——“軟件定義芯片”,又稱“可重構(gòu)計(jì)算技術(shù)”。
“軟件定義芯片”顧名思義就是讓芯片根據(jù)軟件進(jìn)行適應(yīng)與調(diào)整,這是一項(xiàng)專用芯片架構(gòu)設(shè)計(jì)上的創(chuàng)新,與傳統(tǒng)的馮諾依曼架構(gòu)有著很大的區(qū)別。簡單來說就是將軟件通過不同的管道輸送到硬件中來執(zhí)行功能,使得芯片能夠?qū)崟r(shí)地根據(jù)軟件/產(chǎn)品的需求改變功能,實(shí)現(xiàn)更加靈活的芯片設(shè)計(jì)。
也就是說,沿用這種架構(gòu)設(shè)計(jì)出來的專用芯片,可以讓芯片的計(jì)算能力按照軟件的需求來調(diào)整適應(yīng),而不是沿用傳統(tǒng)芯片設(shè)計(jì)的剛性架構(gòu),讓應(yīng)用適應(yīng)架構(gòu)。對(duì)于現(xiàn)在尚未定型/統(tǒng)一的各類AI算法而言,可重構(gòu)計(jì)算成了AI芯片設(shè)計(jì)的一個(gè)重要研究方向。
二、Thinker AI芯片:語音圖像雙識(shí)別、一節(jié)電池用一年
前年(2016年),依照可重構(gòu)計(jì)算芯片的框架,魏少軍教授團(tuán)隊(duì)中的尹首一副教授帶隊(duì)設(shè)計(jì)研發(fā)了一款代號(hào)為Thinker 1的可重構(gòu)混合神經(jīng)網(wǎng)絡(luò)計(jì)算芯片。
這款芯片不僅可以動(dòng)態(tài)地調(diào)整計(jì)算和內(nèi)存需求,使得芯片能夠支持人臉識(shí)別和語音識(shí)別的神經(jīng)網(wǎng)絡(luò)應(yīng)用,而且芯片的功耗非常小——只需要八節(jié)7號(hào)AA電池就夠讓它運(yùn)行一整年。
Thinker 1不僅在AI性能與算法通用性上取得了突破性的進(jìn)展,還獲得了學(xué)術(shù)界的重要認(rèn)可,在2017 ACM/IEEE ISLPED國際低功耗電子學(xué)與設(shè)計(jì)會(huì)議上,Thinker1獲得了設(shè)計(jì)競賽獎(jiǎng),這是中國大陸單位首次以第一完成單位獲得此獎(jiǎng)項(xiàng)。
魏少軍教授告訴記者,Thinker 1是一塊實(shí)驗(yàn)性質(zhì)的驗(yàn)證芯片,為了證明“軟件定義芯片”這一架構(gòu)在AI芯片設(shè)計(jì)中的可行性——效果出奇的好。隨后,可重構(gòu)計(jì)算團(tuán)隊(duì)又打造了兩款Thinker系列芯片,分別為Thinker 2人臉識(shí)別芯片,能夠做到6ms人臉識(shí)別(iPhone X為10ms)、準(zhǔn)確率超過98%;以及Thinker S語音識(shí)別芯片,不僅功耗只有200多微瓦,只需要一節(jié)7號(hào)AA電池就運(yùn)行一整年,而且可以進(jìn)行聲紋識(shí)別。
▲清華大學(xué)微電子所提供的Thinker芯片的顯微照片
Thinker可以嵌入到很多小型設(shè)備中,包括智能手機(jī)、手表、家用機(jī)器人、或遠(yuǎn)程控制的儀器設(shè)備等。目前,研究團(tuán)隊(duì)與廠商溝通Thinker芯片的產(chǎn)業(yè)化方案,此前也有報(bào)道稱最快今年三月我們就能看到第一款搭載Thinker芯片的端智能產(chǎn)品。不過清華微電子所將會(huì)將這一技術(shù)授權(quán)予企業(yè)使用,高校本身不會(huì)進(jìn)行產(chǎn)業(yè)化。
魏少軍教授說,清華微電子所在可重構(gòu)計(jì)算上已經(jīng)投入了十多年的研發(fā),此前一直將重心放在在其他芯片的研究上,將這一架構(gòu)用于AI芯片的設(shè)計(jì)并且能取得如此好的效果,完全是“意外之喜”。下一步,可重構(gòu)計(jì)算團(tuán)隊(duì)將會(huì)加大基礎(chǔ)研究(尤其是編譯器等相關(guān)軟件)的研發(fā)投入,并且進(jìn)一步推動(dòng)產(chǎn)業(yè)應(yīng)用與企業(yè)合作的進(jìn)程。
除了人工智能(AI)外,這項(xiàng)技術(shù)在信息安全芯片、可編程邏輯器件、可穿戴計(jì)算芯片等領(lǐng)域都獲得了批量應(yīng)用。魏少軍教授帶領(lǐng)的可重構(gòu)計(jì)算團(tuán)隊(duì)也獲得了國家863計(jì)劃兩期支持、2015年國家技術(shù)發(fā)明二等獎(jiǎng)、2014年教育部技術(shù)發(fā)明一等獎(jiǎng)等國家榮譽(yù)。
去年12月,清華微電子所、瀾起科技、英特爾還聯(lián)合推出了基于此項(xiàng)技術(shù)研發(fā)的津逮服務(wù)器CPU,不僅能夠大幅提升云端服務(wù)器的計(jì)算能效,還能實(shí)時(shí)監(jiān)測、甄別和管控,極大增強(qiáng)CPU芯片的硬件安全性。
三、AI芯片廣泛用于安防監(jiān)控?“可能走錯(cuò)路了”
目前AI應(yīng)用仍處于早期階段,主要還是集中在互聯(lián)網(wǎng)應(yīng)用,需要在云端處理,端智能方面并沒有較多普及。
在這一輪興起的人工智能(AI)浪潮中,最為火熱、最頻繁地被人提起的落地行業(yè)莫過于安防了——或者更準(zhǔn)確來說,是基于安防監(jiān)控?cái)z像頭的人臉識(shí)別應(yīng)用。這不僅是眾多AI芯片、AI平臺(tái)應(yīng)用廠商都在瞄準(zhǔn)的行業(yè),各家傳統(tǒng)安防巨頭也都躍躍欲試瞄準(zhǔn)了AI+安防。
然而在交談中,魏少軍教授向記者提到,現(xiàn)在的AI芯片應(yīng)用在視頻監(jiān)控上,很有可能是走錯(cuò)路了。
由于目前的安防監(jiān)控智能化還是以人臉識(shí)別為主,然而在廣場、車站等遠(yuǎn)距離、廣泛監(jiān)控的場景下,根本沒可能看清人臉,
這些場景的人臉識(shí)別項(xiàng)目雖然是個(gè)看似純技術(shù)角度可行的項(xiàng)目,然而一旦設(shè)計(jì)光照、遮擋、攝像頭清晰度、以及可承載的芯片算力、網(wǎng)絡(luò)帶寬等工程化問題,情況就會(huì)變得非常復(fù)雜。
▲2008年北京奧運(yùn)會(huì)人臉票證
一位有著傳統(tǒng)芯片廠商與安防廠商雙背景,曾參與過2008年奧運(yùn)會(huì)“刷臉門票”、天安門廣場安防布控等項(xiàng)目的AI芯片初創(chuàng)CEO也曾經(jīng)告訴我類似的結(jié)果,中遠(yuǎn)距離內(nèi)大型廣場內(nèi)的人臉識(shí)別項(xiàng)目——比如天安門廣場人臉識(shí)別項(xiàng)目——根據(jù)去年天安門分局的調(diào)研結(jié)果顯示,這項(xiàng)目仍舊有著巨大的實(shí)現(xiàn)難度,是個(gè)美好的“理論幻想”。
如果我們按照智能攝像頭車牌識(shí)別的技術(shù)類推,經(jīng)過了十幾年的技術(shù)演進(jìn)、形態(tài)變遷后,目前北京市共有65萬路交通攝像頭,其中能夠進(jìn)行智能車牌識(shí)別的只有公安的3000路、停車場的3萬路,而且是只有在光照、畫面對(duì)其等問題都解決了,才能在特定路口、特定場景下實(shí)現(xiàn)——而人臉識(shí)別遠(yuǎn)比車牌識(shí)別要復(fù)雜得多。
因此,AI安防雖然可以在局部場景(比如中短距離、室內(nèi)監(jiān)控、門禁刷臉、車輛識(shí)別等)落地,但是離真正的安防廣泛應(yīng)用還差得很遠(yuǎn)。魏少軍教授說,AI只是方法、AI芯片只是手段,但是最重要的還是AI的應(yīng)用落地。
結(jié)語:AI芯片2020年或?qū)⑦M(jìn)入洗牌期
魏少軍教授認(rèn)為,我國的芯片工藝技術(shù)與發(fā)達(dá)國家相比,還存在兩三代工藝的差距;我們?cè)瓉硐M?020年以前,與國際最先進(jìn)制造工藝水平的差距,不要大于兩代,現(xiàn)在看來實(shí)現(xiàn)較為困難。此外,在芯片行業(yè)的人才、產(chǎn)能、研發(fā)、設(shè)計(jì)等幾大重要因素上,我們的產(chǎn)業(yè)缺口仍就比較明顯。
我國的芯片產(chǎn)業(yè)目前在高端芯片的發(fā)展上遇到了很多挑戰(zhàn),如果我們依舊遵循傳統(tǒng)的架構(gòu)以跟隨的腳步進(jìn)行發(fā)展,將會(huì)始終落后于人——因此,從芯片設(shè)計(jì)底層架構(gòu)上的創(chuàng)新尤為重要。目前我們?cè)谲浖x芯片、AI芯片等這類傳統(tǒng)芯片業(yè)的“破冰者”方面已經(jīng)取得了不錯(cuò)的研究成績,值得加大投入力度。
魏少軍教授認(rèn)為,從產(chǎn)業(yè)發(fā)展規(guī)律來看,在今明兩年之內(nèi)AI芯片將持續(xù)火熱,大家扎堆進(jìn)入;但是到了2020年前后,則將會(huì)出現(xiàn)一批出局者,行業(yè)洗牌開始。由于目前AI算法還在不斷演進(jìn)匯總的過程中,最終的成功與否則將取決于各家技術(shù)路徑的選擇和產(chǎn)品落地的速度。
評(píng)論