人工智能應用場景眾多,認同AI安防優先落地,有些場景需要在終端實現,對芯片功耗、效率,運算能力要求較高,這是當前AI芯片發展方向,也是制約AI終端應用大范圍落地的瓶頸。深鑒科技就在朝著這個方向努力,從基于FPGA和ASIC芯片的硬件定制化架構,到算法壓縮,深鑒致力于提供高效、低能耗的處理器。當前已有標準化模組產品,助力圖像識別、結構化算法加速,測試結果表明深鑒產品與其他終端處理器相比,在性能、效率方面等均有優勢。
人工智能場景:應用場景眾多,復雜程度不一。主要典型場景如下:
阿爾法狗下圍棋場景:行為較為單一,任務其實相對簡單。
機器人運動場景:人的行走相對復雜,考慮因素眾多,相對復雜。
自動駕駛場景:更為復雜,需要考慮社群行為。即除了自動駕駛行為決策外,還要考慮其他行駛者行為的影響。
行業應用落地場景:認同AI落地第一個場景-AI安防的觀點。
當前AI安防已經有大量需求,2016年安防監控出貨量:1億4千萬個模組和傳感器。安防主要部署在終端,對處理器的成本、帶寬,延時等性能都有較高要求。
其他終端應用場景:機器人和無人機
要求:時延低,功耗低,價格敏感,是AI具有挑戰性場景。
目前市場上已經有消費類產品:家庭陪伴機器人,掃地機器人,家庭語音聊天機器人等。主要是通過云端進行語音識別進行人機交互。
還有提升空間,核心處理轉移到前端將會帶來市場空間。
AI處理器現狀,目前尚處于早期,效率,功耗等均有待提高。阿爾法狗戰勝李世石用了2千個CPU,3千個GPU,同時還花費電費3千美元,難以在現實場景應用。AI真實場景應用,對計算能力,功耗,開發門檻要求較高。終端應用對功耗要求更高,無論是終端還是云端都面臨成本壓力:降低前期投入成本和后期運維成本。
AI三個關鍵因素:數據,算法,硬件。當前許多AI處理都在是云端完成,因為需要計算集群提供強大運算能力,短時間完成算法優化、數據清洗、適配,訓練數據,快速迭代。但是有些場景不適用云端場景:延時要求較高的場景。終端設備無需連接服務器、延時較低,可以適用這些場景。預計未來終端應用將會增加,數據也越來越多,形成數據量和處理能力之間的剪刀差。這是阻礙AI大范圍應用的主要因素。
當前大量公司開發硬件,基本所有AI相關公司都有想法或已經付諸行動,部署相應加速硬件。未來趨勢,未來AI大規模應用落地,高效、合適的計算平臺是必要條件。
深度學習處理器:大公司都在做,比如谷歌,百度,英偉達為典型。
創業公司主要有:寒武紀、深鑒科技、地平線機器人等等。
大家共同的目標:便宜高效完成AI計算。
深鑒科技主要擅長:
1.硬件加速:基于賽靈思的FPGA硬件和ASIC專為深度學習定制,設計專門AI硬件架構。
2.算法壓縮和量化:人類神經元數量連接數量3-5歲達到最高峰,十幾歲人腦功能達到穩定,連接數減少到2/3-3/4。這一階段是學習最快的階段,大腦會自動砍掉無效連接。算法壓縮就在做同樣的事,在不損失精度情況下壓縮網絡。對模型進行剪枝、壓縮、量化,在不損精度情下,可以將運算速度提升數倍至數十倍。
測試1.分類網絡壓縮:
對分類網絡做壓縮前后,兩類不同對象處理性能對比:可以在將模型壓縮到51%神經元的情況下,達到同樣精度,大大提高處理速度。
測試2.SSD網絡壓縮:
測試表明:可以在實現相同精度情況下,將網絡縮小至10%。也就是原來一秒1張圖片,現在可處理10張圖片。
功耗需求:
面向AI終端定制芯片的目標功耗是:1-10W區間,這一領域尚處空白,各公司均向這方向努力。
橫坐標:功耗,縱坐標:運行速度,斜率越高效率越高。
1-10w的紅圈區域:空白區。當前IOT功耗是幾十-幾百W,需要大規模量產化才能降低成本,并且幾十W難以作為應用端芯片。其他性能強大的芯片過高功耗,需要的成本較高。
測試3.效率比較:
衡量芯片兩個關鍵指標:峰值性能:取決于公司的技術水平以及財力,較高工藝需要較大成本。
效率:取決于公司技術情況。
效率定義:運行時工作芯片單元占總芯片單元數比重,即100個計算單元,每個時鐘周期有多少在工作。
深鑒科技可達50%以上;iphone8可以達到20-40%;Kirin970:20%左右。
深鑒科技產品:
當前市場主流AI應用場景:安防,數據中心,機器類相關。深鑒科技也都在做。
深鑒目前標準量產化產品:前端智能模組,可以提高前端運算能力。可以通過增加硬件的方式,實現支持多路、實時視頻處理,可以輔助進行人臉識別,結構化模型處理。
-
人工智能
+關注
關注
1806文章
49000瀏覽量
249262 -
神經元
+關注
關注
1文章
368瀏覽量
18831 -
AI芯片
+關注
關注
17文章
1983瀏覽量
35894
原文標題:全球人工智能AI芯片有望提前在安防領域落地
文章出處:【微信號:ittbank,微信公眾號:ittbank】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論