近日,由電子發燒友主辦的“2019年人工智能技術峰會”在深圳成功舉行。本次峰會以“加速人工智能技術落地”為主題,匯聚了人工智能產業鏈上下游領先企業,超過一千名專業觀眾,近30位企業高管、行業專家縱論產業發展之道,從不同領域、不同產業環節出發,對2019年人工智能在中國市場的進一步落地,進行了探討及預測。
rm中國市場部負責人梁泉與Arm中國AI產品經理楊磊也參與演講,為現場的觀眾帶去了Arm中國對于人工智能技術市場的預測以及Arm中國周易人工智能平臺的最新進展。
連接無處不在,如何把AI“放”進每個終端?
回顧計算發展的歷史,梁泉表示經歷了主機計算時代、個人計算和軟件、互聯網、移動和云計算這四次浪潮,第五次浪潮將是一個由數據驅動的全面計算時代,Arm生態系統在這波浪潮中將迎來巨大的機遇,推動經濟增長及社會進步。但是,只有把當前的先進技術轉化為堅實的業務,第五次浪潮才會成為現實。
Arm中國市場部負責人梁泉
根據Arm此前的預測,到2035年,全球將有一萬億設備實現互聯。飛速發展的物聯網已成為人類文明史中推進速度最快的新興經濟體系,全球累計物聯網設備產生的新產值已達到30萬億美元,而在接下來的20年內,預計累計中國物聯網相關設備及產值就將達到60萬億元以上。
此外,機器學習算法和深度學習芯片組在取得不斷突破的同時,AI也持續向不同垂直行業領域、邊緣終端縱橫滲透,賦能邊緣設備發展,應用于每個IoT終端節點,從軟/硬兩方面實現降本增效及體驗升級。整個AI產業生態正在構建,新的秩序正在形成。“目前,90%的AI智能設備都基于Arm IP,Arm IP極大驅動了人工智能和機器學習技術的發展。Arm希望與合作伙伴共建面向未來的智能生態,實現這些優勢。”梁泉強調道。
在此大趨勢下,如何滿足嵌入式平臺日益增長的人工智能智能處理需求?梁泉指出,分布式計算成為未來方向,邊緣處理在帶寬、電源、成本、延遲、可靠性和安全性方面提供了好處。因為并非所有數據都需要發給數據中心去處理,在數據被搜集和使用的節點也應該具有這一能力。這意味著不僅要在筆記本電腦處理器中啟用這種邊緣處理能力,還要在性能、功耗和內存方面有限的小型嵌入式設備上實現這種計算水平。
此外,梁泉還提到,去年Arm中國推出的本土工程團隊第一個成果——周易人工智能平臺,采用完全自主開發的AI處理器和軟件框架,讓芯片廠商能夠在現有的技術能力上,快速部署人工智能計算的算力,在同等的成本功耗情況下,能做到人工智能應用所需要的算力。它的核心包含兩部分,一是Tengine軟件框架,二是AIPU(人工智能處理單元),主要處理卷積神經網絡、深度神經網絡為代表的AI計算。從優化端側芯片開發的角度看,周易平臺降低了兩個門檻:一方面是SoC集成AI功能的設計門檻,另一方面是上層軟件的開發門檻。
梁泉表示:“未來的智能生態,所有基礎革命都必須通過開放生態系統把成本功耗降下來,又能通過共同的標準和體系讓大家協作,在同一個開發環境中,把應用服務做好。”
周易AIPU賦能邊緣AI設備
眾所周知,過去幾年AI從一個被輕視的學術冷門研究突然爆紅,一路狂奔到商業化的最前沿,在安防、金融、教育、制造、家居、娛樂等各個與人們生活息息相關的領域掀起了一股智能化升級和萬物互聯的颶風。
Arm中國AI產品經理楊磊
而在Arm中國AI產品經理楊磊看來,AI芯片的基礎技術格局可分為云端和邊緣端,目前AI訓練基本上都是在云端進行的,需要用到的芯片主要是CPU、GPU和TPU等計算能力相對更強的芯片;但AI推理就不同了,有在云端進行的,也有在設備端進行的,而且現在越來越多的推理被放到了邊緣側實現。這就導致了目前人工智能應用面臨以下三大挑戰:
一、數據隱私性。目前人工智能應用最多的領域是視頻和圖片,以及自然語音處理,這些數據的處理基本都是在云端進行的,但這些數據傳到云端后會有一個隱私問題,有些數據人們其實是不想傳送到云端的。
二、算力問題。由于AI需要做的事情很多,比如物體檢測、人體檢測和識別、跟蹤,以及行為分析等等,加上現在的攝像頭分辨率越來越高,從720p 到 1080p ,再到4K,使得AI對算力的要求越來越高。這就要求芯片具有更高的性能,從幾百GOPS到幾TOPS。
三、功耗問題。因為邊緣側功耗限制,設備一般只有幾瓦,留給AI運算的部分只有幾百mW到2W,這就需要新技術來應對這個難題。
為了應對這三大挑戰,Arm中國周易人工智能平臺,使用的AI處理器Zhouyi AIPU,采用了全新的為AI設計的專用指令集,具有高性能和高靈活性,單核有0.5、1、2、4TOPS可選,還支持多核;是一個具有硬件IP、軟件SDK和NBB的全棧解決方案;更重要的是,它支持安全擴展。
具有周易AIPU的參考芯片框架圖
全新的專用指令集是如何實現高性能和高靈活性的呢?楊磊解釋說,這是因為Arm采用了不同顆粒度的指令集,客戶可以根據自己的需求用類似搭積木的方式來設計自己的AI處理器。“指令集根據運算能力從小到大,可分為標量指令、向量指令和面向AI硬件加速的AI固定指令。”此外,為了滿足定制化和差異化需求,周易人工智能平臺還支持用戶根據特定場景,自定義擴展AI Fix Function指令。現場Arm中國的展示臺上,秀出的16通道人臉識別監控系統Demo,正是由于周易平臺Framework作加速,支持的通道數很多,處理速度也得到了進一步的加快。
楊磊還特別指出,在人工智能開發過程中工具鏈也是相當重要的,Arm可以提供完整的工具鏈供工程師使用。其“一鍵式”周易軟件工具鏈,包括比如Build Tool/Driver、性能優化庫、軟件仿真器,以及AI算法示例等,可以實現一鍵從算法模型到周易可執行文件生成。
邊緣計算已經成為未來趨勢。在物聯網應用中,讓智能思考留在本地,其不僅可以降低功耗、降低時延、節約帶寬,而且能夠提高設備的獨立性、安全性和私密性。“要通過邊緣計算實現物聯網設備的本地計算,需要具備以下幾方面先決條件:具備優化的DSP,充分保證功能性安全,以及安全的平臺架構、異構系統架構、機器學習能力、可擴展處理能力,而Arm也在提供周易人工智能平臺這樣的全棧式解決方案積極促進邊緣智能計算的應用落地。”楊磊強調道。
-
ARM
+關注
關注
134文章
9169瀏覽量
369243 -
互聯網
+關注
關注
54文章
11187瀏覽量
103874 -
計算機
+關注
關注
19文章
7540瀏覽量
88649 -
人工智能
+關注
關注
1796文章
47683瀏覽量
240313
原文標題:加速人工智能技術落地,揭秘Arm中國的AI布局路線圖
文章出處:【微信號:arm_china,微信公眾號:Arm芯聞】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
關于RISC-V學習路線圖推薦
嵌入式和人工智能究竟是什么關系?
《AI for Science:人工智能驅動科學創新》第6章人AI與能源科學讀后感
AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感
《AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得
《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得
人工智能ai4s試讀申請
名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅動科學創新
報名開啟!深圳(國際)通用人工智能大會將啟幕,國內外大咖齊聚話AI
RISC-V在中國的發展機遇有哪些場景?
FPGA在人工智能中的應用有哪些?
2024學習生成式AI的最佳路線圖
![2024學習生成式<b class='flag-5'>AI</b>的最佳<b class='flag-5'>路線圖</b>](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
評論