電子發(fā)燒友網(wǎng)報道(文/李彎彎)智能駕駛是未來的必然趨勢,近幾年汽車智能化技術越來越成熟,同時政府也在不斷出臺新政策,支持和鼓勵智能駕駛的穩(wěn)步發(fā)展。
未來幾年汽車智能化商業(yè)進程將持續(xù)加速,數(shù)據(jù)顯示,2025年全球自動駕駛汽車出貨量預計達5000萬臺,中國L2級以上智能汽車銷量將破1000萬臺,智能汽車滲透率將達50%。
在不久前某論壇上,后摩智能創(chuàng)始人&CEO吳強博士談到,智能駕駛規(guī)模化商用需要滿足3個要素,一是強智能,二是低成本,三是安全性,而這也對智能駕駛計算芯片提出了新的要求,需要未來的智能駕駛芯片滿足大算力、低功耗、低成本、高可靠的要求。
而從當前的情況來看,矛盾點在于:需求側,算力需求在不斷增長,原因是智能汽車配備的傳感器數(shù)量持續(xù)增加和升級,需要處理的數(shù)據(jù)量越來越大,比如2019年Model3,配備傳感器21個,包括8個120萬像素攝像頭,12個超聲波雷達,1個毫米波雷達,算力為144T;到2022年,蔚來ET7,配備了33個傳感器,包括7個800萬像素攝像頭,4個300萬攝像頭,12個超聲波雷達,5個毫米波雷達,1個激光雷達,算力達到1000T。
另外算法越來越復雜,芯片需要更高的開放度,未來OTA升級需進行算力預埋,比如新勢力車廠預埋的算力就超過500T,包括蔚來、理想、小鵬等。
而供給側,傳統(tǒng)方案面臨挑戰(zhàn),比如依賴先進制程和工藝,3nm/5nm先進制程成本昂貴,HBM/3D封裝依賴先進IP,需要犧牲通用性換取計算效率,算法和芯片高度耦合。
也就是說,傳統(tǒng)方案成本昂貴,且依賴少數(shù)國際大廠的IP,功耗過高,增加散熱系統(tǒng)成本,高度耦合的封閉方案無法支持未來的算法演進和OTA升級,那么可以如何解決呢?吳強博士認為,創(chuàng)新計算架構存算一體,是解決智能駕駛算力和功耗難題很好的方式。
存算一體是與傳統(tǒng)馮諾伊曼架構安全不同的架構形式,即直接在存儲內做計算,過去幾年國內外不少芯片巨頭和初創(chuàng)企業(yè)投入到存算一體技術的研究中,目前已經(jīng)在終端一些應用領域實現(xiàn)商用,隨著技術的不斷進步,有企業(yè)逐漸將產(chǎn)品推向邊緣、汽車等應用領域。
相比較來看,存算一體的優(yōu)勢體現(xiàn)在幾個方面,一、可以做到更高的有效算力,突破1000TOPS,成本低,不依賴于先進工藝、3D封裝等昂貴的技術;二、低功耗,相同算力下,AI部分能效比2-3個數(shù)量級提升,更低散熱成本,更高可靠性;三、低延時,較GPU延時有2-10倍提升,更高的安全性;四、弱工藝依賴,不依賴先進工藝,可以用成熟制程,更好應對供應鏈被壓制的挑戰(zhàn)。
比如在散熱方面,汽車最好的方式是采用自然風冷,功耗小于15W,成本低可靠性高,維修成本低,而馮諾伊曼架構,自然風冷功耗限制下,物理算力約只能做到20TOPS,存算一體架構,自然風冷功耗限制下,物理算力可以超過60TOPS。從這個層面來看,對于未來的智能駕駛汽車來說,存算一體架構會更加合適。
從電子發(fā)燒友的了解來看,目前后摩智能在將存算一體推向智能駕駛領域方面是最為領先的,這家公司于2020年9月完成天使輪融資,2020年11月正式成立,啟動存算一體大算力AI芯片的研發(fā),2022年4月已經(jīng)完成PreA+輪融資。
該公司在2021年8月完成首顆芯片技術驗證流片,據(jù)吳強介紹,后摩智能首顆芯片,算力20T@INT8(可擴展到200T+),已成功跑通自動駕駛典型算法,完成11個類別的檢測、識別、語義分割,是存算一體芯片首次達到運行智能駕駛的復雜AI場景所需算力和精度要求。
根據(jù)規(guī)劃,2022年到2025年間,后摩智能將主要基于SRAM,推出系列產(chǎn)品,包括HM300,HM500,HM1000,算力從30Tops@INT8提升到500Tops@INT8,能效比實現(xiàn)10倍提升;到2025年之后,將推出基于MRAM/RRAM的產(chǎn)品系列,包括HM310,HM510,HM1010,實現(xiàn)算力從50Tops@INT8到2000Tops@INT8突破,能效比的提升100倍。
另外,后摩智能的存算一體芯片,采用類CUDA的編程模式,這樣可以降低客戶應用的開發(fā)成本,支持TensorFlow、PyTorch、ONNX等算法框架。
就如上文所言,未來幾年中國汽車智能化將會持續(xù)加速發(fā)展,這必將帶動上游芯片、零部件的持續(xù)創(chuàng)新,雖然從目前來看,存算一體芯片還未真正在智能駕駛汽車上實現(xiàn)商用落地,不過存算一體創(chuàng)新架構在算力、功耗等方面的優(yōu)勢確實明顯。相信未來在技術的不斷更迭,以及智能駕駛汽車市場的驅動下,將會逐漸取得成績,當然作為一項新興技術,面臨的困難也是不言而喻的。
未來幾年汽車智能化商業(yè)進程將持續(xù)加速,數(shù)據(jù)顯示,2025年全球自動駕駛汽車出貨量預計達5000萬臺,中國L2級以上智能汽車銷量將破1000萬臺,智能汽車滲透率將達50%。
在不久前某論壇上,后摩智能創(chuàng)始人&CEO吳強博士談到,智能駕駛規(guī)模化商用需要滿足3個要素,一是強智能,二是低成本,三是安全性,而這也對智能駕駛計算芯片提出了新的要求,需要未來的智能駕駛芯片滿足大算力、低功耗、低成本、高可靠的要求。
而從當前的情況來看,矛盾點在于:需求側,算力需求在不斷增長,原因是智能汽車配備的傳感器數(shù)量持續(xù)增加和升級,需要處理的數(shù)據(jù)量越來越大,比如2019年Model3,配備傳感器21個,包括8個120萬像素攝像頭,12個超聲波雷達,1個毫米波雷達,算力為144T;到2022年,蔚來ET7,配備了33個傳感器,包括7個800萬像素攝像頭,4個300萬攝像頭,12個超聲波雷達,5個毫米波雷達,1個激光雷達,算力達到1000T。
另外算法越來越復雜,芯片需要更高的開放度,未來OTA升級需進行算力預埋,比如新勢力車廠預埋的算力就超過500T,包括蔚來、理想、小鵬等。
而供給側,傳統(tǒng)方案面臨挑戰(zhàn),比如依賴先進制程和工藝,3nm/5nm先進制程成本昂貴,HBM/3D封裝依賴先進IP,需要犧牲通用性換取計算效率,算法和芯片高度耦合。
也就是說,傳統(tǒng)方案成本昂貴,且依賴少數(shù)國際大廠的IP,功耗過高,增加散熱系統(tǒng)成本,高度耦合的封閉方案無法支持未來的算法演進和OTA升級,那么可以如何解決呢?吳強博士認為,創(chuàng)新計算架構存算一體,是解決智能駕駛算力和功耗難題很好的方式。
存算一體是與傳統(tǒng)馮諾伊曼架構安全不同的架構形式,即直接在存儲內做計算,過去幾年國內外不少芯片巨頭和初創(chuàng)企業(yè)投入到存算一體技術的研究中,目前已經(jīng)在終端一些應用領域實現(xiàn)商用,隨著技術的不斷進步,有企業(yè)逐漸將產(chǎn)品推向邊緣、汽車等應用領域。
相比較來看,存算一體的優(yōu)勢體現(xiàn)在幾個方面,一、可以做到更高的有效算力,突破1000TOPS,成本低,不依賴于先進工藝、3D封裝等昂貴的技術;二、低功耗,相同算力下,AI部分能效比2-3個數(shù)量級提升,更低散熱成本,更高可靠性;三、低延時,較GPU延時有2-10倍提升,更高的安全性;四、弱工藝依賴,不依賴先進工藝,可以用成熟制程,更好應對供應鏈被壓制的挑戰(zhàn)。
比如在散熱方面,汽車最好的方式是采用自然風冷,功耗小于15W,成本低可靠性高,維修成本低,而馮諾伊曼架構,自然風冷功耗限制下,物理算力約只能做到20TOPS,存算一體架構,自然風冷功耗限制下,物理算力可以超過60TOPS。從這個層面來看,對于未來的智能駕駛汽車來說,存算一體架構會更加合適。
從電子發(fā)燒友的了解來看,目前后摩智能在將存算一體推向智能駕駛領域方面是最為領先的,這家公司于2020年9月完成天使輪融資,2020年11月正式成立,啟動存算一體大算力AI芯片的研發(fā),2022年4月已經(jīng)完成PreA+輪融資。
該公司在2021年8月完成首顆芯片技術驗證流片,據(jù)吳強介紹,后摩智能首顆芯片,算力20T@INT8(可擴展到200T+),已成功跑通自動駕駛典型算法,完成11個類別的檢測、識別、語義分割,是存算一體芯片首次達到運行智能駕駛的復雜AI場景所需算力和精度要求。
根據(jù)規(guī)劃,2022年到2025年間,后摩智能將主要基于SRAM,推出系列產(chǎn)品,包括HM300,HM500,HM1000,算力從30Tops@INT8提升到500Tops@INT8,能效比實現(xiàn)10倍提升;到2025年之后,將推出基于MRAM/RRAM的產(chǎn)品系列,包括HM310,HM510,HM1010,實現(xiàn)算力從50Tops@INT8到2000Tops@INT8突破,能效比的提升100倍。
另外,后摩智能的存算一體芯片,采用類CUDA的編程模式,這樣可以降低客戶應用的開發(fā)成本,支持TensorFlow、PyTorch、ONNX等算法框架。
就如上文所言,未來幾年中國汽車智能化將會持續(xù)加速發(fā)展,這必將帶動上游芯片、零部件的持續(xù)創(chuàng)新,雖然從目前來看,存算一體芯片還未真正在智能駕駛汽車上實現(xiàn)商用落地,不過存算一體創(chuàng)新架構在算力、功耗等方面的優(yōu)勢確實明顯。相信未來在技術的不斷更迭,以及智能駕駛汽車市場的驅動下,將會逐漸取得成績,當然作為一項新興技術,面臨的困難也是不言而喻的。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
智能駕駛
+關注
關注
4文章
2815瀏覽量
49983 -
存算一體
+關注
關注
0文章
109瀏覽量
4670
發(fā)布評論請先 登錄
相關推薦
熱點推薦
緩解高性能存算一體芯片IR-drop問題的軟硬件協(xié)同設計
在高性能計算與AI芯片領域,基于SRAM的存算一體(Processing-In-Memory, PIM)架構因兼具計算密度、能效和精度優(yōu)勢成

國際首創(chuàng)新突破!中國團隊以存算一體排序架構攻克智能硬件加速難題
2025 年 6 月 25 日,北京大學團隊在智能計算硬件方面取得領先突破,國際上首次實現(xiàn)了基于存算一體技術的高效排序硬件架構 (A fas

蘋芯科技 N300 存算一體 NPU,開啟端側 AI 新征程
隨著端側人工智能技術的爆發(fā)式增長,智能設備對本地算力與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構在數(shù)據(jù)處理效率上存在瓶頸,“內存墻”問題成為制

大算力芯片的生態(tài)突圍與算力革命
電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)大算力芯片,即具備強大計算能力的集成電路芯片,主要應用于高性能計算(HPC)、人工智能(AI)、數(shù)據(jù)中心、
濟南市中區(qū)存算一體化智算中心上線DeepSeek
濟南市中未來產(chǎn)業(yè)發(fā)展有限公司(簡稱“市中產(chǎn)發(fā)”)聯(lián)合華為、北京昇騰和清昴智能基于市中區(qū)存算一體化智算中心(國家大學科技園節(jié)點)昇騰
梯度科技推出DeepSeek智算一體機
近日,梯度科技搭載DeepSeek大模型的智算一體機正式發(fā)布。該產(chǎn)品基于“國產(chǎn)服務器+國產(chǎn)GPU+自主算法”核心架構,搭載梯度科技人工智能應用開發(fā)平臺,形成了軟硬
存算一體行業(yè)2024年回顧與2025年展望
2024年,大模型技術的迅猛發(fā)展成為人工智能領域的核心驅動力,其對硬件算力和存儲效率的極致需求,促使存算

開源芯片系列講座第24期:基于SRAM存算的高效計算架構
鷺島論壇開源芯片系列講座第24期「基于SRAM存算的高效計算架構」明晚(27日)20:00精彩開播期待與您云相聚,共襄學術盛宴!|直播信息報告題目基于SRAM

直播預約 |開源芯片系列講座第24期:SRAM存算一體:賦能高能效RISC-V計算
鷺島論壇開源芯片系列講座第24期「SRAM存算一體:賦能高能效RISC-V計算」11月27日(周三)20:00精彩開播期待與您云相聚,共襄學術盛宴!|直播信息報告題目SRAM

存算一體化與邊緣計算:重新定義智能計算的未來
隨著數(shù)據(jù)量爆炸式增長和智能化應用的普及,計算與存儲的高效整合逐漸成為科技行業(yè)關注的重點。數(shù)據(jù)存儲和處理需求的快速增長推動了對計算架構的重新設計,“存算

存算一體架構創(chuàng)新助力國產(chǎn)大算力AI芯片騰飛
在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《存算一體架構創(chuàng)新助力國產(chǎn)大
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽
、GPU、NPU,給我們剖析了算力芯片的微架構。書中有對芯片方案商處理器的講解,理論聯(lián)系實際,使讀者能更好理解
發(fā)表于 10-15 22:08
科技新突破:首款支持多模態(tài)存算一體AI芯片成功問世
存算一體介質,通過存儲單元和計算單元的深度融合,采用22nm成熟工藝制程,有效把控制造成本。與傳統(tǒng)架構下的AI芯片相比,該款
發(fā)表于 09-26 13:51
?671次閱讀

蘋芯科技引領存算一體技術革新 PIMCHIP系列芯片重塑AI計算新格局
智能芯片國產(chǎn)化再傳利好,8月8日,國際領先的存算一體芯片開拓者——蘋芯科技在北京召開 “
發(fā)表于 08-08 17:21
?404次閱讀

評論