91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

云天勵飛IPU成功流片,比特大陸第二代AI芯片曝光!

羅欣 ? 來源:芯智訊 ? 作者:佚名 ? 2018-08-22 10:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著人工智能市場的火爆,越來越多的芯片廠商開始推出AI芯片,與此同時很多AI算法廠商也開始紛紛推出自己的AI芯片。一時間AI芯片已成為當下最為市場最為關注的焦點。

早在去年11月,礦機芯片廠商比特大陸就推出了自己的首款人工智能芯片BM1680;今年年初,國內的聲紋識別廠商Speakin也曝光了自己的即將推出的聲紋識別模組;今年4月,國內的人臉識別廠商云天勵飛也確認將會在年內推出自己的AI芯片;5月16日,云知聲發布首款面向物聯網領域的AI系列芯片UniOne以及第一代芯片“雨燕”;5月24日,出門問問發布旗下首款AI語音芯片模組問芯Mobvoi A1;7月2日,Rokid發布旗下AI語音專用SoC芯片KAMINO18;而在同一時間,語音識別廠商思必馳CEO高始興也確認公司正在打造AI語音ASIC芯片,預計今年下半年流片。

近日,云天勵飛首款自主知識產權的AI芯片IPU已成功流片。與此同時,比特大陸的第二代AI芯片BM1682正式曝光。下面我們來看詳細介紹:

云天勵飛自主產權AI芯片IPU已于16日流片

今年4月25日,在云天勵飛召開的芯片專題媒體溝通會上,云天勵飛聯合創始人、CEO陳寧提到,云天勵飛正在研發的一款面向嵌入式端的邊緣人工智能芯片IPU (inteligence processor unit)已取得階段性成果,計劃今年年中流片,明年上半年正式商用。時隔僅不到4個月之后,8月16日,云天勵飛的IPU已成功流片。

云天勵飛IPU聚焦嵌入式視覺智能終端

據介紹,云天勵飛AI芯片的技術路線是通過設計一系列面向多層神經網絡的可編程處理器,應對人工智能算法的快速迭代。“我們首創的‘自適應云+端’AI系統架構,可通過云端邏輯控制終端芯片,自動更新終端芯片的算法和功能。”據云天勵飛聯合創始人、CEO陳寧介紹,云天勵飛自主研發的專用深度學習神經網絡處理器芯片,采用ASIP設計思路,提供ASIC級別高性能和低功耗,也能提供處理器級別的指令集靈活性。同時,采用異構計算多核SOC架構,集成多處理器單元,并行分布式處理與集中控制系統。

與傳統芯片迭代速度相比,AI芯片迭代更快。“目前來說,算法每半個月迭代一次,AI芯片則要同步迭代,而傳統芯片的迭代是按年計算。現有的CPUGPU無法滿足嵌入式端視覺AI應用。”據云天勵飛研發副總李愛軍表示,通用CPU在神經網絡加速上速度慢,性能上滿足不了對嵌入式端的需求;GPU性能是夠的,但功耗高、成本居高不下。“所以,我們覺得有必要去研究適應新型神經網絡的深度學習處理器架構芯片。”而云天勵飛研發的芯片是面向嵌入式端的邊緣計算人工智能芯片,專注智能視覺,聚焦在安防、智能商業等領域的場景應用。

擁有國內頂尖ASIP矢量處理器芯片設計團隊

“云天勵飛做芯片不是臨時起意,而是從公司創立之初就開始了芯片的布局。”據陳寧介紹,云天勵飛早在2014年就有了完整的“機器學習與視覺智能處理器”AI芯片解決方案,并獲得2015年深圳孔雀團隊第一名。

在當時,云天勵飛的芯片研發團隊是國內AI芯片界唯一有芯片商用經驗的團隊,陳寧本人是中國第一款商用矢量處理器芯片的設計者,而芯片團隊主導者李愛軍是原中興通訊手機芯片的研發負責人,主導研發了國內第一顆28nm手機芯片商用(2010)和國內首款LTE多模手機芯片商用。

陳寧說,“我們的芯片研發團隊是國內頂尖的ASIP矢量處理器芯片設計團隊,主要的骨干團隊成員有豐富的矢量處理器、復雜SoC芯片設計經驗,且平均設計經驗超過10年。”

IPU具有高能低耗、可編程、可云端升級等特點

據了解,云天勵飛在2016年完成了第一代深度學習神經網絡處理器NNP100的研制,并基于FPGA載體實現商用。

李愛軍介紹說,NNP100深度結合云天勵飛自研深度學習算法,與自研神經網絡模型深度耦合,具有強大的運算處理能力以及靈活的模型pooling能力,設計上支持PE數量根據場景需求任意擴展和裁剪,非常靈活,同時它又具有高性能、低時延和低功耗技術優勢。

“相比之前的應用效果,采用NNP100后FPGA加速卡,計算性能相比GPU提升2倍,功耗減低5 倍,時延減低100倍。”李愛軍介紹,目前NNP100應用在云天勵飛的DeepEye100智能盒子和DeepEye200服務器加速卡產品上。基于NNP100的技術基礎,云天勵飛已經在研發第二代深度學習神經網絡處理器NNP200,并取得階段性成果。NNP200將集成于云天勵飛IPU (inteligence processor unit)芯片上,并用于智能終端產品。

據介紹,云天勵飛的視覺AI芯片具有2Tops/W的高能量效率。與Nvidia開源的nvDLA相比,相同運算力下,在很小的內存帶寬下,算法模型效率可以提高18倍。與麒麟970相比,相同運算力下,比970的性能提高4.4倍。

“云天的芯片除了高能低耗的優勢之外,還能實現可編程,遠程一鍵升級。芯片可同時處理多路高清視頻,此外,通過片間級聯還可進行擴展。”李愛軍說,多芯片級聯,相當于搭積木一樣,一顆一顆之間通過板級互聯進行擴展。通過級聯擴展最多可以同時處理64路視頻。

“我們采用業界領先的22nm工藝,工藝的性能、功耗、面積經過仿真、分析、比對,對比業界主流的28nm工藝,都具有一定優勢,性能提升約10%,功耗降低約15%,面積減小15%-20%。”陳寧還提到,云天勵飛的IPU芯片計劃在今年年中實現流片,并在明年上半年推向商用,最終通過模式創新,打造一個開放賦能的芯片平臺。

云天IPU最大亮點——對場景理解更為深刻

相比傳統的芯片,AI芯片更注重“從場景到算法,從算法到芯片”。正因為不同于以往從硬件出發的思路,AI芯片的行業形態和商業模式正在發生著變化。目前,AI芯片的應用場景主要集中在安防、智能家居消費電子自動駕駛云計算、智慧城市等行業。

“由于目前還不存在適用于所有通用算法的嵌入式AI芯片,確定芯片的應用場景就顯得尤為重要。”陳寧提到,過往三年,云天勵飛深耕安防領域,最先提出了針對安防行業“云+端”的解決方案,真正做到將AI技術落地于垂直場景。

來源: 智能科技熱點

深度分析:比特大陸二代AI芯片性能躍升,專注安防視頻

近日,坊間傳聞許久的比特大陸第二代人工智能芯片BM1682,正式出現在其官網頁面。根據比特大陸一貫神秘務實的風格,相信基于BM1682的板卡、服務器也已經備好了。筆者在芯片行業浸淫十多年,嘗試根據比特大陸官網公布的產品白皮書,來分析一下這兩代人工智能芯片之間的異同,嘗試談一談比特大陸在人工智能領域的意圖和野心。

2017年第4季度,比特大陸正式推出了其人工智能品牌算豐(SOPHON),發布了全球首款公開發售的TPU(Tensor Processing Unit張量計算單元)芯片BM1680,專門用于人工智能中的深度學習加速。時隔不足一年,2018年3月,比特大陸又推出其第二款TPU芯片BM1682,根據初步披露的資料顯示,BM1682是一塊專門用于圖像/視頻處理方向的人工智能芯片。

BM1682與BM1680使用了相同的深度學習算法的硬件加速模塊,但相比BM1680而言,BM1682具有更強大的深度學習算法執行能力,此外BM1682還增加了視頻處理子模塊,以及適用于具體應用場景的諸多功能模塊。

下面我們對其兩者進行一個具體的對比評測:

頂層架構——BM1682定位更細分

從頂層架構可以看出,BM1680和BM1682均集成了深度學習算法所用到的核心模塊NPUs。NPU是比特大陸自行研發的深度學習算法硬件加速器,用于加速深度學習算法的執行速度。

從頂層架構圖上可以看到,BM1680比BM1682額外集成了高度定制的BMDNN Chip Link Subsystem。該子模塊可以在高速SerDes上提供穩定、靈活、低延遲的鏈路。用戶可以通過該鏈路將多個BM1680芯片連接成一個統一的整體,使其協同工作,大大提高系統的運算能力。BM1682并沒有集成此模塊,這大概是基于BM1682專一化的市場應用定位,以及處理速度足夠滿足用戶對圖像/視頻處理需求而考慮的。

從頂層架構圖上可以看到與BM1680相比,BM1682芯片的整體架構發生了不小的變化,其定位則更加細分明確。從右上角增加的Video Subsystem模塊可以明確看出,該款芯片定位于圖像/視頻處理方向。

模塊細節——BM1682設計更豐富

BM1682的深度學習加速的核心功能模塊與BM1680是相同的。兩款芯片均包含了深度學習的核心單元—硬件加速器NPU Subsystem。兩者的NPU Subsystem均各自集成了64個NPU單元,統一由NPU Schedule Engine進行調度(BM1682架構圖中未體現),最大化的提高了NPUs的效率,加快了深度學習算法inference (推演)與training (訓練)的速度。根據初步資料顯示,兩者在MCU的配置上是有些許差異的,但由于資料不全面,故無法評斷出兩者的MCU處理能力的差別。

除了深度學習算法硬件加速模塊(NPUs)、用于高速連接其余BM1680的Chip Link模塊之外,BM1680還提供了4個獨立的DDR4通道,最高支持16GB的DDR3 或 DDR4 DRAM拓展,用于高速數據緩存讀取,以提高系統的執行速度。BM1680還加入了Global DMA模塊。DMA用于提供數據搬移功能,這可以在大塊數據進行讀寫搬移時不占用MCU的資源,如在DDR4 的RAM中搬移數據時。對于大數據量的深度學習系統,DMA可以極大的提高效率。BM1680的Peripheral Subsystem 提供了UART、SPI、IIC與GPIO等接口,用于外接傳感器,或與外界進行通訊、記錄、控制等操作。這些接口都屬于通用接口,可見BM1680的定位就是通用深度學習芯片,在外設上沒有給與太多支持。

從架構圖看,BM1682明顯復雜了很多。其額外增加了AP (Application Processor) Subsystem和Video Subsystem(視頻處理系統)。Video Subsystem(視頻子系統)則主要專注于視頻預處理的相關任務。

BM1682的Video Subsystem提供了2個H.264視頻解碼器,1個H.265解碼器。H.264 /H.265均為視頻編碼方式,也是比較流行的視頻編碼的兩種方式。相對而言,H.265視頻編碼比H.264具有更高的壓縮比、更強的網絡糾錯適應能力,但考慮到現階段在安防、智能家居和互聯網視頻領域中仍然還是以H.264編碼的視頻和視頻設備為主,兩者2:1的譯碼器數量在視頻支持類型和解碼帶寬做了一個合適的權衡。比較貼心的是,BM1682提供了Video Post-Processing功能,該子模塊用于對采用H.264或H.265編碼的視頻進行渲染處理,這些渲染處理主要包括顏色空間轉換、視頻剪裁、縮放操作、仿射變換、多幀拼接等常規操作。經過Video Post-Processing對外界進入的視頻數據進行硬件加速預處理后,Video Subsystem會將處理后數據通過總線傳輸給NPUs、DRAM、AP System或外接存儲設備,然后進行后續的深度學習處理等操作。

BM1682提供了豐富的外界交互接口,如高速接口PCIE、以太網SDIO3.0、WIFI等。BM1682將數據處理完畢后可以很方便的通過PCIE接口、以太網接口、或者WIFI接口將數據傳輸到總服務器。若是條件限制沒有網絡接入點,用戶可以選擇通過接入SDIO3.0的eMMC存儲器或是PCIE式存儲器將數據存儲到本地存儲裝置。可見,BM1682對其可能的應用場景做了充分的考慮并給予了硬件支持,用戶可以根據需求,靈活方便的進行配置。

Peripheral Subsystem方面,BM1682比BM1680要豐富的多,這大大方便了用戶進行系統拓展,如添加額外傳感器等。BM1682的外設包括2個SPI接口、4個UART接口、4個IIC、4路PWM生成器、一塊內嵌式SPI Flash、WDG、Timer、GPIO、PVT Sensor、Top Reg、Efuse、ROM。由給出的外設可以看到,BM1682的設計考慮了配置、存儲、對外界系統實時控制、以及加密保護等功能,極大提高了系統的靈活性、安全性,省卻了用戶額外添加相關功能的開發成本。

性能分析——BM1682極大提升

NPU深度學習硬件加速器是人工智能的核心。兩者NPUs模塊集成了64個NPUs單元,通過NPU Schedule Engine進行調度。BM1682中每個NPU含有32個EUs,BM1680未知。根據BM1680、BM1682數據手冊顯示,單片BM1680單精度運算速度為2TFLops;單片BM1682單精度運算速度為3TFLops。BM1682的單片運算速度高出BM1680 50%。

BM1680單片的運行速度低于BM1682,但BM1680支持級聯工作模式,數個BM1680可以通過高速的Chip Link Subsystem組成一個集群式的系統,進行更高處理量的運算處理任務。BM1682不具備級聯功能。下圖為BM1680芯片的級聯連接示意圖。

級聯方式:每個Node代表一個BM1680

電學方面,根據兩者的數據手冊顯示:滿載工作時BM1680的TPD(Thermal Design Power熱設計功耗)為41W;:滿載工作時BM1682的TPD小于50W。從功耗角度分析,BM1680的2TFlops的NPUs速度應該是有所保留的。

開發生態——兩代芯片都很到位

BM1680、BM1682均支持的主流的CNN/RNN/DNN深度學習架構,通過這兩款TPU芯片進行硬件加速,可以極大的提高深度學習算法的執行速度。當然,BM1680和BM1682也可以通過基礎的矩陣運算進行深度學習的模型、架構的搭建。

在開發生態方面,兩款芯片的支持也是很到位的。BM1680、BM1682均對后端用戶提供SDK;如果用戶需要進行深度優化以獲取算法最優性能,可以聯系廠家獲得相關教學支持。

應用領域——BM1682更專注圖像/視頻處理

由前述分析可知,BM1680為通用性人工智能芯片,其應用方向沒有偏向性,芯片內部主要集成了深度學習算法所需要的基本模塊,應用各種人工智能的深度學習算法,通過添加相應的外圍電路模塊,BM1680可以搭建成適用于任一個領域的深度學習系統——像圖片識別、自然語言處理、文本處理、金融、醫學等等大小領域均可選擇該芯片實現。BM1680更加具有靈活性。而且,BM1680可以進行級聯,所以對于需要處理巨大數據量的人工智能深度學習系統,BM1680尤為合適。像企業級應用、海量數據處理等方面,通過簡單的級聯BM1680就可以獲取相匹配的計算能力,靈活而強大。

而BM1682則是一個升級版的BM1680并配備了專門用于視頻處理的集成系統,整個BM1682芯片搭載了視頻處理所需要的全部核心模塊,以及對其具體應用場景適應性的輔助模塊。BM1682對于需要進行圖像/視頻處理的市場應用可謂是十分便捷了。BM1682的輔助功能配置模塊自帶有線與無線網絡功能,對于視頻監控方向的市場應用十分方便,無線功能更是省略了網線布線的繁瑣施工,并且可用于實現遠程監控。對于一些沒有網絡的場合,如科研領域的野外視頻收集處理、閉路視頻監控等,BM1682可以輕松的添加外置存儲裝置進行數據備份收集。BM1682作為圖像/視頻方向深度學習的SoC片上系統,市場前景很是廣闊,這款新品還是很值得期待的。

作者 | 中國科學院微電子研究所 劍白

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI芯片
    +關注

    關注

    17

    文章

    1983

    瀏覽量

    35896
  • 云天勵飛
    +關注

    關注

    0

    文章

    149

    瀏覽量

    12203
  • 比特大陸
    +關注

    關注

    6

    文章

    145

    瀏覽量

    30458
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AMD第二代Versal AI Edge和Versal Prime系列加速量產 為嵌入式系統實現單芯片智能

    我們推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,這兩款產品是對 Versal 產品組合的擴展,可為嵌入式系統實現單芯片智能。
    的頭像 發表于 06-11 09:59 ?875次閱讀

    恩智浦推出第二代OrangeBox車規級開發平臺

    第二代OrangeBox開發平臺集成AI功能、后量子加密技術及內置軟件定義網絡的能力,應對快速演變的信息安全威脅。
    的頭像 發表于 05-27 14:25 ?649次閱讀

    第二代AMD Versal Premium系列SoC滿足各種CXL應用需求

    第二代 AMD Versal Premium 系列自適應 SoC 是一款多功能且可配置的平臺,提供全面的 CXL 3.1 子系統。該系列自適應 SoC 旨在滿足從簡單到復雜的各種 CXL 應用需求
    的頭像 發表于 04-24 14:52 ?493次閱讀
    <b class='flag-5'>第二代</b>AMD Versal Premium系列SoC滿足各種CXL應用需求

    云天AI技術為智慧教育注入新動能

    2月20日-21日,云天受邀參加“科學教育?社會協同”資源對接交流活動。在會上,云天全面
    的頭像 發表于 02-21 14:13 ?614次閱讀

    簡單認識第二代高通3D Sonic傳感器

    目前,已有多款搭載驍龍8至尊版移動平臺的新機續發布,其中不少機型采用第二代高通3D Sonic超聲波指紋解鎖,為用戶帶來了更為便捷、高效的解鎖體驗。作為高通新一超聲波指紋解鎖解決方案,第二
    的頭像 發表于 01-21 10:05 ?848次閱讀

    比特大陸與Alps Blockchain達成合作

    近日,比特大陸宣布與意大利知名加密貨幣挖礦公司Alps Blockchain達成了一項重要合作。根據協議,Alps Blockchain將采購萬余臺比特大陸先進的水冷礦機ANTMINER S21+
    的頭像 發表于 01-09 16:12 ?730次閱讀

    云天聯合發布AI智能眼鏡

    近日,云天飛在互動平臺上宣布,公司與閃極科技、LOHO眼鏡品牌攜手合作,共同推出了全新的AI智能眼鏡。這款眼鏡不僅集成了云天
    的頭像 發表于 12-26 11:05 ?1164次閱讀

    云天首款AI眼鏡正式發布

    近日,云天與閃極科技、LOHO聯合打造的AI智能眼鏡正式發布。該產品搭載云天
    的頭像 發表于 12-20 16:37 ?707次閱讀

    簡單認識第二代高通Oryon CPU

    在不久前的2024驍龍峰會上,備受矚目的新一驍龍旗艦移動平臺——驍龍8至尊版正式發布。這款以“至尊版”命名的全新平臺也是首個采用第二代高通Oryon CPU的移動平臺。憑借領先的CPU、GPU
    的頭像 發表于 11-13 09:43 ?1195次閱讀

    AMD推出第二代Versal Premium系列

    近日,AMD(超威,納斯達克股票代碼:AMD )今日宣布推出第二代 AMD Versal Premium 系列,這款自適應 SoC 平臺旨在面向各種工作負載提供最高水平系統加速。第二代 Versal
    的頭像 發表于 11-13 09:27 ?911次閱讀

    一加正式發布第二代東方屏,獲全球首個DisplayMate A++認證

    近日,一加攜手京東方正式發布第二代東方屏,并宣布將在年度旗艦產品一加 13 中首發搭載。去年,一加聯合京東方打造出世界上最好的屏幕——東方屏,這是一次中國屏幕歷史級的突破。本次發布的第二代東方屏,在
    的頭像 發表于 10-21 17:32 ?722次閱讀

    AMD第二代Versal自適應SoC的主要特色

    AMD 第二代 AMD Versal AI Edge 和 Versal Prime 系列助力 AI 驅動型和經典的嵌入式系統實現單芯片智能性。可在性能、功耗、占板面積、功能安全和信息安
    的頭像 發表于 09-18 10:14 ?1022次閱讀

    第二代AMD Versal Prime系列自適應SoC的亮點

    第二代 Versal Prime 系列自適應 SoC 是備受期待的 Zynq UltraScale+ MPSoC 產品線的繼任產品,該產品線已廣泛應用于廣播與專業音視頻行業的設備中。第二代
    的頭像 發表于 09-14 15:32 ?956次閱讀
    <b class='flag-5'>第二代</b>AMD Versal Prime系列自適應SoC的亮點

    清華姚班師生訪問云天,展望中國AI發展未來藍圖

    日前,清華大學姚班師生到云天參觀交流。云天董事長兼CEO陳寧博士攜
    的頭像 發表于 08-06 09:28 ?1095次閱讀
    清華姚班師生訪問<b class='flag-5'>云天</b><b class='flag-5'>勵</b><b class='flag-5'>飛</b>,展望中國<b class='flag-5'>AI</b>發展未來藍圖

    云天推出IPU-X6000加速卡,針對大模型推理任務設計

    近期,云天推出IPU-X6000加速卡。該產品具備256T算力、128GB顯存容量、486GB/S顯存帶寬;采用C2C Mesh互聯技術,可實現卡間高速互聯,帶寬達64GB/s,最
    的頭像 發表于 07-24 11:03 ?1373次閱讀
    主站蜘蛛池模板: 日本特黄特色 | 狠狠色丁香婷婷综合久久片 | 一级毛片在线播放 | 午夜在线观看免费观看大全 | 色www永久免费 | 欧美性久久 | 91伊人网 | 黄h视频 | 午夜精品久久久久久久第一页 | 日本aaaa级毛片在线看 | 99色综合 | 中文字幕在线视频第一页 | 国产成人精品午夜二三区 | 超级黄色毛片 | 奇米888在线看奇米999 | 国产片无遮挡在线看床戏 | 美女扒开尿口给男人爽的视频 | 国产色爽女小说免费看 | 国产成人精品系列在线观看 | 最新仑乱免费视频 | 国产一区二区三区 韩国女主播 | 日本在线观看永久免费网站 | 亚洲电影免费 | 天天干天天干天天干天天干天天干 | 亚洲色图日韩 | 欧美一级片手机在线观看 | jlzzjlzz亚洲日本 | 日xxxx| 欧美18videosex性欧美69 | 日本黄色片www | 中文字幕乱码人成乱码在线视频 | 在线黄色免费网站 | 久久国产成人午夜aⅴ影院 久久国产福利 | 成人一级毛片 | 男女刺激性视频大片 | 国产成年网站v片在线观看 国产成人91青青草原精品 | 亚洲电影在线 | 亚偷熟乱区视频在线观看 | 涩涩97在线观看视频 | 亚洲性后网 | 四虎影院2022 |