在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

端側AI應用趨熱:NPU如何解決其關鍵痛點

要長高 ? 2024-10-31 15:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

當前,AI大模型正逐步從云端遷移至邊緣,甚至深入至日常生活中的手機、個人電腦(PC)、汽車等終端。在這場變革中,端側智能正逐漸嶄露頭角,預示著未來的智能設備將能夠更實時、高效地理解和服務用戶。在E維智庫舉辦的第12屆中國硬科技產業鏈創新趨勢峰會暨百家媒體論壇上,安謀科技的產品總監鮑敏祺深入剖析了端側AI應用的廣闊前景,并強調了神經處理單元(NPU)在這一領域中的關鍵作用。

關于端側大模型,鮑敏祺指出,AIGC大模型帶來的算力提升為端側AI帶來了新的發展機遇。這些大模型已經在手機上實現了應用,如圖片理解、關鍵信息提取等,顯著提升了用戶體驗。例如,Apple Intelligence等大模型雖然尚未對國內用戶開放,但已經引起了廣泛的關注和測評。這些應用不僅提高了使用效率,還逐漸融入了人們的日常生活。

然而,鮑敏祺也提到,端側AI的算力是否會像云端一樣持續膨脹仍是一個未知數。由于存儲帶寬的限制以及用戶體驗對實時性的高要求,大模型必須在用戶能接受的時間內(通常是2秒以內)給出反饋。因此,在當前帶寬條件下,部署大模型需要權衡帶寬制約與用戶體驗。

目前,眾多國內外廠商已從商業化角度推出了大模型,并達成共識,認為AI NPU是未來消費類產品的重點投入方向。頭部終端廠商如OPPO、VIVO、小米、榮耀、華為等也都有相應的解決方案。這些方案并非僅依賴端側大模型,而是與云端相輔相成,共同提升用戶體驗。端側的優勢在于時效性和數據本地安全性,而云端則具備更強的理解和計算能力。

在評估端側大模型時,語言類模型或文生圖常被用作參考。但鮑敏祺認為,語言類模型并非端側應用的終點。隨著技術的發展,圖片、音頻、視頻等多模態輸入將成為常態。這些輸入需要經過壓縮和Tokenizer處理,轉換成模型能理解的Token。而大型語言模型(LLM)的基本原理并未改變,只是輸入和輸出過程增加了編碼和解碼步驟。

另一個挑戰在于,上下文長度的增長對模型性能提出了更高要求。衡量語言模型的指標包括每秒處理的Token數和首次響應時間(TTFT)。隨著上下文長度的增加,首次延遲也會線性增長。因此,在端側容量和帶寬有限的情況下,需要優化算法以提升算力效率。

一個明顯的趨勢是,AI的應用將越來越廣泛,涉及多模態場景。隨著AI的發展,人們可能會更多地與智能體進行交互。這些智能體不僅能理解和執行任務,還能通過強化學習不斷優化自己的行為。

在多模態場景下,AI的應用將不再局限于傳統設備。從手持設備到邊緣計算、PC、汽車,再到云端,AI將無處不在。然而,不同場景對AI算力的需求各不相同。手持設備由于功耗和芯片面積的限制,通常只能支持較小規模的模型。而在邊緣計算、PC、汽車等端,模型體量可能更大。在云端,由于有充足的資源和帶寬,模型體量可以更大,從而接受各種知識并進行持續迭代。

AI的賦能不僅限于傳統設備,它還能為以前看似市場前景有限的終端設備帶來新的生命力。例如,通過賦予可穿戴設備簡單的語音控制和視覺拍照功能,這些設備可能會變得非常受歡迎。這種多模態的輸入和直接使用的功能使得這些設備在競爭激烈的市場中脫穎而出。

然而,端側AI也面臨著諸多挑戰。首先是成本、功耗和生態系統的問題。存儲介質的帶寬和成本是制約端側AI發展的關鍵因素之一。盡管存儲技術不斷進步,但端側設備仍然無法像云端那樣擁有TB級別的帶寬。此外,端側設備的芯片面積和計算資源也非常有限。

第二個挑戰是功耗問題。在AI應用中,數據的搬運是功耗的主要來源之一。對于大模型來說,由于顯存占用大,無法像卷積神經網絡(CNN)那樣通過高復用度來提高能效。因此,如何降低數據搬運的功耗成為了一個亟待解決的問題。

此外,軟件和工具的優化也是一大挑戰。AI模型需要不斷迭代優化才能滿足用戶需求。然而,當前的軟件和工具在支持大模型優化方面還存在不足。

針對這些挑戰,安謀科技推出的“周易”NPU采取了一系列應對策略。首先,它在保留CNN能力的同時,增強了對Transformer大模型的支持。通過優化微架構和計算能力,提升了Transformer的運算效率。其次,“周易”NPU注重數據本地化,通過混合精度量化和無損壓縮來減少數據搬運和提升有效帶寬。此外,它還針對大模型進行了總線帶寬的擴展以滿足解碼等場景對帶寬的高需求。

為了進一步提升能效,“周易”NPU還采用了數據并行、模型并行、負載均衡和Tiling等技術。同時,它也支持異構策略,可以獨立執行AI任務,并根據需求自由裁剪。在端側應用中,“周易”NPU還采用了電源門控和低功耗策略以降低不必要的功耗。

通過這些創新技術,“周易”NPU有效應對了端側AI面臨的挑戰,為多模態場景下的AI應用提供了強有力的支持。針對不同應用場景,如智能汽車、手機PC、AIOT等,安謀科技也制定了差異化的策略。

在智能汽車領域,安謀科技關注智艙一體等趨勢,提供了全面的IP解決方案。這包括用于渲染顯示的GPU、用于處理攝像頭數據的前級處理器以及用于安全相關功能的安全處理器(SPU)。特別值得一提的是,“周易”NPU具備20到320TOPS的可擴展性,以滿足不同場景下的算力需求。例如,在汽車信息娛樂系統(IVI)場景中,算力要求相對較低;而在高級駕駛輔助系統(ADAS)場景中,由于需要執行多任務特別是CNN場景下的任務,算力需求則顯著提升。“周易”NPU的靈活性使其能夠適應各種汽車場景并實現完整端到端的解決方案。

對于AI加速卡場景,安謀科技關注輸入與輸出的高效處理特別是圖像和視頻數據的輸入與AI計算的輸出。加速卡具備HOST AP交互能力并強調安全性如JPEG解碼能力和根據實際需求定制的NPU。根據應用場景的不同如NVMe存儲形式、車載或手機等TDP功耗和算力需求也會有所差異。能效比是一個重要考慮因素例如在5瓦TDP功耗下有效算力可達25TOPS左右。整個解決方案多樣不僅針對語言模型還著眼于未來多模態模型的需求。

在AIOT場景中算力需求相對較低但受到AIOT設備面積和功耗的限制。然而對安全性的要求卻更高包括固件和安全性的強化。與服務器或板卡等密封形式不同AIOT場景對安全性的需求進一步提升。安謀科技的“周易”NPU能夠在此類場景中提供20TOPS到320TOPS的算力裁減主要用于聲音和圖象的檢測??紤]到端側可能放置較低精度的模型以保證量化效果整個解決方案在保障安全的同時也通過一定算力的內容對語音類場景進行AI加速。

隨著技術的不斷進步和創新,未來的智能設備將更加智能、高效和便捷。NPU也將在這一過程中發揮更加重要的作用。據悉安謀科技的下一代“周易”NPU在生態上已廣泛部署了Wenxin、Llama、GPT等模型,并在端側覆蓋了平板電腦(PAD)、PC、手機(Mobile)等各類場景。對于智能汽車領域無論是IVI還是ADAS場景都能根據實際算力需求和模型提供針對性的解決方案最高可達320TOPS的算力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    88

    文章

    34773

    瀏覽量

    276978
  • NPU
    NPU
    +關注

    關注

    2

    文章

    326

    瀏覽量

    19626
  • AIGC
    +關注

    關注

    1

    文章

    385

    瀏覽量

    2357
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    華邦電子創新存儲賦能智能

    人工智能技術的飛速發展,#AI 正在成為智能設備發展的重要趨勢。華邦電子正憑借卓越存儲技術和豐富的產品,積極布局端
    的頭像 發表于 05-14 09:59 ?525次閱讀
    華邦電子創新存儲賦能<b class='flag-5'>端</b><b class='flag-5'>側</b>智能<b class='flag-5'>端</b><b class='flag-5'>側</b>

    蘋芯科技 N300 存算一體 NPU,開啟 AI 新征程

    隨著人工智能技術的爆發式增長,智能設備對本地算力與能效的需求日益提高。而傳統馮·諾依曼架構在數據處理效率上存在瓶頸,“內存墻”問題成為制約A
    的頭像 發表于 05-06 17:01 ?357次閱讀
    蘋芯科技 N300 存算一體 <b class='flag-5'>NPU</b>,開啟<b class='flag-5'>端</b><b class='flag-5'>側</b> <b class='flag-5'>AI</b> 新征程

    首創開源架構,天璣AI開發套件讓AI模型接入得心應手

    時間。 這不僅僅是工具的升級,更是邁向智能體化用戶體驗的關鍵基礎設施。 天璣AI開發套件 2.0,全面釋放天璣AI能力 去年,天璣
    發表于 04-13 19:52

    AI大模型側部署正當時:移遠端AI大模型解決方案,激活場景智能新范式

    AI技術飛速發展的當下,AI大模型的應用正從云端向加速滲透。 作為全球領先的物聯網整體解決方案供應商,移遠通信憑借深厚的技術積累與前瞻性的戰略布局,在
    發表于 03-27 11:26 ?220次閱讀
    <b class='flag-5'>AI</b>大模型<b class='flag-5'>端</b>側部署正當時:移遠端<b class='flag-5'>側</b><b class='flag-5'>AI</b>大模型解決方案,激活場景智能新范式

    AI大模型側部署正當時:移遠端AI大模型解決方案,激活場景智能新范式

    AI技術飛速發展的當下,AI大模型的應用正從云端向加速滲透。作為全球領先的物聯網整體解決方案供應商,移遠通信憑借深厚的技術積累與前瞻性的戰略布局,在
    的頭像 發表于 03-26 19:05 ?427次閱讀
    <b class='flag-5'>AI</b>大模型<b class='flag-5'>端</b>側部署正當時:移遠端<b class='flag-5'>側</b><b class='flag-5'>AI</b>大模型解決方案,激活場景智能新范式

    AI 音頻處理器:集成音頻處理與 AI 計算能力的創新芯片

    對人工智能應用日益增長的需求。 ? 集成音頻處理與 AI 計算能力 AI 音頻處理器的組成結構通常較為復雜,常采用多核異構架構,將不同類型的處理器核心組合在一起,從而高效處理各種
    的頭像 發表于 02-16 00:13 ?2140次閱讀

    軟硬協同優化,安謀科技新一代“周易”NPU實現DeepSeek-R1高效部署

    優化的架構設計,beta版本在2024年底已面向早期用戶開放評估測試,并獲得了廣泛認可與積極反饋。 預計今年上半年,這款備受期待的 NPU 產品將正式亮相市場,屆時將為更多用戶帶來突破性的
    發表于 02-14 10:52 ?179次閱讀
    軟硬協同優化,安謀科技新一代“周易”<b class='flag-5'>NPU</b>實現DeepSeek-R1<b class='flag-5'>端</b><b class='flag-5'>側</b>高效部署

    廣和通開啟AI新時代

    AI發展正酣,隨著終端芯片算力越來越高、模型能力越來越強、實時響應及隱私保護的應用需求增加,
    的頭像 發表于 12-12 10:35 ?750次閱讀

    MediaTek天璣移動平臺賦能騰訊會議AI人像分割模型

    MediaTek 與騰訊會議聯合優化的 NPU 虛擬背景功能,已在搭載 MediaTek 天璣旗艦芯的終端正式上線。作為雙方初次開展的軟硬件生態合作,此次聯合優化旨在充分利用天璣移動平臺的
    的頭像 發表于 11-29 15:30 ?653次閱讀

    把握關鍵節點,美格智能持續推動AI規模化拓展

    當前,AI大模型走向已經是大勢所AI的發
    的頭像 發表于 11-26 01:00 ?518次閱讀
    把握<b class='flag-5'>關鍵</b>節點,美格智能持續推動<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>規?;卣? />    </a>
</div>                              <div   id=

    把握關鍵節點,美格智能持續推動AI規?;卣?/a>

    當前,AI大模型走向已經是大勢所AI的發
    的頭像 發表于 11-25 16:45 ?732次閱讀
    把握<b class='flag-5'>關鍵</b>節點,美格智能持續推動<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>規?;卣? />    </a>
</div>                              <div   id=

    AI,風起移動智能計算

    新一代驍龍旗艦芯片,AI的繁榮肇始
    的頭像 發表于 11-22 09:55 ?2892次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>,風起移動智能計算

    智能無處不在:安謀科技“周易”NPU開啟AI新時代

    的需求,將AI的觸角延伸至世界的每一個角落。 近日,在EEVIA主辦的第12屆中國硬科技產業鏈創新趨勢峰會暨百家媒體論壇上,安謀科技產品總監鮑敏祺發表了精彩的主題演講《AI應用芯機
    發表于 11-15 11:42 ?404次閱讀
    智能無處不在:安謀科技“周易”<b class='flag-5'>NPU</b>開啟<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>新時代

    NPU技術如何提升AI性能

    設計的處理器,與傳統的CPU和GPU相比,它在執行深度學習任務時具有更高的效率和更低的能耗。NPU通過專門優化的硬件結構和指令集,能夠更快地處理神經網絡中的大量并行計算任務。 1. 優化硬件架構 NPU技術通過優化硬件架構來提升AI
    的頭像 發表于 11-15 09:11 ?1379次閱讀

    AI浪潮已來!炬芯科技發布新一代AI音頻芯片,能效比和AI算力大幅度提升

    電子發燒友原創 章鷹 ? 11月5日,在深圳會展中心7號館內,炬芯科技董事長兼CEO周正宇博士帶來了《AI芯片的未來》演講,他對
    的頭像 發表于 11-06 09:11 ?3873次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>浪潮已來!炬芯科技發布新一代<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>音頻芯片,能效比和<b class='flag-5'>AI</b>算力大幅度提升
    主站蜘蛛池模板: 天天好b| 天天射天天操天天 | 亚洲国产一区二区三区在线观看 | 国产精品秒播无毒不卡 | 婷婷激情四月 | 乱肉情欲杂乱小说 | www.av毛片| 色播在线永久免费视频网站 | 调教双性学霸美人 | 色综合网址 | 午夜剧场黄 | 狠狠干狠狠干 | 白嫩少妇激情无码 | 欧美亚洲综合图区在线 | 久久99久久精品97久久综合 | 亚洲人的天堂男人爽爽爽 | 亚洲黄色性视频 | 狠狠色婷婷狠狠狠亚洲综合 | 久久久国产乱子伦精品 | 看黄网站免费 | 拍拍拍拍拍拍拍无挡大全免费 | 亚洲欧美视频一区二区三区 | 在线视频免费观看 | 一级特黄女毛毛片 | 三级视频网站在线观看播放 | 新天堂在线 | 伊人成综合 | 亚洲综合在线一区 | 欧美一级片网站 | 日韩一级在线视频 | 777kkk亚洲综合欧美色老头 | 亚洲68283精品人体 | 国产成人高清精品免费5388密 | 日日夜夜天天操 | 日日噜噜噜噜人人爽亚洲精品 | 午夜高清免费在线观看 | 一级毛片 在线播放 | 日本一区免费观看 | 夜色福利| 国产精品自线在线播放 | 国产三级日本三级日产三级66 |