在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Arm與ExecuTorch合作加速端側生成式AI實現

Arm社區 ? 來源:Arm社區 ? 2024-11-15 11:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 戰略與生態部人工智能開發者平臺與服務高級副總裁 Alex Spinelli

通過 Arm 計算平臺與 ExecuTorch 框架的結合,使得更小、更優化的模型能夠在邊緣側運行,加速邊緣側生成式 AI 的實現。

新的 Llama 量化模型適用于基于 Arm 平臺的端側和邊緣側 AI 應用,可減少內存占用,提高精度、性能和可移植性。

全球 2,000 萬名 Arm 開發者能夠更迅速地在數十億臺邊緣側設備上大規模開發和部署更多的智能 AI 應用。

Arm 正在與 Meta 公司的 PyTorch 團隊攜手合作,共同推進新的 ExecuTorch 測試版 (Beta) 上線,旨在為全球數十億邊緣側設備和數百萬開發者提供人工智能 (AI) 和機器學習 (ML) 功能,進而確保 AI 真正的潛力能被最廣泛的設備和開發者所使用。

借助 ExecuTorch 和新的 Llama 量化模型,Arm 計算平臺優化生成式 AI 性能

Arm 計算平臺無處不在,為全球眾多邊緣側設備提供支持,而 ExecuTorch 則是專為移動和邊緣側設備部署 AI 模型而設計的 PyTorch 原生部署框架。兩者的緊密合作,使開發者能夠賦能更小、更優化的模型,包括新的 Llama 3.2 1B 和 3B 量化模型。這些新模型可以減少內存占用、提高準確性、增強性能和提供可移植性,成為小型設備上的生成式 AI 應用的理想選擇,如虛擬聊天機器人、文本摘要和 AI 助手。

開發者無需額外的修改或優化,便可將新的量化模型無縫集成到應用中,從而節省時間和資源。如此一來,他們能夠迅速在廣泛的 Arm 設備上大規模開發和部署更多的智能 AI 應用。

隨著 Llama 3.2 大語言模型 (LLM) 新版本的發布,Arm 正在通過 ExecuTorch 框架優化 AI 性能,使得在 Arm 計算平臺邊緣設備運行的真實生成式 AI 工作負載能更為快速。在 ExecuTorch 測試版發布的首日起,開發者便能享有這些性能的提升。

集成 KleidiAI,加速端側生成式 AI 的實現

在移動領域,Arm 與 ExecuTorch 的合作意味著眾多生成式 AI 應用,如虛擬聊天機器人、文本生成和摘要、實時語音和虛擬助手等,完全能夠在搭載 Arm CPU 的設備上以更高的性能運行。這一成果得益于 KleidiAI,它引入了針對 4 位量化優化的微內核,并通過 XNNPACK 集成到了 ExecuTorch 中,因此,在 Arm 計算平臺上運行 4 位量化的 LLM 時,無縫加速 AI 工作負載的執行。例如,通過 KleidiAI 的集成,Llama 3.2 1B 量化模型預填充階段的執行速度可以提高 20%,使得一些基于 Arm 架構的移動設備上的文本生成速度超過了每秒 400 個詞元 (token)。這意味著,終端用戶將從他們移動設備上獲得更快速、響應更靈敏的 AI 體驗。

物聯網的邊緣側 AI 應用加速實時處理能力

在物聯網領域,ExecuTorch 將提高邊緣側 AI 應用的實時處理能力,包括智能家電、可穿戴設備以及自動零售系統等。這意味著物聯網設備和應用能夠以毫秒級的速度響應環境變化,這對保障安全性和功能可用性至關重要。

ExecuTorch 可在 Arm Cortex-A CPU 和 Ethos-U NPU 上運行,以加速邊緣側 AI 應用的開發和部署。事實上,通過將 ExecuTorch 與 Arm Corstone-320 參考平臺(也可作為仿真固定虛擬平臺 (FVP) 使用)、Arm Ethos-U85 NPU 驅動程序和編譯器支持集成到一個軟件包中,開發者可在平臺上市前幾個月就著手開發邊緣側 AI 應用。

更易獲取、更快捷的邊緣側 AI 開發體驗

ExecuTorch 有潛力成為全球最受歡迎的高效 AI 和 ML 開發框架之一。通過將應用最廣泛的 Arm 計算平臺與 ExecuTorch 相結合,Arm 正在通過新的量化模型加速 AI 的普及,讓開發者能夠更快地在更多設備上部署應用,并將更多生成式 AI 體驗引入邊緣側。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ARM
    ARM
    +關注

    關注

    134

    文章

    9346

    瀏覽量

    376526
  • AI
    AI
    +關注

    關注

    88

    文章

    34909

    瀏覽量

    277866
  • 人工智能
    +關注

    關注

    1806

    文章

    48955

    瀏覽量

    248409

原文標題:ExecuTorch 測試版上線,加速 Arm 平臺邊緣側生成式 AI 發展

文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    首創開源架構,天璣AI開發套件讓AI模型接入得心應手

    的自有模型移植,使首字詞生態速度比云端方案提升70%,賦能絕影多模態智能座艙強大的運行能力,讓汽車擁有“有趣的靈魂”。 不僅如此,天璣AI開發套件已經接入NVIDIA TAO生態圈,實現
    發表于 04-13 19:52

    AI大模型側部署正當時:移遠端AI大模型解決方案,激活場景智能新范式

    AI技術飛速發展的當下,AI大模型的應用正從云端向加速滲透。作為全球領先的物聯網整體解決方案供應商,移遠通信憑借深厚的技術積累與前瞻性
    的頭像 發表于 03-26 19:05 ?432次閱讀
    <b class='flag-5'>AI</b>大模型<b class='flag-5'>端</b>側部署正當時:移遠端<b class='flag-5'>側</b><b class='flag-5'>AI</b>大模型解決方案,激活場景智能新范式

    Arm與阿里巴巴合作加速多模態AI體驗

    Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱“Arm”)近日發布與阿里巴巴淘天集團輕量級深度學習框架 MNN 的又一新合作
    的頭像 發表于 03-10 09:07 ?609次閱讀

    芯訊通首次發布全新AI全棧解決方案SIMCom AI Stack

    Stack。攜手全球合作伙伴共同加速智能創新與應用。 構建
    的頭像 發表于 03-08 09:56 ?571次閱讀

    如何在Arm Ethos-U85上使用ExecuTorch

    在快速發展的機器學習領域,PyTorch 憑借其靈活性和全面的生態系統,已成為模型開發的熱門框架。Arm 與 Meta 合作ExecuTorch 中引入了對 Arm 平臺的支持,進
    的頭像 發表于 02-14 14:23 ?596次閱讀
    如何在<b class='flag-5'>Arm</b> Ethos-U85上使用<b class='flag-5'>ExecuTorch</b>

    聚云科技榮獲亞馬遜云科技生成AI能力認證 助力企業加速生成AI應用落地

    、數據處理、模型調優到應用集成與部署等方面,助力企業加速生成AI應用落地。此外,聚云科技還基于亞馬遜云科技打造RAGPro企業知識庫、AI
    發表于 02-14 13:41 ?147次閱讀

    廣和通Fibocom AI Stack:加速AI部署新紀元

    近日,廣和通正式推出了Fibocom AI Stack,這一創新解決方案旨在賦能千行百業的應用,推動AI技術的廣泛商用。 Fibocom AI
    的頭像 發表于 01-13 11:32 ?1074次閱讀

    聯發科技攜手Cocos共建生成AI游戲開發生態,推動行業升級

    全球領先的半導體公司聯發科技與知名游戲引擎開發商Cocos正式宣布達成深度合作!這一合作將把聯發科技在生成
    的頭像 發表于 01-10 09:24 ?429次閱讀

    中信建投建議關注AI模組機會

    中信建投近日發布的研報指出,隨著OpenAI的ChatGPT功能全面接入蘋果設備,包括iPhone、iPad和Mac,AI產業的發展正在加速。這一趨勢為
    的頭像 發表于 12-17 14:05 ?640次閱讀

    廣和通開啟AI新時代

    AI發展正酣,隨著終端芯片算力越來越高、模型能力越來越強、實時響應及隱私保護的應用需求增加,
    的頭像 發表于 12-12 10:35 ?757次閱讀

    把握關鍵節點,美格智能持續推動AI規模化拓展

    將成為和系統同樣重要的存在,如果說電路是連接身體的“血管”,那么AI就將成為終端的智慧“大腦”。加速演進大模型加速走向從手機移動
    的頭像 發表于 11-26 01:00 ?525次閱讀
    把握關鍵節點,美格智能持續推動<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>規模化拓展

    把握關鍵節點,美格智能持續推動AI規模化拓展

    將成為和系統同樣重要的存在,如果說電路是連接身體的“血管”,那么AI就將成為終端的智慧“大腦”。 ?加速演進,大模型加速走向 從手機移動
    的頭像 發表于 11-25 16:45 ?739次閱讀
    把握關鍵節點,美格智能持續推動<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>AI</b>規模化拓展

    中科創達發開創智能新篇章

    生成AI在創新和應用方面以前所未有的速度向前發展。融合云計算和邊緣/計算的混合AI技術,
    的頭像 發表于 11-17 11:23 ?1038次閱讀

    從Apple Intelligence到IoT Intelligence,生成AI時代加速到來

    快速運行以AppleIntelligence為中心的生成AI功能在手機運行。用庫克的話說:“新一代iPhone徹徹底底為AppleIn
    的頭像 發表于 09-11 08:01 ?1052次閱讀
    從Apple Intelligence到IoT Intelligence,<b class='flag-5'>端</b><b class='flag-5'>側</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>時代<b class='flag-5'>加速</b>到來

    GE醫療與亞馬遜云科技達成戰略合作,通過生成AI加速醫療健康領域轉型

    GE醫療已選擇亞馬遜云科技作為其戰略云服務合作伙伴,致力于推出全新的定制化基礎模型,加速創新醫療應用快速開發。 ? GE醫療將利用亞馬遜云科技的機器學習和生成
    發表于 08-29 16:38 ?415次閱讀
    主站蜘蛛池模板: japan高清视频乱xxxxx | 欲妇放荡叫床很浪的小说 | 国产亚洲精品免费 | 激情婷婷网 | 成 人 免 费 黄 色 | 日本xxxxx黄区免费看动漫 | 你懂的在线免费视频 | 中文字幕成人乱码在线电影 | 性夜影院爽黄a爽免费看网站 | 神马影院午夜dy888 | 五月天丁香婷 | 六月丁香婷婷激情国产 | 国产精品三级 | 国产精品天天操 | 一级做a爰片久久毛片图片 一级做a爰片久久毛片鸭王 | 中文字幕不卡在线播放 | 天天摸夜夜爽 | 久久婷婷色| 超黄视频在线观看 | 日本三区四区免费高清不卡 | 成年网站在线 | 一级大片免费看 | 色啦啦影院 | 夜夜春夜夜夜夜猛噜噜噜噜噜 | 67xxxxxx日本| 美女网站黄在线看 | 成人免费aaaaa毛片 | 午夜免费福利在线观看 | 日本不卡在线观看免费v | 国产色片 | 天天操夜夜嗨 | 最好看的最新中文字幕2018免费视频 | 天天操天天拍 | 成年片色大黄全免费网址 | 色在线视频网站 | 亚洲狠狠婷婷综合久久久久图片 | 五月欧美激激激综合网色播 | 国产爱搞 | 日韩久久精品视频 | 噜噜噜天天躁狠狠躁夜夜精品 | 国产三级日产三级日本三级 |