在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

高通:未來幾個月有望在終端側運行超100億參數的模型

Carol Li ? 來源:電子發燒友網 ? 作者:李彎彎 ? 2023-07-26 00:15 ? 次閱讀

電子發燒友網報道(文/李彎彎)日前,在2023世界半導體大會暨南京國際半導體博覽會上,高通全球副總裁孫剛發表演講時談到,目前高通能夠支持參數超過10億的模型在終端上運行,未來幾個月內超過100億參數的模型將有望在終端側運行。

大模型在終端側運行的重要性

生成式AI正在快速發展,數據顯示,2020年至2022年,生成式AI相關的投資增長425%,初步預估生成式AI市場規模將達到1萬億美元。

然而孫剛指出,云經濟難以支持生成式AI規模化拓展,為實現規模化拓展,AI處理的中心正在向邊緣轉移。比如XR、汽車、手機、PC、物聯網,生成式AI將影響各類終端上的應用。

高通在這方面展示出了領先的優勢,高通AI引擎由多個硬件和軟件組件組成,用于在驍龍移動平臺上為終端側AI推理加速。它采用異構計算架構,包括高通Hexagon處理器Adreno GPU、Kryo CPU傳感器中樞,共同支持在終端上運行AI應用程序。

在7月初的2023年世界人工智能大會上,高通就已經展示了全球首個在終端側運行生成式AI(AIGC)模型Stable Diffusion的技術演示,和全球最快的終端側語言-視覺模型(LVM)ControlNet運行演示。這兩款模型的參數量已經達到10億-15億,僅在十幾秒內就能夠完成一系列推理,根據輸入的文字或圖片生成全新的AI圖像。

今年7月18日,Meta官宣將發布其開源大模型LLaMA的商用版本,為初創企業和其他企業提供了一個強大的免費選擇,以取代OpenAI和谷歌出售的昂貴的專有模型。隨后,高通發布公告稱,從2024年起,Llama 2將能在旗艦智能手機和PC上運行。

高通技術公司高級副總裁兼邊緣云計算解決方案業務總經理Durga Malladi表示,為了有效地將生成式人工智能推廣到主流市場,人工智能將需要同時在云端和邊緣終端(如智能手機、筆記本電腦、汽車和物聯網終端)上運行。

在高通看來,和基于云端的大語言模型相比,在智能手機等設備上運行Llama 2 等大型語言模型的邊緣云計算具有許多優勢,不僅成本更低、性能更好,還可以在斷網的情況下工作,而且可以提供更個性化、更安全的AI服務。

如何讓大模型在終端規模化擴展

生成式AI進入未來生活的趨勢已經不可阻擋,為了讓生成式AI規模化擴展到更多終端設備中,高通提出了混合AI架構的運行方式,即在云端和設備終端的邊緣側之間分配算力,協同處理AI工作負載。

所謂混合AI,是指充分利用邊緣側終端算力支持生成式AI應用的方式,相比僅在云端運行的AI,前者能夠帶來高性能、個性化且更安全的體驗。

比如,如果模型、提示或生成內容的長度小于某個限定值,且精度足夠,推理就可以完全在終端側進行;如果任務相對復雜,則可以部分依靠云端模型;如果需要更多實時內容,模型也可以接入互聯網獲取信息。

在未來,不同的生成式AI用不同分流方式的混合AI架構,AI也能在此基礎上持續演進:
?大量生成式AI的應用,比如圖像生成或文本創作,需求AI能夠進行實時響應。在這種任務上,終端可通過運行不太復雜的推理完成大部分任務。

在AI計算的實現上,軟件和硬件同樣重要,因為必須在端側做到運算更快,效率更高,并推動AI應用在廣泛終端上的部署和普及。

高通在2022年6月推出AI軟件棧(Qualcomm AI Stack),其支持包括TensorFlow、Pytorch和ONNX在內的所有主流開發框架,所有runtimes(運行時,即某門編程語言的運行環境)和操作系統。借助高通AI軟件棧,開發者在智能手機領域開發的軟件可以快速擴展至汽車、XR、可穿戴設備等其他產品線進行使用。

高通技術公司產品管理高級副總裁兼AI負責人Ziad Asghar表示,未來公司需要加大終端側技術上的研發,尤其是進一步提升量化的算法。例如服務器上訓練的模型一般采用32位浮點運算(FP32),而我們在手機端現在能夠支持INT4計算,這能大大提高端側的處理能力。

小結

不僅僅是大模型的訓練需要極大的算力和功耗,部署也同樣如此。如果要讓大模型在更多的領域實現落地應用,除了在云端部署之后,在終端側部署也很關鍵。目前已經有諸多廠商在該領域進行探索,包括高通,期待未來大模型能夠走進人們生活的方方面面。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 高通
    +關注

    關注

    77

    文章

    7577

    瀏覽量

    192481
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    首創開源架構,天璣AI開發套件讓端AI模型接入得心應手

    。 Neuron Studio 還支持自動化調優神經網絡使用的帶寬及性能,開發過程中,將性能和內存占用自動優化至最佳配置。而且,開發者可以全程監控大模型演化過程。以前萬組參數手動調優動輒需要一周,而現在
    發表于 04-13 19:52

    通推動終端AI釋放全新價值

    通過蒸餾技術將百億參數模型壓縮至端設備可運行的創新,讓AI推理成本大幅下降,為終端AI的爆發按下加速鍵。低成本、
    的頭像 發表于 03-21 09:28 ?321次閱讀
    <b class='flag-5'>高</b>通推動<b class='flag-5'>終端</b><b class='flag-5'>側</b>AI釋放全新價值

    移遠通信邊緣計算模組成功運行DeepSeek模型,以領先的工程能力加速端AI落地

    。 ? 目前,該模型正在多款智能終端上進行深入測試與優化。移遠通信將憑借其卓越的工程化能力,加速端AI技術各行各業的規模化應用與普及。 ? ? DeepSeek : AI
    發表于 02-13 11:32 ?178次閱讀
    移遠通信邊緣計算模組成功<b class='flag-5'>運行</b>DeepSeek<b class='flag-5'>模型</b>,以領先的工程能力加速端<b class='flag-5'>側</b>AI落地

    移遠通信邊緣計算模組成功運行DeepSeek模型,以領先的工程能力加速端AI落地

    。目前,該模型正在多款智能終端上進行深入測試與優化。移遠通信將憑借其卓越的工程化能力,加速端AI技術各行各業的規模化應用與普及。DeepSeek:AI
    的頭像 發表于 02-12 19:03 ?372次閱讀
    移遠通信邊緣計算模組成功<b class='flag-5'>運行</b>DeepSeek<b class='flag-5'>模型</b>,以領先的工程能力加速端<b class='flag-5'>側</b>AI落地

    Kaggle知識點:7種參數搜索方法

    問題。一些常見的參數例子包括梯度基算法中的學習率,或者決策樹算法中樹的深度,這些可以直接影響模型準確擬合訓練數據的能力。參數調優涉及
    的頭像 發表于 02-08 14:28 ?793次閱讀
    Kaggle知識點:7種<b class='flag-5'>超</b><b class='flag-5'>參數</b>搜索方法

    xgboost參數調優技巧 xgboost圖像分類中的應用

    一、XGBoost參數調優技巧 XGBoost(eXtreme Gradient Boosting)是一種基于梯度提升決策樹(GBDT)的高效梯度提升框架,機器學習競賽和實際業務應用中取得了卓越
    的頭像 發表于 01-31 15:16 ?898次閱讀

    鑄科技榮登2024創業邦100未來獨角獸榜單

    第16屆創業邦100未來獨角獸峰會上,鑄科技以其AI大算力芯片領域的杰出成就和巨大潛力,榮登“2024創業邦
    的頭像 發表于 12-28 15:49 ?749次閱讀

    訊飛星火端模型發布

    參數量小、內存占比小的端模型,正成為“兵家必爭之地”。
    的頭像 發表于 12-04 16:07 ?1206次閱讀

    中國移動與中國石油發布700參數昆侖大模型

    近日,中國移動與中國石油北京聯合舉辦了700參數昆侖大模型建設成果發布會,正式推出了這一行業重量級的大模型。 據悉,700
    的頭像 發表于 12-04 11:17 ?798次閱讀

    DAC8760連續工作一段時間后,Iout出現輸出電流突然增大到100mA的情況,怎么解決?

    我們使用DAC8760在產品上使用幾個月后,Iout出現輸出電流突然增大到100mA的情況,造成板子故障。 附件有原理圖,能幫忙分析可能出現的問題嗎?
    發表于 12-04 08:37

    李彥宏宣布:百度文心大模型日調用量15

    和深遠影響。 李彥宏在演講中透露,百度文心大模型在過去半年內實現了驚人的增長,日均調用量從幾個月前的2次迅速攀升至15次,增長率高達7.5倍。這一增長趨勢不僅超出了百度內部的預期,
    的頭像 發表于 11-12 10:40 ?479次閱讀

    通與智譜推動多模態生成式AI體驗的終端側部署

    此前,驍龍峰會首日,智譜與通技術公司宣布合作將GLM-4V端側視覺大模型,面向驍龍8至尊版進行深度適配和推理優化,支持豐富的多模態交互方式,進一步推動多模態生成式AI終端
    的頭像 發表于 11-08 09:55 ?530次閱讀

    航天級100krad 100V電流檢測電路

    電子發燒友網站提供《航天級100krad 100V電流檢測電路.pdf》資料免費下載
    發表于 09-07 09:57 ?0次下載
    航天級<b class='flag-5'>100</b>krad <b class='flag-5'>100</b>V<b class='flag-5'>高</b><b class='flag-5'>側</b>電流檢測電路

    英偉達震撼發布:全新AI模型參數規模躍升至80量級

    8月23日,英偉達宣布,其全新AI模型面世,該模型參數規模高達80,具有精度、計算效益大等優勢,適用于GPU加速的數據中心、云及工作站環
    的頭像 發表于 08-23 16:08 ?1015次閱讀

    新火種AI 月之暗面再獲融資!200估值,中國模型公司新寵兒?

    美元,約合236人民幣,一舉躍過“200門檻”。 有意思的是,獲得新融資的不僅僅有月之暗面,最近幾個月,儼然成為了各個大模型公司的“融資時刻”: 7月25日,百川智能完成了50
    的頭像 發表于 08-15 09:12 ?592次閱讀
    新火種AI 月之暗面再獲融資!200<b class='flag-5'>億</b>估值,中國<b class='flag-5'>模型</b>公司新寵兒?
    主站蜘蛛池模板: 一级无毛片 | 天天摸天天爽天天澡视频 | 欧美视频不卡一区二区三区 | 欧美高清一级片 | 亚洲伊人久久大香线蕉啊 | 国产一线在线观看 | 国产中出视频 | 222在线视频免费观看 | 影音先锋 色天使 | 黄色靠逼网站 | 狠狠色噜噜狠狠狠狠黑人 | 狠狠色狠狠色综合日日小蛇 | 四虎4hu影库免费永久国产 | 天天综合在线视频 | 国产精品女仆装在线播放 | 国产一级又色又爽又黄大片 | 国产在线黄 | 天天射天天射 | 天天做天天爱天天爽综合区 | 久久精品男人的天堂 | 亚洲成人精品 | 亚州色图欧美色图 | 好男人社区www在线观看 | 91大神在线观看视频 | 欧美日a | 刺激第一页720lu久久 | 亚洲va久久久噜噜噜久久 | 大量真实偷拍情侣视频野战 | 色哟永久免费 | 久久99热不卡精品免费观看 | 久久天天干 | 二区中文字幕 | 免费黄色 | 999毛片| 美女黄网站人色视频免费国产 | 国产视频一二三 | 性欧美极品另类 | 欧美猛性 | 国产美女久久久 | 2020欧美极品hd18 | 午夜性刺激免费视频观看不卡专区 |