在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何在手持設備上安裝龐大的transformer網絡

CEVA ? 來源:CEVA ? 2023-10-11 14:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Siri和OK Google是最早實現語音控制的應用程序,這著實為我們帶來了很多樂趣;但很快我們便意識到,必須仔細說出請求才能獲得實用回答。

就現在所見,ChatGPT理解程度高,使用起來更容易,但直到最近,其功能還僅限于通過基于云的應用程序進行文本互動。現如今,ChatGPT是大勢所趨,手機幾乎人人必備,促使著針對ChatGPT(手機版)的transformer網絡盡快推出,讓每個擁有手機的人都能感受到大語言模型的威力。

在此方面面臨的一個明顯挑戰是,我們所知的 ChatGPT依賴于數萬億個參數。而這種規模的transformer網絡只能在云端運行。有人建議采用混合模式,即先由手機或其他應用程序負責完成部分簡單工作,再連接到云端進行更為繁重的推理。然而,普通手機用戶可能無法接受混合解決方案與生俱來的長時間延遲和隱私風險問題。因此,更好的方法是,直接在手機上處理大部分或全部transformer網絡工作,只在需要時將偶爾出現的匿名搜索請求轉至云端處理。

縮減網絡大小

如何在手持設備上安裝龐大的transformer網絡?Google DeepMind在檢索transformer方面取得了重大突破。其RETRO transformer網絡運行時的大小只有 LLM transformer的百分之幾,因為前者的模型參數中不包含具體數據。只保留了基本的語言對話技能,但在理解水平上仍可與GPT3相媲美。如此將網絡大小縮減到了約80億個參數。

CEVA在預處理時進一步縮減此網絡大小,將對感興趣領域提示的準確度幾乎沒有影響的參數歸零,進行再訓練。仔細利用這一功能可以大大加快transformer網絡分析的速度。

準備邊緣模型的第二步是壓縮,CEVA對此非常熟悉,并在支持檢索transformer方面做得更好。我們充分利用NeuPro-M架構進行再訓練,大力推進此步驟,促使廣泛的混合定點精度和低精度選項降到4位,未來甚至還能降到2位。

通過使用這些技術,我們可以將現有檢索transformer壓縮至最低1/20(較現在而言),盡管其相較LLM而言已經壓縮了很多。將這種壓縮剪枝應用于RETRO模型縮減后,可以產生巨大縮減,將萬億參數模型轉換為十億參數模型,進而有望實現ChatGPT(移動版)。

NeuPro-M AI核心

當然,僅僅適合的transformer網絡是不夠的。它還需要運行得足夠快,才能滿足用戶對響應時間的期望。而這一點可以通過專為LLM應用程序優化的NeuPro-M NPU IP多引擎架構實現。在此流程中,首先要做到的是由真正的稀疏引擎來進行管理,且這一步舉足輕重。稀疏引擎管理可跳過權重或數據為零的冗余操作,提高吞吐量,這是需要注意的一點。而在預處理時縮減之后,會出現大量歸零參數,盡管這些參數分布不均勻。對于這種非結構化稀疏引擎,每個NeuPro-M處理器內核中的專用稀疏引擎可發揮4倍性能優勢(與傳統稀疏引擎相比),并相應地降低功耗。

鑒于transformer架構可以分解為可并行實現的離散正交運算,下一優化應運而生。此時,可以利用 NeuPro-M多核架構支持多達8個內核。transformer中 query、key和value三個向量的計算會在引擎中分批進行,在共享公共二級緩存的多個內核并行處理。并行處理不僅有利于attention步驟,還有利于softmax步驟,以及計算attention函數之后的歸一化函數。在傳統的人工智能系統中,softmax可能是遏制性能提升的重大瓶頸。在NeuPro-M中,attention和softmax可以并行實現,因此softmax對于吞吐時間的增加幾乎可以忽略不計。NeuPro-M在transformer計算中實現大規模并行處理如下圖所示。

fca80bde-67ff-11ee-939d-92fbcf53809c.png

fcbd0f2a-67ff-11ee-939d-92fbcf53809c.png

▲transformer計算中的可擴展并行化

NeuPro-M架構包括特殊支持,最大限度地提高芯片吞吐量,線程之間幾乎沒有停滯,進一步簡化這些流中的高度并行性以及線程之間的數據共享。

為ChatGPT(移動版)構建語音界面

完成最難的部分后,在前端添加語音識別和在后端添加文本轉語音,便可以通過額外相對簡單的transformer網絡實現。將我們的ClearVox語音處理前端軟件連接到語音識別transformer,以輸入提示,并接受引導,確定主transformer應執行哪一組精煉提示。必要時,可從互聯網上檢索查詢相關文檔。最后,使用文本轉語音transformer對下載的回復或文件進行語音處理。現在來說,完全在手機上運行,且具有完全基于語音的 ChatGPT功能界面便是ChatGPT(移動版)的不同之處。

更廣泛的應用

NeuPro-M平臺并不局限于ChatGPT(移動版)這樣的GPT類應用。它可以同樣應用于任何生成式方法。例如,您可以使用穩定的擴散transformer生成圖像、視頻或任何其他人工生成或修改的體驗。NeuPro-M解決方案在transformer網絡建模方面非常通用。

審核編輯:彭菁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 網絡
    +關注

    關注

    14

    文章

    7795

    瀏覽量

    90628
  • 手持設備
    +關注

    關注

    0

    文章

    48

    瀏覽量

    24295
  • 應用程序
    +關注

    關注

    38

    文章

    3329

    瀏覽量

    58882
  • Transformer
    +關注

    關注

    0

    文章

    151

    瀏覽量

    6465

原文標題:針對ChatGPT(手機版)的優化版Transformer網絡

文章出處:【微信號:CEVA-IP,微信公眾號:CEVA】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    【經驗分享】在Omni3576編譯Redis-8.0.2源碼,并安裝及性能測試

    本文首先介紹Redis是什么,然后介紹如何在Omni3576編譯Redis-8.0.2源碼,以及從源碼編譯、安裝Redis,最后介紹如何在Omni3576
    的頭像 發表于 06-05 08:05 ?199次閱讀
    【經驗分享】在Omni3576<b class='flag-5'>上</b>編譯Redis-8.0.2源碼,并<b class='flag-5'>安裝</b>及性能測試

    何在Android設備安裝Cyusb3014芯片驅動?

    1.如何在Android設備安裝Cyusb3014芯片驅動? 我們在 Windows 上有 FX3 驅動程序 SDK。 2.如何在Andr
    發表于 05-15 07:23

    何在Ubuntu安裝NVIDIA顯卡驅動?

    專有顯卡驅動。本文將詳細介紹在Ubuntu系統安裝NVIDIA顯卡驅動的多種方法,幫助用戶根據自身情況選擇最適合的安裝方式。 二,硬件參數 平臺:PX22_GPU CPU:I7-1165G7
    的頭像 發表于 05-07 16:05 ?514次閱讀
    如<b class='flag-5'>何在</b>Ubuntu<b class='flag-5'>上</b><b class='flag-5'>安裝</b>NVIDIA顯卡驅動?

    告別復雜的終極指南:如何在樹莓派上安裝 Manjaro:2024

    如果你想在RaspberryPi上體驗ArchLinux,Manjaro可能是你的最佳選擇。它基于Arch,但被打包成一個傳統的Linux發行版,支持多種桌面環境和架構。讓我們來學習如何在RaspberryPi安裝它。什么是L
    的頭像 發表于 03-25 09:39 ?511次閱讀
    告別復雜的終極指南:如<b class='flag-5'>何在</b>樹莓派上<b class='flag-5'>安裝</b> Manjaro:2024

    人臉識別指南:如何在樹莓派上安裝和設置 Dlib

    學習如何在樹莓派上安裝Dlib并配置人臉識別功能,為您的AI項目奠定基礎。在樹莓派上安裝Dlib的詳細步驟要為樹莓派安裝Dlib并確保人臉識別項目順利運行,請按照以下詳細步驟操作。前置
    的頭像 發表于 03-24 17:31 ?692次閱讀
    人臉識別指南:如<b class='flag-5'>何在</b>樹莓派上<b class='flag-5'>安裝</b>和設置 Dlib

    磁編碼器在手持噴碼機上的作用

    首先我們要了解下手持噴碼機,手持噴碼機通常用于在物品表面打印各類信息,手持式的工作特點是方便靈活移動。但是同時因為手會抖動或者物體表面的不平整等因素會導致打印的信息彎曲變形,所以需要一個編碼器來做
    發表于 03-04 16:52

    Ubuntu系統的虛擬機安裝步驟 如何在Ubuntu系統編譯軟件

    Ubuntu系統安裝虛擬機的步驟 在Ubuntu系統安裝虛擬機是一個相對簡單的過程,通常可以通過安裝VirtualBox或KVM等虛擬化
    的頭像 發表于 12-12 14:36 ?1183次閱讀

    Transformer是機器人技術的基礎嗎

    生成式預訓練Transformer(GPT)被吹捧為將徹底改變機器人技術。但實際應用中,GPT需要龐大且昂貴的計算資源、冗長的訓練時間以及(通常)非機載無線控制,諸多限制之下,GPT技術真的
    的頭像 發表于 12-05 10:54 ?639次閱讀
    <b class='flag-5'>Transformer</b>是機器人技術的基礎嗎

    Transformer模型能夠做什么

    盡管名為 Transformer,但它們不是電視銀幕的變形金剛,也不是電線桿垃圾桶大小的變壓器。
    的頭像 發表于 11-20 09:27 ?946次閱讀
    <b class='flag-5'>Transformer</b>模型能夠做什么

    LV1365-EX條碼識別模組在手持終端類中的應用

    在當今數字化轉型的浪潮中,高效、精準的數據采集成為各行業提升運營效率的關鍵。LV1365-EX條碼識別模組,憑借其卓越的性能和強大的條碼識別能力,在手持終端設備中展現出了非凡的應用潛力,成為物流
    的頭像 發表于 09-09 14:24 ?429次閱讀
    LV1365-EX條碼識別模組<b class='flag-5'>在手持</b>終端類中的應用

    何在linux的“ifconfig -a”下枚舉wifi接口網絡,就像wlan0一樣?

    何在 linux 的“ifconfig -a”下枚舉 wifi 接口網絡,就像 wlan0 一樣
    發表于 07-19 06:54

    Transformer能代替圖神經網絡

    Transformer作為一種在處理序列數據方面表現出色的深度學習模型,自其提出以來,已經在自然語言處理(NLP)、時間序列分析等領域取得了顯著的成果。然而,關于Transformer是否能完全代替圖神經網絡(GNN)的問題,需
    的頭像 發表于 07-12 14:07 ?855次閱讀

    網絡模塊的安裝方法

    網絡模塊的安裝方法主要包括以下幾個步驟,這些步驟將確保安裝的準確性和網絡模塊的穩定運行: 準備階段: 確定網絡設備的型號、規格和技術參數,確
    的頭像 發表于 07-12 09:58 ?1578次閱讀

    求助,請問如何在Windows系統安裝ESP-IDF?具鏈?

    求助,請問如何在Windows系統安裝ESP-IDF?具鏈?
    發表于 07-09 06:28

    Transformer 能代替圖神經網絡嗎?

    Transformer模型發布時,它徹底革新了機器翻譯領域。雖然最初是為特定任務設計的,但這種革命性的架構顯示出它可以輕松適應不同的任務。隨后成為了Transformer一個標準,甚至用于它最
    的頭像 發表于 07-02 08:27 ?536次閱讀
    <b class='flag-5'>Transformer</b> 能代替圖神經<b class='flag-5'>網絡</b>嗎?
    主站蜘蛛池模板: 两性色视频 | 亚洲一区二区三区免费看 | 四虎东方va私人影库在线观看 | 视频免费在线观看 | 爱爱欧美 | 日本有色视频 | 国产精品爱啪在线线免费观看 | 18岁禁黄色 | 成人黄色免费看 | 新版天堂中文网 | 加勒比日本道 | 四虎必出精品亚洲高清 | 成人国产精品高清在线观看 | 好男人午夜www视频在线观看 | 欧美在线观看www | 久久看免费视频 | 扒开双腿猛进湿润18p | 在线播放真实国产乱子伦 | 日韩精品在线第一页 | 国产精品免费久久久免费 | 在线国产你懂的 | 午夜国产在线观看 | 国产亚洲一区二区三区在线 | 色六月婷婷 | 台湾一级毛片 | 久久精品视频观看 | 久久精品国产夜色 | mide-776中文字幕在线 | 99精品在免费线视频 | 日本一级高清不卡视频在线 | 久久婷婷国产一区二区三区 | 亚洲国产综合人成综合网站00 | 狠狠婷婷 | 欧美sese | 五月婷婷爱 | 成年香蕉大黄美女美女 | 亚洲狠狠婷婷综合久久久久图片 | 久草香蕉在线 | 五月香婷婷 | 日本xxx69hd | 亚洲啪啪网站 |