在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

解鎖LLM新高度—OpenVINO? 2024.1賦能生成式AI高效運(yùn)行

英特爾物聯(lián)網(wǎng) ? 來源:OpenVINO 中文社區(qū) ? 2024-05-10 10:36 ? 次閱讀

大語言模型推理的改進(jìn)

LLM 的發(fā)展仍保持著驚人的速度。盡管現(xiàn)有的 LLM 已經(jīng)具備強(qiáng)大的功能,但通過 OpenVINO 的優(yōu)化和推理加速,可以對這些復(fù)雜模型的執(zhí)行進(jìn)行精煉,實(shí)現(xiàn)更快、更高效的處理,減少計(jì)算開銷并最大限度發(fā)揮硬件潛力,這將直接導(dǎo)致 LLM 實(shí)現(xiàn)更高的吞吐量和更低的延遲。

通過采用壓縮嵌入實(shí)現(xiàn)額外優(yōu)化,有效地縮減了 LLM 的編譯耗時(shí)與內(nèi)存占用。與此同時(shí),基于英特爾銳炫GPU,以及英特爾高級矩陣擴(kuò)展(Intel AMX)的第4代和第5代英特爾至強(qiáng)平臺之上,LLM 的第一個(gè) token 處理性能得到了顯著提升。

通過 oneDNN 可實(shí)現(xiàn)更好的 LLM 壓縮與性能提升。如今,經(jīng)過量化或壓縮后的 INT4 和 INT8 精度的 LLM 可在英特爾銳炫GPU 上得到支持。在搭載集成 GPU 的英特爾酷睿Ultra 處理器上,針對部分小型 GenAI 模型顯著減少了內(nèi)存消耗。

此外,現(xiàn)在可以在 PyTorch 模型進(jìn)行訓(xùn)練后量化之后,對其進(jìn)行微調(diào),以提高模型精度并簡化從訓(xùn)練后量化過渡到訓(xùn)練感知量化的過程。

已添加演示示例:https://github.com/openvinotoolkit/nncf/blob/develop/examples/quantization_aware_training/torch/resnet18/README.md

更多生成式 AI 覆蓋范圍和框架集成

進(jìn)一步深入了解搭載 OpenVINO 的生成式 AI,該新版本拓寬了生成式AI的邊界,使其能夠覆蓋更廣泛的神經(jīng)網(wǎng)絡(luò)架構(gòu)與應(yīng)用場景。

針對最新發(fā)布的最先進(jìn)的 Llama 3 和 Phi3 模型, OpenVINO 對其實(shí)現(xiàn)了支持和優(yōu)化。

具備混合專家(MoE)架構(gòu)的 LLM 模型 Mixtral 以及 URLNet 模型,均針對英特爾至強(qiáng)處理器進(jìn)行了性能提升優(yōu)化。

文生圖模型 Stable Diffusion 1.5,以及 LLMs 模型 ChatGLM3-6b和Qwen-7B,則專為搭載了集成 GPU 的英特爾酷睿Ultra 處理器進(jìn)行了推理速度的改進(jìn)和優(yōu)化。

現(xiàn)在,OpenVINO 已支持 Falcon-7B-Instruct,這是一款即用型、具備優(yōu)秀性能指標(biāo)的生成式AI大語言模型,適用于聊天與指令場景。

新版本支持的其他模型包括:

Yolo V9、Yolo V8 Oriented Bounding Box Detection (OOB)、Stable Diffusion in Keras、MoblieCLIP、RMBG-v1.4 Background Removal、Magika、TripoSR、AnimateAnyone、LLaVA-Next 以及帶有 OpenVINO 和 LangChain 的 RAG 系統(tǒng)。

我們還在 OpenVINO Notebooks 存儲庫中提供了 Jupyter Notebook 示例。

新平臺的更改和現(xiàn)有平臺的增強(qiáng)

除了 PyPI 上的主 OpenVINO 軟件包外,英特爾酷睿Ultra 處理器的預(yù)覽 NPU 插件現(xiàn)在在 OpenVINO 開源 GitHub 存儲庫中可用。

現(xiàn)在,可以通過 npm 存儲庫更輕松地訪問 JavaScript API,使 JavaScript 開發(fā)人員能夠無縫訪問 OpenVINO API。我們擴(kuò)展了文檔,可幫助開發(fā)人員將他們的 JavaScript 應(yīng)用程序與 OpenVINO 集成。

現(xiàn)在,默認(rèn)情況下已在 ARM 處理器上為卷積神經(jīng)網(wǎng)絡(luò)(CNN)啟用 FP16 推理。在多種 ARM 設(shè)備上,已顯著提升了眾多模型的性能。已實(shí)現(xiàn)與 CPU 架構(gòu)無關(guān)的構(gòu)建,旨在為不同 ARM 設(shè)備提供統(tǒng)一的二進(jìn)制分發(fā)。

新增和更新的 Notebook

OpenVINO Notebooks 仍然是非常有價(jià)值的資源,用于展示如何利用 OpenVINO 在人工智能領(lǐng)域?qū)崿F(xiàn)重要進(jìn)展。最近,我們對 OpenVINO notebooks 存儲庫做了一些改動,包括將默認(rèn)分支從 'main' 更改為 'latest',以及對 "notebooks" 文件夾內(nèi) notebook 的命名結(jié)構(gòu)進(jìn)行了改進(jìn)。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    305

    瀏覽量

    6149
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    528

    瀏覽量

    723
  • OpenVINO
    +關(guān)注

    關(guān)注

    0

    文章

    114

    瀏覽量

    432

原文標(biāo)題:解鎖 LLM 新高度,拓寬模型新邊界 —— OpenVINO? 2024.1 賦能生成式 AI 高效運(yùn)行 | 開發(fā)者實(shí)戰(zhàn)

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    vivo Pad5 Pro搭載MediaTek天璣9400處理器

    vivo Pad5 Pro 搭載天璣 9400 旗艦芯,實(shí)現(xiàn)效、AI 全面進(jìn)階,解鎖平板體驗(yàn)新高度
    的頭像 發(fā)表于 06-05 14:15 ?257次閱讀

    2.5MW全球首發(fā),綠慧充引領(lǐng)行業(yè)新高度!

    ,它以雙兆瓦級系統(tǒng)架構(gòu)與全場景兼容能力,革新大功率充電技術(shù)標(biāo)準(zhǔn),引領(lǐng)行業(yè)新高度。01智能投切全場景功率適配產(chǎn)品單機(jī)功率達(dá)2.5MW,通過智能投切技術(shù)動態(tài)分配功率,
    的頭像 發(fā)表于 04-25 12:18 ?297次閱讀
    2.5MW全球首發(fā),綠<b class='flag-5'>能</b>慧充引領(lǐng)行業(yè)<b class='flag-5'>新高度</b>!

    陶瓷圍壩:解鎖電子封裝領(lǐng)域防護(hù)新高度的關(guān)鍵

    電子封裝技術(shù)作為電子產(chǎn)業(yè)發(fā)展的基石,其防護(hù)性能直接關(guān)乎電子設(shè)備的可靠性與穩(wěn)定性。陶瓷圍壩憑借其獨(dú)特的材料特性和結(jié)構(gòu)優(yōu)勢,在電子封裝防護(hù)領(lǐng)域嶄露頭角,成為解鎖防護(hù)新高度的關(guān)鍵要素。本文深入剖析陶瓷圍壩在電子封裝中的作用、優(yōu)勢及發(fā)展趨勢,旨在揭示其對電子封裝領(lǐng)域的重要意義……
    的頭像 發(fā)表于 03-24 17:10 ?210次閱讀

    利用OpenVINO GenAI解鎖LLM極速推理

    隨著 DeepSeek、 GPT 和 Llama 等大語言模型(LLMs)不斷推動人工智能的邊界,它們在高效部署方面也帶來了重大挑戰(zhàn)。這些模型在生成類似人類的文本方面具有革命性,但每生成一個(gè)
    的頭像 發(fā)表于 03-18 14:09 ?586次閱讀
    利用<b class='flag-5'>OpenVINO</b> GenAI<b class='flag-5'>解鎖</b><b class='flag-5'>LLM</b>極速推理

    富士通如何解鎖生成AI紅利 從人才進(jìn)化到業(yè)務(wù)

    生成AI技術(shù)正以每周迭代一次的速度重塑商業(yè)世界。利用生成AI,營銷部門10分鐘就可以產(chǎn)出百張
    的頭像 發(fā)表于 02-25 17:32 ?763次閱讀

    C#集成OpenVINO?:簡化AI模型部署

    在開源測控、機(jī)器視覺、數(shù)采與分析三大領(lǐng)域中,如何快速將AI模型集成到應(yīng)用程序中, 實(shí)現(xiàn)AI和應(yīng)用增值? 最容易的方式是:在C#中,使用 Open
    的頭像 發(fā)表于 02-17 10:03 ?1880次閱讀
    C#集成<b class='flag-5'>OpenVINO</b>?:簡化<b class='flag-5'>AI</b>模型部署

    古河云接入DeepSeek!AI,智能化應(yīng)用場景再升級

    AI能力接入,古河云將其領(lǐng)先的智能算法與數(shù)據(jù)分析能力融入“開河”平臺,進(jìn)一步提升平臺的技術(shù)深度與應(yīng)用價(jià)值,致力于為企業(yè)提供更精準(zhǔn)、更高效的 智能化管理服務(wù) 。 應(yīng)用場景升級 AI
    的頭像 發(fā)表于 02-14 17:21 ?436次閱讀
    古河云接入DeepSeek!<b class='flag-5'>AI</b><b class='flag-5'>賦</b><b class='flag-5'>能</b>,智能化應(yīng)用場景再升級

    C#中使用OpenVINO?:輕松集成AI模型!

    與分析三大領(lǐng)域中,如何快速將AI模型集成到應(yīng)用程序中,實(shí)現(xiàn)AI和應(yīng)用增值?最容易的方式是:在C#中,使用OpenVINO?工具套件集成
    的頭像 發(fā)表于 02-07 14:05 ?772次閱讀
    C#中使用<b class='flag-5'>OpenVINO</b>?:輕松集成<b class='flag-5'>AI</b>模型!

    解鎖光伏發(fā)電新高度:探秘 400V 轉(zhuǎn) 660V 升壓變壓器核心力量

    解鎖光伏發(fā)電新高度:探秘 400V 轉(zhuǎn) 660V 升壓變壓器核心力量 在追求綠色能源變革的征程中,光伏發(fā)電已然成為耀眼的明星,而 400V 轉(zhuǎn) 660V 升壓變壓器則是隱藏在幕后、默默發(fā)力的關(guān)鍵
    的頭像 發(fā)表于 12-27 10:27 ?437次閱讀
    <b class='flag-5'>解鎖</b>光伏發(fā)電<b class='flag-5'>新高度</b>:探秘 400V 轉(zhuǎn) 660V 升壓變壓器核心力量

    解鎖光伏發(fā)電新高度:探秘400V轉(zhuǎn)660V升壓變壓器核心力量

    解鎖光伏發(fā)電新高度:探秘400V轉(zhuǎn)660V升壓變壓器核心力量 光伏發(fā)電作為綠色能源的重要組成部分,在全球能源結(jié)構(gòu)中扮演著越來越重要的角色。400V轉(zhuǎn)660V升壓變壓器,作為光伏發(fā)電系統(tǒng)中的關(guān)鍵設(shè)備
    的頭像 發(fā)表于 12-13 13:51 ?432次閱讀
    <b class='flag-5'>解鎖</b>光伏發(fā)電<b class='flag-5'>新高度</b>:探秘400V轉(zhuǎn)660V升壓變壓器核心力量

    三行代碼完成生成AI部署

    OpenVINO2024.2版本跟之前版本最大的不同是OpenVINO2024.2分為兩個(gè)安裝包分別是基礎(chǔ)包與生成AI支持包,新發(fā)布的Ge
    的頭像 發(fā)表于 08-30 16:49 ?713次閱讀
    三行代碼完成<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>部署

    高通第三代驍龍7s移動平臺發(fā)布,中端智能手機(jī)以卓越AI新體驗(yàn)

    AI技術(shù),并兼容包括Baichuan-7B及擁有10億參數(shù)的Llama 2在內(nèi)的大型語言模型(LLM),極大地推動了智能手機(jī)智能化進(jìn)程的新高度。
    的頭像 發(fā)表于 08-21 15:42 ?2964次閱讀

    亞馬遜云科技Shulex打造基于生成AI的客服和消費(fèi)者洞察

    "Shulex")在亞馬遜云科技的技術(shù)下,打造基于生成AI的"AI Agent客服機(jī)器人"
    的頭像 發(fā)表于 08-13 20:38 ?521次閱讀

    使用OpenVINO GenAI API的輕量級生成AI

    隨著 ChatGPT 等聊天機(jī)器人的風(fēng)暴席卷全球,生成預(yù)訓(xùn)練 Transformers (GPT) 在開發(fā)者中正在成為家喻戶曉的新名字。生成 A
    的頭像 發(fā)表于 07-24 15:08 ?1151次閱讀

    商湯發(fā)布《2024生成AI教育未來》白皮書

    生成AI正在各個(gè)行業(yè)中展現(xiàn)出巨大的應(yīng)用前景。在關(guān)系國計(jì)民生的教育行業(yè),生成AI能夠催生哪些創(chuàng)
    的頭像 發(fā)表于 06-29 09:48 ?1411次閱讀
    主站蜘蛛池模板: 老师喂我吃她的奶水脱她胸罩 | 色91在线 | 国产成人久视频免费 | 在线天堂资源 | 国产精品乱码高清在线观看 | 午夜视频在线观看www中文 | 天天干干干干 | 91精品久久久久含羞草 | 亚洲色图2| 狠狠色狠狠色综合日日不卡 | 一区二区三区四区视频在线观看 | 色五月丁香五月综合五月 | 99久免费精品视频在线观看2 | 亚洲欧美圣爱天天综合 | 色播影院性播影院私人影院 | 国产午夜三级 | 性做久久久久久 | 99热网址| 国产三级精品三级在线观看 | 午夜想想爱午夜剧场 | 中文天堂资源在线www | 天天插天天射天天干 | 天天夜夜狠狠 | 手机在线看福利 | 一个色在线视频 | 色伊人久久 | 色五丁香| 日本吻胸抓胸激烈视频网站 | 四虎影音在线观看 | h视频在线观看网站 | 加勒比黑人喝羽月希奶水 | 亚洲五月综合网色九月色 | 日韩黄色网 | 成人免费淫片95视频观看网站 | 国产高清一区二区三区 | 99干99| 日本亚洲欧美国产日韩ay高清 | 青娱乐啪啪 | 91大神成人偷拍在线观看 | 三级黄a| 久久青草国产免费观看 |