在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GAITC2025|張科:端云一體大模型推理應(yīng)用實(shí)戰(zhàn)

京東云 ? 來(lái)源:jf_75140285 ? 作者:jf_75140285 ? 2025-06-26 09:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近期,2025全球人工智能技術(shù)大會(huì)(GAITC2025)于杭州盛大開(kāi)幕,匯聚全球頂尖科學(xué)家、技術(shù)領(lǐng)袖及行業(yè)先鋒,共同探討人工智能技術(shù)產(chǎn)業(yè)化新趨勢(shì)。京東零售AI Infra &大數(shù)據(jù)計(jì)算負(fù)責(zé)人張科受邀出席并在《行業(yè)大模型應(yīng)用與發(fā)展》論壇發(fā)表演講,首次深入介紹京東零售在端云一體大模型推理架構(gòu)的實(shí)戰(zhàn)經(jīng)驗(yàn)與技術(shù)探索,并分享AI推理方向的未來(lái)發(fā)展思考。以下為張科分享實(shí)錄,內(nèi)容經(jīng)編輯略有刪減:

電商場(chǎng)景AI推理的挑戰(zhàn)

大模型技術(shù)突飛猛進(jìn),大模型不僅是算法和算力的集合體,更是產(chǎn)業(yè)智能化的新底座,正在推動(dòng)AI從“可用”向“好用、可控、可信”邁進(jìn)。電商場(chǎng)景作為AI技術(shù)的應(yīng)用場(chǎng),逐步形成了三個(gè)主要的需求方向:

Generative AI

(如AI生成商品圖、短視頻、AI營(yíng)銷內(nèi)容生成、AI數(shù)字人)、

Agentic AI

(如AI客服與售后管理、AI經(jīng)營(yíng)托管、AI倉(cāng)配優(yōu)化 、AI交互式推薦)、

Physical AI

(如自動(dòng)分揀機(jī)器人、智能空間、自動(dòng)駕駛)。在復(fù)雜場(chǎng)景與多元需求的驅(qū)動(dòng)下,AI推理正面臨一系列技術(shù)挑戰(zhàn),包括輸入類型多樣、用戶需求優(yōu)先級(jí)不同;端(如手機(jī))和云(服務(wù)器)之間任務(wù)分配難、協(xié)同優(yōu)化難;模型壓縮和性能優(yōu)化等問(wèn)題。

京東零售聯(lián)合清華大學(xué)推出 xLLM 端云一體大模型推理架構(gòu)

2022年起,京東與清華大學(xué)開(kāi)啟深度合作,在計(jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)、推薦系統(tǒng)、大數(shù)據(jù)等領(lǐng)域聯(lián)合開(kāi)展了十余項(xiàng)課題研究。今年雙方進(jìn)一步拓展合作邊界,新增

大模型推理引擎國(guó)產(chǎn)化、多模態(tài)推薦大模型

等前沿方向,聚焦整合技術(shù)資源與學(xué)術(shù)優(yōu)勢(shì),共同探索前沿技術(shù)創(chuàng)新,推動(dòng)科研成果向?qū)嶋H生產(chǎn)力轉(zhuǎn)化。自今年初大模型推理引擎國(guó)產(chǎn)化合作開(kāi)展以來(lái),京東零售和清華大學(xué)一起在大模型量化壓縮、端-云協(xié)同推理引擎等方向聯(lián)合攻堅(jiān),并提出“xLLM 端云一體大模型推理架構(gòu)”,以解決推理引擎的性能優(yōu)化問(wèn)題、助力大模型技術(shù)在復(fù)雜電商環(huán)境的規(guī)?;涞?。通過(guò)端云聯(lián)合部署,實(shí)現(xiàn)高效協(xié)同推理。利用終端用戶數(shù)據(jù)和反饋,云端模型持續(xù)優(yōu)化并實(shí)時(shí)更新終端輕量化模型,形成閉環(huán)進(jìn)化系統(tǒng),提高模型在實(shí)際場(chǎng)景中的性能。該架構(gòu)還可適應(yīng)不同終端設(shè)備資源限制,實(shí)現(xiàn)大模型更廣泛復(fù)用。

xLLM端云一體大模型推理架構(gòu)中的技術(shù)探索還表現(xiàn)在以下4個(gè)方面:

1.自適應(yīng)調(diào)度優(yōu)化:

動(dòng)態(tài)調(diào)整Prefill與Decode節(jié)點(diǎn)比例,實(shí)現(xiàn)動(dòng)態(tài)的自適應(yīng)彈性PD能力。

2.在離線統(tǒng)一調(diào)度:

根據(jù)負(fù)載實(shí)時(shí)調(diào)度在離線請(qǐng)求,實(shí)現(xiàn)請(qǐng)求級(jí)別的在離線混部的能力。

3.多層流水線執(zhí)行:

最大化資源利用率,通過(guò)調(diào)度和模型執(zhí)行異步流水線、不同Layer的計(jì)算和通信異步流水線、不同計(jì)算單元、訪存并行流水線的多層流水線執(zhí)行。

4.端云Agent協(xié)同:

端Agent處理簡(jiǎn)單任務(wù)與隱私數(shù)據(jù),云 Agent 不斷反饋優(yōu)化,提升端 Agent 能力,并基于高效 Agent 協(xié)議協(xié)同。目前該推理架構(gòu)已經(jīng)在內(nèi)部多個(gè)場(chǎng)景應(yīng)用,在可交互式導(dǎo)購(gòu)、商品對(duì)比、商品總結(jié)、購(gòu)物建議等環(huán)節(jié),大幅提升了響應(yīng)速度,節(jié)省了計(jì)算成本,同時(shí)還有效助力了用戶的活躍度。在核心的商品理解環(huán)節(jié),也有效提升了大模型的理解能力和信息處理能力,模型推理成本最高可節(jié)省70%。

AI推理方向的未來(lái)思考

在現(xiàn)有技術(shù)探索的基礎(chǔ)上,未來(lái)京東還將持續(xù)加大對(duì)國(guó)產(chǎn) AI 基礎(chǔ)設(shè)施的投入力度,著力構(gòu)筑自主可控的技術(shù)生態(tài)體系。京東將重點(diǎn)聚焦三大前沿方向展開(kāi)深入研究:

破解規(guī)模、效率、成本的 “不可能三角”、推進(jìn)(端云)多智能體異步自進(jìn)化、端云分布式推理的可解釋和可調(diào)試

。通過(guò)上述布局,京東希望逐步實(shí)現(xiàn)主流國(guó)產(chǎn)芯片的深度適配優(yōu)化,并基于自主研發(fā)的大模型推理框架,推動(dòng)技術(shù)效率達(dá)到國(guó)際先進(jìn)水平。也希望和業(yè)界同行共探技術(shù)邊界、一起前行。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34733

    瀏覽量

    276820
  • 人工智能
    +關(guān)注

    關(guān)注

    1805

    文章

    48887

    瀏覽量

    247794
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3083

    瀏覽量

    3956
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    DeepSeek賦能,大模型一體機(jī)破解企業(yè)AI落地難題

    數(shù)據(jù)訓(xùn)練、模型部署等任務(wù),確保敏感數(shù)據(jù)不外泄。 ? 其核心價(jià)值在于簡(jiǎn)化部署流程、降低算力使用門檻,提升AI訓(xùn)練與推理效率。據(jù)IDC報(bào)告,2025年中國(guó)AI大模型
    的頭像 發(fā)表于 06-09 07:13 ?5105次閱讀
    DeepSeek賦能,大<b class='flag-5'>模型</b><b class='flag-5'>一體</b>機(jī)破解企業(yè)AI落地難題

    首創(chuàng)開(kāi)源架構(gòu),天璣AI開(kāi)發(fā)套件讓側(cè)AI模型接入得心應(yīng)手

    AI巨頭強(qiáng)強(qiáng)聯(lián)手,勢(shì)必為智能化AI體驗(yàn)時(shí)代按下超級(jí)加速鍵。 AI終端的下步是“普適智能”,而不是“極限性能”。聯(lián)發(fā)憑借天璣9400+強(qiáng)悍的側(cè)AI能力,加上從
    發(fā)表于 04-13 19:52

    硅基覺(jué)醒已至前夜,聯(lián)發(fā)攜手生態(tài)加速智能化用戶體驗(yàn)時(shí)代到來(lái)

    ,芯片能力的躍遷都是切的起點(diǎn)。從率先落地側(cè)AI大模型,到打造天璣AI智能化引擎,聯(lián)發(fā)
    發(fā)表于 04-13 19:51

    華為發(fā)布網(wǎng)一體化網(wǎng)絡(luò)安全解決方案

    3月20日至21日,以“因聚而生 眾智有為”為主題的華為中國(guó)合作伙伴大會(huì)2025在深圳舉行。期間,華為數(shù)據(jù)通信產(chǎn)品線安全分銷領(lǐng)域總監(jiān)峰在“華為坤靈直播間”面向中小企業(yè)發(fā)布網(wǎng)
    的頭像 發(fā)表于 03-21 17:28 ?673次閱讀

    中科曙光助力天翼打造“翼政通”大模型一體機(jī)

    近來(lái),DeepSeek系列模型在政務(wù)領(lǐng)域展現(xiàn)出強(qiáng)大的賦能潛力。天翼選擇曙光AI解決方案,憑借內(nèi)置的DeepAI深算智能引擎,完成軟硬件適配與深度調(diào)優(yōu),聯(lián)合打造出“翼政通”大模型一體機(jī)
    的頭像 發(fā)表于 03-13 11:35 ?840次閱讀

    壁仞科技推出阿里QWQ-32B大模型一體機(jī)

    能力等關(guān)鍵測(cè)試中展現(xiàn)出卓越性能。 作為國(guó)產(chǎn)AI算力重要推動(dòng)力量,壁仞科技不斷測(cè)試與更新適配最先進(jìn)大模型,聯(lián)合生態(tài)合作伙伴共同推出QWQ-32B大模型一體機(jī)。 在模型發(fā)布后數(shù)小時(shí)內(nèi),壁仞
    的頭像 發(fā)表于 03-10 09:05 ?1139次閱讀
    壁仞科技推出阿里QWQ-32B大<b class='flag-5'>模型</b><b class='flag-5'>一體</b>機(jī)

    標(biāo)普DeepSeek一體機(jī)發(fā)布:零門檻部署企業(yè)DeepSeek

    通過(guò)線上直播正式發(fā)布DeepSeek大模型一體機(jī),以“硬件+模型+部署+應(yīng)用落地”的到端方案,破解傳統(tǒng)大
    的頭像 發(fā)表于 02-17 16:49 ?544次閱讀

    曙光發(fā)布DeepSeek大模型超融合一體機(jī)

    近日,曙光在技術(shù)創(chuàng)新領(lǐng)域再度發(fā)力,震撼發(fā)布了全國(guó)產(chǎn)DeepSeek大模型超融合一體機(jī)。這革命性的產(chǎn)品不僅彰顯了曙光在AI和
    的頭像 發(fā)表于 02-17 11:11 ?781次閱讀

    曙光推出DeepSeek大模型一體機(jī)

    近日,曙光震撼發(fā)布全國(guó)產(chǎn)DeepSeek大模型超融合一體機(jī)。這創(chuàng)新產(chǎn)品將為政府和企業(yè)的數(shù)字化、智能化轉(zhuǎn)型按下“加速鍵”。
    的頭像 發(fā)表于 02-14 18:02 ?953次閱讀

    從科技從容大模型訓(xùn)推一體機(jī)成功適配DeepSeek

    了新的動(dòng)能。 從容大模型訓(xùn)推一體機(jī)是從科技基于昇騰AI基礎(chǔ)軟硬件平臺(tái)推出的創(chuàng)新產(chǎn)品。該產(chǎn)品集成了大模型一體化生產(chǎn)平臺(tái),具備
    的頭像 發(fā)表于 02-14 15:44 ?736次閱讀

    新華三發(fā)布DeepSeek大模型一體機(jī)UniCube

    ,為各行各業(yè)的智能進(jìn)化注入了全新動(dòng)力。 UniCube一體機(jī)實(shí)現(xiàn)了671B DeepSeek大模型的單機(jī)推理及單機(jī)訓(xùn)推一體服務(wù),這意味著用戶可以在單個(gè)設(shè)備上完成
    的頭像 發(fā)表于 02-11 15:21 ?1519次閱讀

    廣汽ADiGO SENSE一體模型與DeepSeek-R1大模型完成深度融合

    ? 2025年2月8日,段實(shí)車視頻演示了廣汽智能車機(jī)借助DeepSeek-R1大模型回答語(yǔ)音提問(wèn)的表現(xiàn),這標(biāo)志著廣汽自主研發(fā)的ADiGO SENSE
    的頭像 發(fā)表于 02-10 09:21 ?1412次閱讀

    阿里開(kāi)源推理模型QwQ

    近日,阿里通義團(tuán)隊(duì)宣布推出全新AI推理模型QwQ-32B-Preview,并同步實(shí)現(xiàn)了開(kāi)源。這舉措標(biāo)志著阿里在AI推理領(lǐng)域邁出了重要
    的頭像 發(fā)表于 11-29 11:30 ?1106次閱讀

    一體化物聯(lián)網(wǎng)平臺(tái)如何實(shí)現(xiàn)?有什么功能

    一體化物聯(lián)網(wǎng)平臺(tái)(CloudEdge Integration IoT Platform)是種結(jié)合了計(jì)算和邊緣計(jì)算優(yōu)勢(shì)的物聯(lián)網(wǎng)解決方案。它通過(guò)在云端和邊緣
    的頭像 發(fā)表于 07-29 14:34 ?760次閱讀
    主站蜘蛛池模板: 午夜视频1000部免费看 | 亚洲欧美日韩一区 | 欧美xxxx做受欧美88bbw | 人与牲动交xxxxbbbb高清 | 久久精品亚洲一区二区三区浴池 | 黄网站在线播放 | 免费在线成人网 | 综合啪啪| 色y情视频免费看 | 成人在线视频网 | 狠狠欧美| 欧美三级黄色 | 韩国三级床戏合集 | 亚洲一区二区三区四区在线观看 | 中国一级特黄视频 | 天堂最新版免费观看 | 国产精品久久久久久久久久妇女 | 美女扒开尿囗给男生桶爽 | 在线看你懂 | a级毛片毛片免费很很综合 a级男女性高爱潮高清试 | 四虎影院永久免费 | 日本黄色免费在线 | 亚洲国产成人久久一区久久 | 一级做a爰片久久毛片图片 一级做a爰片久久毛片鸭王 | 婷婷色综合网 | 狠狠色丁香婷婷综合视频 | 1000部啪啪未满十八勿入中国 | 黄色一级片网址 | 日日噜噜噜夜夜爽爽狠狠图片 | 亚洲日本欧美日韩高观看 | 永久免费在线观看 | 性殴美高清视频 | 亚洲卡一卡2卡三卡4卡国色 | 在线观看你懂得 | 欧美亚洲另类在线观看 | 激情婷婷综合久久久久 | 色涩在线 | 五月婷婷婷 | 天堂成人精品视频在线观 | 日本jlzz| 婷婷综合激情 |