在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

探索AI工廠的創收潛力

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2025-05-29 14:21 ? 次閱讀

“首次價值實現時間”是 AI 開發領域最重要的指標之一。

AI 正在為所有人創造價值,從藥物發現領域的研究人員到應對金融市場變化的量化分析師均受益匪淺。

AI 系統生成“token”(用于串聯輸出結果的數據單元)的速度越快,其影響力就越大。這正是 AI 工廠的關鍵所在,它提供了從“首 token 時延”到“首次價值實現時間”的最高效路徑。

AI 工廠正在重新定義現代基礎設施的經濟學。它們通過大規模地將數據轉化為有價值的輸出內容(無論是 token、預測、圖像、蛋白質還是其他形式的內容)來生產智能。

AI 工廠有助于提升 AI 應用流程中的三個關鍵環節:數據攝取、模型訓練和高吞吐量推理。通過三大核心技術棧(AI 模型、加速計算基礎設施和企業級軟件),AI 工廠能夠更快、更精準地生成 token。

下面將介紹 AI 工廠是如何幫助全球各地的企業把最寶貴的數字商品——數據轉化為創收潛力的。

從推理經濟學到價值創造

在構建 AI 工廠之前,理解推理經濟學至關重要,推理經濟學意味著如何平衡成本、能效和日益增長的 AI 需求。

吞吐量指模型可生成的 token 總量。延遲是模型在特定時間內輸出的 token 數量,通常以首 token 時延(用戶輸入提示后,模型生成第一個輸出 token 所需的時間)和“首 token 后,每個輸出 token 的時延”(生成每個額外 token 所需的時間)來衡量。有效吞吐量(Goodput)是一個較新的指標,用于衡量一個系統在滿足延遲目標的同時可交付的有用輸出量。

用戶體驗是所有軟件應用的關鍵所在,AI 工廠也不例外。高吞吐量意味著更智能的 AI,低延遲則確保了及時的響應。當這兩項指標實現合理平衡時,AI 工廠就可通過快速提供有用的輸出,帶來卓越的用戶體驗。

例如,響應時間為 0.5 秒的 AI 客服比 5 秒響應的 AI 客服更具吸引力和價值,即使兩者最終生成的 token 數量相同。

企業可借此機會為其推理輸出設定具有競爭力的價格,從而提升每個 token 的創收潛力。

衡量和可視化這種平衡頗具挑戰,而這正是“帕累托”前沿概念的用武之地。

AI 工廠輸出:高效 Token 的價值

在規?;渴?AI 時,帕累托前沿有助于直觀地表明如何在沖突的目標(如快速響應與同時服務更多用戶)之間達到最優的平衡。

縱軸代表給定能耗下的吞吐效率(單位為 TPS,也就是每秒 token 數)。該數值越高,AI 工廠可同時處理的請求就越多。

橫軸表示單個用戶的 TPS,代表模型響應用戶給出首個提示的用時。該數值越高,預期的用戶體驗就越好。對于聊天機器人和實時分析工具等交互式應用,更低的延遲和快速的響應尤為重要。

帕累托前沿的最大值(顯示為曲線頂點)代表了特定運行配置下的最佳輸出。目標是為不同的 AI 工作負載和應用找到吞吐量與用戶體驗之間的最優平衡。

頂尖的 AI 工廠通過加速計算來提升“每瓦 token 數”,即在優化 AI 性能的同時大幅提高 AI 工廠和應用的能效。

以上展示的動畫對比了在NVIDIA Hopper GPU(配置為每用戶每秒 32 個 token)與NVIDIA Blackwell Ultra GPU(配置為每用戶每秒 344 個 token)上運行時的用戶體驗。在上述用戶體驗設置下,Blackwell Ultra 實現了 10 倍以上的體驗提升和近 5 倍的更高吞吐量,實現了最高達 50 倍的創收潛力。

AI 工廠的實際運行

AI 工廠是一個系統,它包含了一套將數據轉化為智能的組件。它不一定是高端的本地數據中心,也可能是在加速計算基礎設施上運行的 AI 專用云或混合模型,甚至可能是同時優化網絡并執行邊緣推理的電信基礎設施。

任何配備了軟件的加速計算基礎設施,只要能通過 AI 將數據轉化為智能,本質上均可視為 AI 工廠。

AI 工廠的組件包括了加速計算、網絡、軟件、存儲、系統以及工具和服務。

當用戶向 AI 系統輸入提示時,AI 工廠的全棧系統就開始工作。它將提示 token 化,也就是將數據轉化為圖像、聲音、文字片段等語義單元。

每個 token 被輸入到 GPU 驅動的 AI 模型中,隨之在模型上進行計算密集型推理,以生成最佳響應。每個 GPU 通過高速網絡和互連技術執行并行處理,從而同時處理海量數據。

對于來自全球用戶的各種提示,AI 工廠都會運行上述流程。這種實時推理能夠以工業級規模來生產智能。

由于 AI 工廠整合了整個 AI 生命周期,該系統能夠持續改進:記錄推理過程,標記邊緣案例以進行再訓練,優化循環隨時間逐漸收斂。這一切均無需人工干預,這就是“有效吞吐量”的實際體現。

面向 AI 工廠的 NVIDIA 全棧技術

AI 工廠將 AI 從一系列零散的實驗轉化為可擴展、可重復且可靠的創新與商業價值生成引擎。

NVIDIA 提供構建 AI 工廠所需的所有組件,包括加速計算、高性能 GPU、高帶寬網絡和優化的軟件。

例如,NVIDIA Blackwell GPU可以通過網絡連接,采用液冷技術提升能效,并由 AI 軟件統一編排。

開源推理平臺NVIDIA Dynamo為 AI 工廠提供了一種操作系統,該系統旨在以最高的效率和最低的成本加速并擴展 AI。通過智能地路由、調度和優化推理請求,Dynamo 確保每個 GPU 周期都能得到充分利用,從而以峰值性能生產 token。

NVIDIA Blackwell GB200 NVL72系統和NVIDIA InfiniBand網絡專為最大化“每瓦 token 吞吐量”而設計,使 AI 工廠在總吞吐量和低延遲方面均實現高效運行。

通過驗證優化后的全棧解決方案,企業可以高效地構建和維護前沿 AI 系統。全棧 AI 工廠助力企業實現卓越運營,使他們能更快、更自信地駕馭 AI 的潛力。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5274

    瀏覽量

    105934
  • 數據中心
    +關注

    關注

    16

    文章

    5171

    瀏覽量

    73291
  • AI
    AI
    +關注

    關注

    88

    文章

    34588

    瀏覽量

    276187

原文標題:探索 AI 工廠的創收潛力

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    AI技術助力可持續發展

    AI潛力,并減輕其潛在缺點的影響,行業必須在開發、部署和使用中采用可持續的實踐方式,同時探索有效利用 AI 的方法,以減輕對整個社會的環境影響。
    的頭像 發表于 06-19 10:43 ?289次閱讀

    NVIDIA擴展適用于AI工廠數字孿生的Omniverse Blueprint

    NVIDIA 宣布大幅擴展適用于 AI 工廠數字孿生的 Omniverse Blueprint,為工程團隊提供更多 AI 工廠構建工具,目前已作為預覽版推出。
    的頭像 發表于 05-22 09:48 ?248次閱讀

    關于AI工廠三階段模型

    在今天(2025年5月20日)的Computex大會上,富士康董事長劉揚偉發表了以“AI工廠三階段模型”及“Genesis”為核心的Keynote演講,提到鴻海集團在AI轉型中的戰略布局。這一
    的頭像 發表于 05-20 23:26 ?356次閱讀
    關于<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>三階段模型

    工廠園區AI行為識別系統作用

    工廠園區AI行為識別系統作用 工廠園區AI行為識別系統是什么? 工廠園區AI行為識別系統是基于人
    的頭像 發表于 05-06 17:49 ?182次閱讀

    NVIDIA驅動的AI工廠正在重新定義數據中心

    NVIDIA 及其生態系統合作伙伴正在為 AI 推理時代構建大規模 AI 工廠,而每家企業都將需要一個這樣的工廠。
    的頭像 發表于 04-11 11:27 ?413次閱讀
    NVIDIA驅動的<b class='flag-5'>AI</b><b class='flag-5'>工廠</b>正在重新定義數據中心

    適用于數據中心和AI時代的800G網絡

    ,成為新一代AI數據中心的核心驅動力。 AI時代的兩大數據中心:AI工廠AIAI時代
    發表于 03-25 17:35

    東軟載波工廠AI智慧照明方案解析

    東軟載波工廠AI智慧照明方案主要基于PLC電力線載波通信技術及自研智慧管控平臺,對工廠各區域的照明設備進行集中化、自動化、智能化管控,滿足現代工廠生產經營所需的照明要求。
    的頭像 發表于 11-30 09:09 ?901次閱讀

    麗臺科技推出WS3008 AI一體機

    隨著 AI 技術的不斷進步和商業應用的深入探索,AI 一體機作為企業智能化轉型的重要載體,正逐步展現出其獨特的價值和潛力。為適用于更多企業轉型需求以及更靈活的場景化要求,麗臺科技現推出
    的頭像 發表于 11-27 11:11 ?796次閱讀

    一文了解AI網絡互聯的市場潛力

    AI網絡多層次的互聯彰顯市場潛力 NVIDIA作為全球領先的視覺計算和人工智能公司,其市值突破萬億元的背后,除了強大的GPU產品線,互聯技術扮演了不可或缺的支柱角色。NVIDIA于2019年收
    的頭像 發表于 11-27 10:08 ?956次閱讀
    一文了解<b class='flag-5'>AI</b>網絡互聯的市場<b class='flag-5'>潛力</b>

    AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    ,無疑為讀者鋪設了一條探索人工智能(AI)如何深刻影響并推動科學創新的道路。在閱讀這一章后,我深刻感受到了人工智能技術在科學領域的廣泛應用潛力以及其帶來的革命性變化,以下是我個人的學習心得: 1.
    發表于 10-14 09:12

    萬界星空科技AI低代碼MES的具體功能及工廠應用效果

    萬界星空科技AI低代碼MES的具體功能及工廠應用效果,萬界星空科技AI低代碼MES的具體功能及工廠應用效果
    的頭像 發表于 09-18 14:56 ?619次閱讀
    萬界星空科技<b class='flag-5'>AI</b>低代碼MES的具體功能及<b class='flag-5'>工廠</b>應用效果

    NVIDIA和Meta CEO探討AI與仿真模擬技術的潛力

    NVIDIA 和 Meta 的首席執行官將在一次難得的公開活動中共同探討 AI 與仿真模擬技術的潛力
    的頭像 發表于 09-09 09:14 ?701次閱讀

    新思科技探索AI+EDA的更多可能性

    芯片設計復雜性的快速指數級增長給開發者帶來了巨大的挑戰,整個行業不僅要向埃米級發展、Muiti-Die系統和工藝節點遷移所帶來的挑戰,還需要應對愈加緊迫的上市時間目標、不斷增加的制造測試成本以及人才短缺等問題。早在AI大熱之前,芯片設計行業就把目光放到了AI
    的頭像 發表于 08-29 11:19 ?808次閱讀

    NVIDIA黃仁勛和Meta馬克·扎克伯格探討開源AI的變革潛力

    兩位領導者在 SIGGRAPH 2024 大會上探討開源 AI 的變革潛力,推出 AI Studio,并互換皮夾克。
    的頭像 發表于 08-13 16:24 ?798次閱讀

    探索新潮流 — AI服務器引領數據中心的發展

    電子發燒友網站提供《探索新潮流 — AI服務器引領數據中心的發展.pdf》資料免費下載
    發表于 07-26 13:35 ?368次下載
    主站蜘蛛池模板: 免费视频一区二区性色 | 免费欧美黄色网址 | 奇米99| 成人羞羞视频国产 | 天天操天天舔天天干 | 天天噜日日噜夜夜噜 | 久久15 | 流不尽奶水的大乳h | 亚洲一区二区影院 | 欧美一级做一a做片性视频 欧美一级做一级做片性十三 | 色婷婷综合和线在线 | 四虎影永久在线观看精品 | 日韩免费观看一级毛片看看 | 国产午夜免费视频 | 国产精品亚洲色图 | 国产女同 | 超级狂色而且免费又超好看 | 蜜色网| 亚洲第8页| brazzers720欧美丰满 | 欧美一区中文字幕 | 四虎影视在线影院4hutv | 国产精品爱久久久久久久三级 | 欧美视频一区二区三区在线观看 | 男人j桶进女人免费视频 | 91精品欧美激情在线播放 | 狠狠尻 | 色综合一区二区三区 | 亚洲福利视频一区 | 久久久久久毛片免费播放 | 国产香蕉视频在线播放 | 色妞干网 | 天天插天天色 | 97色婷婷成人综合在线观看 | 午夜久久网| 亚洲欧美视频在线播放 | 天天色播| 一色屋网站 | 99久久99这里只有免费费精品 | 国产在线97色永久免费视频 | 亚洲第一免费播放区 |