在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

訊飛星辰MaaS平臺實現高性能DeepSeek V3上線

訊飛開放平臺 ? 來源:訊飛開放平臺 ? 2025-06-04 10:15 ? 次閱讀

以DeepSeek模型為代表的MoE技術路線,正不斷突破通用大模型的效果上限。其創新的PD優化與大EP推理方案,推動大模型邁向“高性能、低成本、強普惠”的新階段。

事實上,早在1991年,兩位人工智能界的泰斗Michael Jordan與Geoffrey Hinton在論文《Adaptive Mixture of Local Experts》中,就首次提出了MoE框架。隨著大模型應用場景愈加復雜和垂直,大模型參數增大的同時,消耗的算力資源和時間成本也隨之增加。憑借“稀疏激活、低資源消耗、高模型容量”的優勢,MoE逐漸成為大模型開發者的新寵。

DeepSeek模型的成功實踐,為MaaS平臺廠商指明了方向,也帶來了挑戰:如何在提供高性能大模型推理服務的同時,實現對成本的極致控制?四月份,科大訊飛技術團隊通過深度解析DeepSeek-V3 / R1 推理系統成本,發現除了極致的推理性能及吞吐優化外,大模型成本與算力資源有效利用率、首響用戶體驗等體系化的綜合策略緊密關聯。

基于以上洞察,訊飛星辰MaaS平臺成功復現了生產級PD(生產部署優化)+大EP(大規模跨節點專家并行),實現了高性能的DeepSeek V3上線:

萬路并發保障:大規模并發場景下,系統穩定、延遲低,用戶體驗更流暢;

請求級指標提升 :TTFT(首Token延遲)性能提升30%,TPOT(單Token生成時間)性能提升35%,顯著減少延遲,降低用戶「等候感」;

彈性混合云架構:支持多源異構算力調度,靈活應對流量波峰波谷。

高性能DeepSeek V3上線:

萬路并發無壓力,批量處理享半價

訊飛星辰 MaaS 平臺始終致力于打造高效、穩定、低成本的大模型推理服務。目前平臺上提供星火全系列,以及DeepSeek、Qwen3等共50+個行業主流模型。在對DeepSeek V3推理系統成本進行深度分析基礎上,實現了DeepSeek V3推理性能的階躍:

關鍵指標對齊官網,萬路并發流暢響應

實現生產級PD+大EP復現,極致壓榨硬件性能,TTFT、TPOT等關鍵指標對齊DeepSeek官網,其中TTFT性能提升30%,TPOT性能提升35%。大規模生產集群吞吐再翻倍,即使在萬級并發壓力下,依然能保持低延遲與流暢響應。

Batch API升級,高效低價數據處理

重點升級了支持DeepSeek V3的Batch API,為需要處理大規模數據且非實時場景的任務,如:企業級數據分析、內容生產、客戶反饋處理等,提供高性價比推理服務且無并發限制,可實現價格比傳統調用降低50%,并在24小時內完成任務處理。

彈性混合云架構,流量洪峰更有保障

星辰MaaS平臺自研了彈性多源異構混合云架構,以自建算力為中心擴展接入多個混合算力,提供穩定可靠的算力保障用戶的流量洪峰,確保服務的穩定性。 針對有大量調用需求的開發者和企業,訊飛星辰MaaS平臺提供了專人對接的定制化方案。

模型工具升級:

精調方案隨心用,500+開源模型自主托管

為進一步降低模型定制門檻,助力開發者快速創新,在提供高性能開源模型的同時,近期,訊飛星辰MaaS平臺實現了多項功能上新:精調方案共享:開放數據分類、表格問答、劇本生成等多個精調方案,零門檻上手,開箱即用,可快速落地在真實業務場景中。

星辰MaaS平臺提供了多種精調方案

以營銷創作腳本為例,用戶只需輸入推廣場景、產品賣點、腳本風格、面向人群等資料,即可實現從「創意構思」到「爆款腳本」的全鏈路智能化生產。

Qwen3全系上線:繼率先支持Qwen3旗艦模型Qwen3-235B-A22B和Qwen3-30B-A3B推理之后,目前Qwen3全系模型均已在星辰MaaS平臺上線,支持推理/訓練,為開發者提供了更為多元的模型選擇空間。

開放自主托管渠道:支持開發者自主托管開源模型,包括HuggingFace提供的開源模型(500+)及平臺預置模型,均可一鍵部署,即用即銷,進一步降低了開發成本,使開發者和企業得以專注于業務邏輯創新,推動AI創新應用落地。

開發者可在“模型選擇”中搜索HuggingFace提供的開源模型平臺預置模型

秉承開放開源理念,下一步,星辰MaaS平臺將開源面向大規模生產級的支持PD調度的集群鏡像方案,實現拓撲感知調度,兼容SGlang、自研等多種推理框架、自帶多源異構彈性混合云調度,支持訓推一體潮汐調度,進一步降低多模型、多算力、高并發的大模型集群部署復雜度。

關于訊飛星辰MaaS平臺:

低門檻一站式大模型精調訓練平臺,助力企業高效構建專屬大模型。

開箱即用,上手快:覆蓋數據工程、精調訓練、推理服務等全生命周期工具鏈,提供開箱即用、即用即銷的平臺服務能力。

模型豐富,應用快:支持星火全系列并兼容DeepSeek、Qwen3等,共50+行業主流大模型版本的微調與服務,微調到應用的工期從幾天降低到小時級。

成熟訓推框架,高可用:構建開箱即用的訓推工具與框架,支持lora、full sft等多種訓練方式,定制模型按需托管,服務可用性99.95%。

算力利用率高,成本低:實現基于彈性混合云訓推算力的潮汐調度,支持即用即銷的大模型自主托管推理模式,持續提升算力資源利用率,實現大模型推理成本持續降低。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 科大訊飛
    +關注

    關注

    19

    文章

    840

    瀏覽量

    62273
  • 大模型
    +關注

    關注

    2

    文章

    3062

    瀏覽量

    3909
  • DeepSeek
    +關注

    關注

    1

    文章

    785

    瀏覽量

    1490

原文標題:高性能DeepSeek V3上線,更快、更穩定

文章出處:【微信號:訊飛開放平臺,微信公眾號:訊飛開放平臺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    星辰Agent開發平臺發布

    隨著以星火X1和DeepSeek-R1為代表的深度推理模型實現階躍式突破,模型自主規劃使用工具能力得到極大提升。在復雜任務拆解、多工具協同領域,AI Agent正展現出類人的認知決
    的頭像 發表于 05-06 09:34 ?331次閱讀

    科大深度解析DeepSeek-V3/R1推理系統成本

    本篇分析來自科大技術團隊,深度解析了DeepSeek-V3 / R1 推理系統成本,旨在助力開發者實現高性價比的MoE集群部署方案。感謝
    的頭像 發表于 04-15 13:46 ?2310次閱讀
    科大<b class='flag-5'>訊</b><b class='flag-5'>飛</b>深度解析<b class='flag-5'>DeepSeek-V3</b>/R1推理系統成本

    DeepSeek全新API上線星辰MaaS平臺

    近日,DeepSeek最新推出DeepSeek-V3-0324版本,在以下方面實現明顯提升。
    的頭像 發表于 03-28 17:29 ?630次閱讀

    星火原生應用接入DeepSeek

    DeepSeek全系模型已正式上線開放平臺,支持一鍵獨享部署,首發精調服務,為開發者打造API高效穩定服務。
    的頭像 發表于 02-25 14:14 ?974次閱讀

    商湯大裝置DeepSeek企業版上線

    今年2月,商湯大裝置萬象平臺正式上線DeepSeek-R1、DeepSeek-V3等模型,并為免費版提供3個月內千萬Token額度,受到客
    的頭像 發表于 02-25 10:07 ?531次閱讀

    DeepSeek V3昇思MindSpore版本上線開源社區

    近日,基于昇騰AI硬件與昇思MindSpore AI框架版本的DeepSeek-V3完成開發支持并上線昇思開源社區,面向開發者提供開箱即用的預訓練和推理能力,并已成功在大規模集群上預訓練和部署。
    的頭像 發表于 02-18 10:12 ?1089次閱讀
    <b class='flag-5'>DeepSeek</b> <b class='flag-5'>V3</b>昇思MindSpore版本<b class='flag-5'>上線</b>開源社區

    了解DeepSeek-V3DeepSeek-R1兩個大模型的不同定位和應用選擇

    功能對比: 1. 核心定位差異 維度 DeepSeek-V3 DeepSeek-R1 目標場景 通用型任務(文本生成、多輪對話等) 復雜推理與數學能力優先(如STEM領域) 優化方向 平衡性能與成本,覆蓋廣泛
    發表于 02-14 02:08

    DeepSeek V3/R1滿血版登陸華為云

    為云平臺上已經完成了全面的優化和準備工作,正式滿足了業務商用部署的需求。 據悉,DeepSeek是華為在人工智能領域的一項重要成果,其V3/R1版本更是憑借其強大的性能和廣泛的應用場景
    的頭像 發表于 02-13 11:19 ?815次閱讀

    開放平臺支持DeepSeek

    今天,DeepSeek全系大模型正式上線開放平臺(包括DeepSeek-V3
    的頭像 發表于 02-11 09:27 ?1064次閱讀

    開放平臺上線DeepSeek大模型

    作為首批“人工智能國家隊”,開放平臺致力于為全球開發者提供領先的人工智能技術與解決方案,依托研究院源頭技術創新和能力星云計劃的行業共
    的頭像 發表于 02-10 14:20 ?763次閱讀

    扣子平臺支持DeepSeek R1與V3模型

    用戶快速實現基于大模型的各類Bot的搭建,并將其輕松發布至社交平臺、通訊軟件、網站等多個渠道。此次新增對DeepSeek R1和V3模型的支持,無疑為扣子
    的頭像 發表于 02-08 13:42 ?1014次閱讀

    DeepSeek-R1全尺寸版本上線Gitee AI

    DeepSeek 全套蒸餾模型以及 V3 版本上線后,經過 Gitee AI 和沐曦團隊兩天緊鑼密鼓的適配和機器籌備,DeepSeek-R1全尺寸版本現在已
    的頭像 發表于 02-07 15:25 ?1120次閱讀

    云天勵飛上線DeepSeek R1系列模型

    -R1-Distill-Llama-70B大模型、DeepSeek V3/R1 671B MoE大模型也在有序適配中。適配完成后,DeepEdge10芯片平臺將在端、邊、云全面支持DeepSe
    的頭像 發表于 02-06 10:39 ?604次閱讀
    云天勵飛<b class='flag-5'>上線</b><b class='flag-5'>DeepSeek</b> R1系列模型

    采用FP8混合精度,DeepSeek V3訓練成本僅557.6萬美元!

    的模型需要花費約4684.8萬美元。然而,隨著技術的進步,這一成本正在迅速降低。DeepSeek V3的出現,標志著訓練成本的大幅下降,其訓練成本僅為557.6萬美元,相較于之前的模型,成本下降了11倍。 二,DeepSeek
    的頭像 發表于 01-13 11:12 ?1179次閱讀

    星火大模型V4.0正式發布

    日前,星火V4.0正式發布,升級成為更懂你的AI助手!星火4.0 API同步上線,Ult
    的頭像 發表于 10-14 10:06 ?1266次閱讀
    主站蜘蛛池模板: 国产高清在线 | 好色成人网 | 一卡二卡四卡无卡乱免费网页 | 最新版天堂资源8网 | 国产三级a三级三级天天 | 性欧美激情在线观看 | 欧美性一区二区三区五区 | 亚洲欧美日韩另类精品一区二区三区 | 日本免费一区二区三区视频 | 一级毛片日韩a欧美 | 国产一区二区三区美女在线观看 | 香淫| 亚洲理论片在线观看 | 狠狠狠色丁香婷婷综合久久88 | 91男人| 美女网站视频一区 | 超h 高h 污肉男男 | 伊人狼人综合网 | 天天爱天天做久久天天狠狼 | 四虎影院中文字幕 | 2021最新久久久视精品爱 | 欧美亚洲综合图区在线 | 亚洲男人的天堂久久香蕉 | 韩国三级hd中文字幕久久精品 | 激情婷婷综合久久久久 | 男女同床爽爽视频免费 | 欧洲精品码一区二区三区免费看 | 免费国产综合视频在线看 | 日韩精品毛片 | 另类视频色综合 | 色播视频在线观看免费 | 91久久精品青青草原伊人 | 激情91| vvvv98国产成人综合青青 | 国产高清免费不卡观看 | 午夜小视频在线 | 老司机精品视频免费 | 午夜精品网 | 插吧插吧综合网 | 好紧好爽太大了h快穿 | 色婷婷六月桃花综合影院 |