近日,階躍星辰在官方公眾號上宣布了一項重大突破——推出Step-1o千億參數端到端語音大模型。該模型被譽為“國內首個千億參數端到端語音大模型”,標志著我國在語音技術領域取得了新的里程碑。
據階躍星辰介紹,傳統的語音模型通常采用級聯方案,即先將用戶輸入的語音信息轉化為文本,再進行二次轉化以生成語音輸出。這種方案不僅過程繁瑣,降低了傳輸效率,而且在轉化過程中容易折損掉包括情緒在內的關鍵信息。這導致傳統語音模型存在時延長、反應慢、回答質量和智能水平不足,以及情感表達空洞刻板等缺陷。
而階躍星辰推出的Step-1o模型則采用了端到端的語音方案,實現了語音理解和生成的一體化。這一創新設計不僅提升了模型的智商上限,還使其能夠更好地理解和表達情感,從而克服了傳統語音模型的諸多缺陷。
Step-1o千億參數端到端語音大模型的發布,不僅展示了階躍星辰在語音技術領域的深厚實力,也為我國語音技術的發展注入了新的活力。未來,隨著該模型的不斷優化和應用推廣,相信將為用戶帶來更加智能、高效和自然的語音交互體驗。
-
語音交互
+關注
關注
3文章
305瀏覽量
28548 -
大模型
+關注
關注
2文章
3062瀏覽量
3912
發布評論請先 登錄
德賽西威與面壁智能發布端側大模型語音交互方案
自動駕駛中基于規則的決策和端到端大模型有何區別?

階躍星辰開源多模態模型,天數智芯迅速適配
靈初智能發布端到端具身模型Psi R0,實現復雜操作與泛化能力
黑芝麻智能端到端算法參考模型公布

端到端InfiniBand網絡解決LLM訓練瓶頸

智駕進程發力?小鵬、蔚來端到端模型上車

評論