日前,全球領先的移動出行科技公司德賽西威與端側大模型技術領軍企業面壁智能共同發布業界首個基于高通座艙平臺(SA8255P,簡稱8255)的端側大模型語音交互方案,這是雙方自2024年12月簽署戰略合作協議以來發布的首個合作成果。該方案充分發揮了德賽西威產品化和系統整合能力,以及面壁智能端側大模型技術優勢,以面壁智能 1.2B 端側語言大模型為意圖理解核心,首次在車機本地實現復雜意圖理解、上下文推理、跨域控制等高階能力,同時將首響時間縮短至 300 毫秒以內,為智能座艙語音交互樹立了“高精度、低時延、強安全”的新標桿。
1.2B端側大模型重塑車載語音交互邏輯
出色的語音交互體驗已成為智能汽車“標配”。傳統車載語音系統依賴云端的語義理解模塊處理用戶指令,存在對話不智能、不連貫等痛點。德賽西威與面壁智能的創新方案通過全棧優化,將面壁智能專為車載場景微調的1.2B語言大模型部署于高通8255芯片,實現了三大技術躍遷:
準確的復雜意圖理解
以車載知識為基礎構建數據集對模型進行定向能力訓練,使模型對用戶多意圖組合、模糊表達等復雜請求準確率達95%以上;
上下文連續對話零障礙
支持跨領域多輪交互,徹底打破傳統語音“一問一答”的局限性;
端云協同降本增效
端側模型作為座艙大腦智能解析與路由復雜指令,可快速響應用戶訴求,將有效請求發送給云端服務,有效降低車廠綜合成本,且規避數據泄露風險。
讓“真智能”貫穿行車全流程
面對行車場景中的各類復雜、個性化需求,該方案通過意圖識別、跨域指令拆分與執行、上下文自動關聯前序對話等全方位能力,可快速理解用戶真實需求,并準確完成多指令拆分與執行。
例如,當用戶提出“導航到機場并播放歌曲,路上提醒我買杯咖啡”等一連串需求時,系統在本地完成導航、娛樂、提醒服務的跨域指令拆分與執行;面對更改行程等動態需求時,模型可基于上下文自動關聯前序對話,無需重復喚醒。此外,方案還支持通過聲紋識別和情緒分析構建個性化交互模型,為“千人千車”體驗奠定基礎。
重構車廠與用戶的“雙贏”生態
對車企而言,該方案大幅簡化語音功能開發流程——升級車端語音處理范式,以較少的通用意圖標簽替代傳統的數千條定制指令,實現用戶需求的全覆蓋;同時,端側部署避免了云端模型調用帶來的指數級成本增長。可以想象,隨著車載功能與大模型持續深入匹配,語音交互將徹底告別“機械應答”時代,均可通過自然對話逐步實現。
向純端側大模型語音方案加速演進
在智能汽車大行其道的當下,德賽西威與面壁智能將圍繞“下一代智能座艙”開展深入合作。雙方已啟動新一代座艙平臺適配,計劃在更高算力芯片上部署能力更強、知識密度更高的端側大模型,并針對端側模型對語音全鏈路進行重新設計,使智能座艙全模態交互成為可能,提供更加自然、流暢的交互體驗。據Gartner預測,2026年90%的GenAI將嵌入對話式AI產品中以實現智能化,本次合作有望提前推動智能座艙交互體驗進入“無感智能”時代,持續引領行業邁向智能化新高度。
-
智能座艙
+關注
關注
4文章
1082瀏覽量
16744 -
德賽西威
+關注
關注
0文章
158瀏覽量
4893 -
大模型
+關注
關注
2文章
2984瀏覽量
3750
原文標題:首款端側語音大模型方案 | 德賽西威與面壁智能塑造Native智能座艙體驗
文章出處:【微信號:Desay-SV,微信公眾號:德賽西威DESAYSV】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論