在大模型之后,智能體成為AI技術(shù)發(fā)展下一段的關(guān)注點。2025年被認(rèn)為是智能體元年,近期發(fā)布的多款智能穿戴設(shè)備、AI PC都加入了“智能體”的概念。特別是耳機的市場,已有多款產(chǎn)品發(fā)布,例如科大訊飛在近期發(fā)布的TWS耳機。隨著智能體的到來,AI耳機行業(yè)進入新的發(fā)展階段。
基礎(chǔ)NLP大模型能力差距縮小,2037年65%應(yīng)用將為智能體驅(qū)動
當(dāng)前,國內(nèi)各企業(yè)正在積極展開AI大模型的應(yīng)用,包括其相關(guān)技術(shù)落地的場景和方法。如果大模型無法落地,即使我們有再多的算力,再好的模型,其實它本身是帶來不了價值。在IDC Directions:ICT市場趨勢論壇上,IDC中國副總裁鐘振山表示,我們可以看到的是大模型的市場或者是基礎(chǔ)模型的市場,正在步入一個整合期。
IDC預(yù)測,到2028年,在中國市場超過80%的基于大模型的應(yīng)用場景將會使用不超過8家的大模型廠商。也就是說整體來看,大家對于基礎(chǔ)模型自身來源于哪家廠商的關(guān)注度會越來越低,更多的是如何讓這項技術(shù),如何讓大模型、投資為企業(yè)產(chǎn)生實際的價值。
在IDC針對通義千問2.0、文心一言4.0等中國大模型市場主流產(chǎn)品評估中看到,從2024年初到2024年底,每一個大語言模型的基礎(chǔ)理解能力都在不斷地提升,2024年6月的平均得分率70.8%,到2024年底這個數(shù)值上升到78.1%。但一個更有趣的現(xiàn)象是,能力之間的差距在不斷地縮小,標(biāo)準(zhǔn)差從3.0下降到1.0。這也意味著基礎(chǔ)模型自身的能力在未來不會有非常大的差距。
與此同時,AI智能體(AI Agent)隨著大模型能力的提升也展現(xiàn)出更加強大的功能與更廣泛的應(yīng)用前景。
AI智能體是一種軟件組件,具備代表(代理)用戶或系統(tǒng)執(zhí)行任務(wù)的自主能力。通過感知、推理和行動循環(huán)設(shè)定目標(biāo)、做出決策并采取行動。
IDC中國副總裁兼首席分析師武連峰表示,企業(yè)智能體演化路徑分為:助理 Assistants、顧問 Advisors 、智能體 Agents 。IDC預(yù)計到2037年,大約是65%的應(yīng)用都將是智能體應(yīng)用。
2025年被廣泛認(rèn)為是AI智能體的爆發(fā)元年。盡管如此,AI智能體仍處于相對早期的開發(fā)階段,許多技術(shù)挑戰(zhàn)和應(yīng)用場景尚待進一步探索和完善。在這個背景下,產(chǎn)業(yè)鏈上的各家企業(yè)正在加速布局,力求在這一波技術(shù)浪潮中占據(jù)有利位置。
AI智能體的產(chǎn)業(yè)鏈可以分為上游基礎(chǔ)層、中游技術(shù)轉(zhuǎn)化層、下游應(yīng)用層。上游基礎(chǔ)層包括AI算力基礎(chǔ)(AI芯片、智能服務(wù)器等)、AI算法、數(shù)據(jù)資源等。其發(fā)展的關(guān)鍵在于通過更智能、更高性能芯片實現(xiàn)算力突破,通過優(yōu)化深度學(xué)習(xí)算法等實現(xiàn)AI算法突破,通過不斷收集數(shù)據(jù)實現(xiàn)資源突破。
在下游應(yīng)用層面上,AI智能體的落地場景廣泛涵蓋了包括游戲、金融、工業(yè)、消費、交通等多個關(guān)鍵領(lǐng)域。特別值得注意的是,在“AI+消費”這一新興領(lǐng)域,AI智能體的應(yīng)用已經(jīng)初見成效,尤其是在可穿戴設(shè)備細(xì)分市場中。電子發(fā)燒友網(wǎng)觀察到,隨著消費者對個性化和智能化產(chǎn)品需求的增長,AI耳機作為AI技術(shù)的一個重要載體,正逐漸成為市場的新寵。
AI耳機競爭進入智能體時代,AI翻譯成為聚焦點
當(dāng)前,國內(nèi)AI智能體耳機的主要玩家分為三大類,第一類是智能手機廠商,第二類是傳統(tǒng)智能音頻品牌,第三類是互聯(lián)網(wǎng)廠商以及數(shù)碼科技廠商。上述企業(yè)中,已有多家產(chǎn)品搭載AI大模型,引入了智能體概念,并增加了相對應(yīng)的功能,具體包括華為FreeBuds Pro4、訊飛AI會議耳機、字節(jié)跳動Ola Friend智能體耳機、WISHEE AI耳機等。
那么,加入智能體的耳機會有什么不同,打開了哪些AI應(yīng)用場景?
2024年10月,字節(jié)跳動豆包發(fā)布了首款A(yù)I智能體耳機Ola Friend,接入豆包大模型。在AI應(yīng)用場景方面,通過豆包大模型與APP深度結(jié)合,通過關(guān)鍵詞喚醒AI耳機,就能進行旅行導(dǎo)航、英語學(xué)習(xí)等功能。
今年5月,Ola Friend官方宣布,Ola Friend AI耳機智能升級,帶來了英語私教朋友Owen功能,并實現(xiàn)語音端到端大模型全新升級,還擁有豆包喚醒詞簡化、嘈雜環(huán)境音量自適應(yīng)、輕聲收音等特點。
同樣是在今年5月,科大訊飛旗下未來智能正式發(fā)布了viaim大腦,具備端到端的智能感知處理能力、智能Agent的協(xié)同推理能力、實時多模態(tài)能力、數(shù)據(jù)安全和隱私保護能力四大核心模塊。未來智能還發(fā)布了基于viaim大腦的兩款訊飛AI會議耳機,分別是訊飛AI會議耳機Pro 3、訊飛開放式AI耳機Air 2。
那么在AI會議場景,智能體耳機能有哪些明顯的特點呢?
上述兩款耳機支持會議同傳、翻譯等功能。傳統(tǒng)現(xiàn)場同傳需要很多準(zhǔn)備,未來智能提供了一套快速同傳的方案:只需打開viaim APP,掃描會場二維碼,即可通過佩戴iFLYBUDS聽到同傳音頻,手機上可以同步出現(xiàn)字幕。最多一次性可以接入300人。
官方介紹,viaim AI助理能夠自動分析記錄的內(nèi)容,提供主動式助理服務(wù);還能根據(jù)用戶的職業(yè)特點生成個性化的摘要;此外還可以基于單條/多條記錄,準(zhǔn)確檢索個人關(guān)注要點并支持記錄外的拓展問詢,深度挖掘記錄潛藏價值,支持AI深度問詢。
當(dāng)前,AI翻譯、AI錄音、AI同傳等場景已成為辦公場景中的聚焦點,尤其是在跨語言溝通、國際會議、遠(yuǎn)程協(xié)作等實際應(yīng)用場景中,AI翻譯通過語音識別、自然語言處理和實時轉(zhuǎn)換等技術(shù),顯著擴大了使用場景。
與此同時,AI耳機作為智能穿戴設(shè)備的重要分支,正逐步成為AI翻譯技術(shù)落地的重要載體。它不僅具備傳統(tǒng)音頻設(shè)備的便攜性和易用性,還融合了AI的強大能力。
可以看到,AI耳機和智能手表一樣,其獨立屬性越來越強。未來智能CTO王松曾表示,真正的智能耳機必須是一個可獨立聯(lián)網(wǎng)和獨立運算的設(shè)備,即便脫離了手機也能夠使用。
但目前來看,AI耳機離成為真正的獨立設(shè)備還有一段距離,這是因為AI耳機內(nèi)部空間有限、承載的算力有限,還需要手機作為輔助,提供額外的功能。
在現(xiàn)階段,作為智能體落地的最佳場景之一,AI耳機在AI技術(shù)的加持下,打開了更大的應(yīng)用場景。正如前文提到的,AI智能體的發(fā)展路徑需要經(jīng)過助理、顧問、智能體的三個遞進的階段。目前,大多數(shù)AI耳機乃至其他AI硬件已基本具備“助理”級能力,初步實現(xiàn)了對用戶的輔助功能;而未來的演進方向,則是向更高階的“智能體”階段邁進,實現(xiàn)更自主、更智能的交互與決策能力。
發(fā)布評論請先 登錄
2025 職場新規(guī)則:不會AI智能體,可能連面試都過不了

【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】操作實戰(zhàn),開發(fā)一個編程助手智能體
2025年開啟AI智能體規(guī)模應(yīng)用
硅基覺醒已至前夜,聯(lián)發(fā)科攜手生態(tài)加速智能體化用戶體驗時代到來
NVIDIA發(fā)布連接AI智能體的AI-Q Blueprint

《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能體》
AI智能體套件
AI智能體是什么_AI智能體如何重塑企業(yè)業(yè)務(wù)流程
AI智能體生態(tài)圈和軟件棧

評論