在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音AI芯片演進(jìn)至第三階段,誰將主宰下一個十年?

啟英泰倫 ? 2022-08-05 10:36 ? 次閱讀

轉(zhuǎn)載自與非網(wǎng)

什么是語音AI芯片?

語音AI芯片,顧名思義是處理語音的AI芯片。很多人第一次接觸語音AI芯片可能是天貓精靈、小愛同學(xué)和小度等智能音箱產(chǎn)品,因為在這些產(chǎn)品中,我們可以體驗到智能語音的交互,而語音AI芯片是智能語音交互的基礎(chǔ)和核心。

都說這幾年AI芯片賽道很火,事實上語音識別、自然語義理解(NLP)和機(jī)器學(xué)習(xí)AI技術(shù)中占據(jù)重要的位置,是人機(jī)交互的基礎(chǔ),而前兩項均與語音識別相關(guān),這是因為語音識別不僅方便,而且是人機(jī)交互中最符合人類日常交流形態(tài)的一種技術(shù),目前已經(jīng)在智能家居和車載場景得到普遍應(yīng)用。

為何語音識別要從云端搬至終端?

說到語音識別技術(shù),還要追溯到2010年左右,當(dāng)時以神經(jīng)網(wǎng)絡(luò)為代表的AI技術(shù)使得智能語音識別成為可能,并在后來的IoT和AIoT產(chǎn)業(yè)浪潮中不斷走向成熟。

早期的智能語音識別受限于算力要求,終端沒有專用的芯片可以解決算力和功耗成本的均衡問題,無法在終端處理智能語音識別,而云端處理又憑借天然自帶內(nèi)容和服務(wù),模型可以快速迭代,數(shù)據(jù)收集和訓(xùn)練非常方便等優(yōu)勢,決定了當(dāng)時的語音識別大都是布置在云端的。

然而,云端的語音識別也有弊端,比如無法做到穩(wěn)定的實時響應(yīng),網(wǎng)絡(luò)崩潰時更是響應(yīng)無門;重要的信息都要通過網(wǎng)絡(luò)傳輸,有被攻擊泄露的風(fēng)險,無法保障用戶隱私安全;此外在成本方面也不具優(yōu)勢,除了持續(xù)的帶寬消耗外,云端語音需要后臺不間斷的運(yùn)行大量服務(wù)器來做語音處理,服務(wù)器的購置、后續(xù)的硬件更換和軟件運(yùn)維、人力費(fèi)用和電費(fèi)場地費(fèi)等都非常昂貴。

9958de6a-143a-11ed-9ade-dac502259ad0.jpg

圖 | 為什么選擇離線語音

面對云端語音的優(yōu)劣勢,以啟英泰倫為代表的企業(yè)開始投入對端側(cè)語音識別的研究。不過,我們知道光有需求點還支撐不起一個新產(chǎn)業(yè)的崛起,要養(yǎng)活一個產(chǎn)業(yè)需要足夠的市場容量,實現(xiàn)資金的活流,才能有利于產(chǎn)品的不斷迭代,形成正向循環(huán)。

根據(jù)艾瑞咨詢發(fā)布數(shù)據(jù)顯示,2020年中國物聯(lián)網(wǎng)設(shè)備連接量達(dá)74億個,預(yù)計2025年將突破150億個。而麥肯錫則用更動態(tài)的數(shù)據(jù)表示出了物聯(lián)網(wǎng)的增長率,預(yù)估目前每秒大約有127臺設(shè)備連接到互聯(lián)網(wǎng)。

然而,面對當(dāng)前物聯(lián)網(wǎng)的聯(lián)網(wǎng)量,華為給出了另一個數(shù)據(jù):當(dāng)前大部分具備物聯(lián)能力的消費(fèi)類設(shè)備只有 5% ~ 20% 的聯(lián)接激活率。這是為什么呢?究其原因,還是操作交互太過于復(fù)雜。而解決這個復(fù)雜問題的方法就是加入更多“老少皆宜”的語音配合IoT連接。

有行業(yè)內(nèi)人士預(yù)測,語音AI芯片將會快速發(fā)展到5-10億顆/年左右的市場規(guī)模,隨著應(yīng)用面的不斷拓寬和滲透率的不斷提升,該規(guī)模還將持續(xù)不斷提升。

綜上,不管是場景需求還是市場容量,都在推動端側(cè)語音識別的落地。但如何落地?不是一蹴而就的。

端側(cè)語音識別芯片的三個發(fā)展階段

語音識別面臨的挑戰(zhàn)和圖像識別不同,它對算力要求沒那么高,但對算法的要求很高。啟英泰倫創(chuàng)始人兼CEO何云鵬告訴與非網(wǎng):“這是因為語音識別的應(yīng)用場景非常多,所以各種噪聲就非常多樣,有穩(wěn)態(tài)噪聲,也有非穩(wěn)態(tài)噪聲,要在這些環(huán)境中進(jìn)行高準(zhǔn)確率的語音識別是非常困難的。所以,必須掌握智能語音算法全鏈條技術(shù)才能實現(xiàn)更好的語音識別,包括智能語音信號前端降噪處理、語音智能識別、語音合成、語音解碼、語音大數(shù)據(jù)處理及訓(xùn)練、NLP等技術(shù)。”

當(dāng)然,語音識別技術(shù)在國內(nèi)的發(fā)展也是在不斷迭代中變得更加準(zhǔn)確和靈活。我們以啟英泰倫的三代自研技術(shù)平臺BNPU(腦神經(jīng)網(wǎng)絡(luò)處理器),來簡單概括端側(cè)語音AI芯片的這三個發(fā)展階段。

99752e44-143a-11ed-9ade-dac502259ad0.jpg

圖 | 啟英泰倫在語音AI芯片上的創(chuàng)新

階段一:語音識別功能

第一代BNPU芯片實現(xiàn)的是端側(cè)語音識別,是行業(yè)首款集成神經(jīng)網(wǎng)絡(luò)處理器的語音AI芯片,也是離線語音產(chǎn)業(yè)應(yīng)用興起的標(biāo)志。

從集成度的角度來看,BNPU 1.0的方案相對分立,方案價格大約在50到90元左右(CI1006)。

階段二:離線聲紋識別+命令詞自學(xué)習(xí)

第二代BNPU芯片(CI1102/CI1103和CI1122),不僅實現(xiàn)了離線語音識別功能,還能實現(xiàn)離線聲紋識別和命令詞自學(xué)習(xí)等個性化的功能。在應(yīng)用上,可以根據(jù)不同人的聲紋實現(xiàn)基于用戶個性喜好的功能配置,并能通過離線命令詞的自學(xué)習(xí)實現(xiàn)在輕度噪聲下的地方口音和方言的識別。

從集成度的角度來看,BNPU 2.0集成了Audio CODEC、Flash 等單元,以及雙麥陣增強(qiáng)處理能力,方案價格大約在15到25元左右。

階段三:深度降噪+深度分離+命令詞自學(xué)習(xí)2.0+離線NLP

第三代BNPU芯片,除了繼承第二代的語音識別、聲紋識別外,還支持了基于深度學(xué)習(xí)的降噪技術(shù)(深度降噪)、人聲分離技術(shù)(深度分離)、命令詞自學(xué)習(xí)2.0版本技術(shù),以及行業(yè)首次突破性的離線NLP技術(shù)。在應(yīng)用上,CI1301可以實現(xiàn)中等噪聲中的語音識別,而CI1302、CI1303、CI1306和CI1312則可實現(xiàn)強(qiáng)噪聲環(huán)境下的語音識別,比如當(dāng)油煙機(jī)噪聲高達(dá)80dB時,對于70多dB的人聲依然可以良好識別。

從集成度的角度來看,BNPU 3.0不僅集成了Audio Codec的模擬 MIC接口、數(shù)字PDM麥克的DMIC接口、通用的ADCMCU常見的串口、PWM、GPIO等接口,還進(jìn)一步集成了 4線Nor Flash、3路LDO的PMU和高精度的RC振蕩器等,方案價格約10元左右。

對于三代產(chǎn)品的方案價格一代更比一代低的疑問,何云鵬表示:“很多人認(rèn)為離線語音在端側(cè)、數(shù)據(jù)處理、語音識別和存儲會產(chǎn)生很多的成本,實則云上的成本是持續(xù)的,傳輸?shù)某杀臼情L時間的,這個成本可以避免;此外,云端早期建設(shè)的成本很高,很多廠家會建不起,還有每年運(yùn)營的成本,每臺設(shè)備每年10多元,這個費(fèi)用在賣設(shè)備的時候廠商會包兩年,但后面就要客戶自己付費(fèi),所以不太公平。而隨著摩爾定律的發(fā)展,端側(cè)語音識別方案的整體成本已呈現(xiàn)30%的速率下降,已經(jīng)達(dá)到了一個通用MCU的成本。”

除了價格以外,更值得一提的是,原本被認(rèn)為只有云端才能實現(xiàn)的NLP,現(xiàn)在輕量級的NLP在端側(cè)智能語音芯片中也實現(xiàn)了,并且既保障了用戶的體驗感,又能降低云端搭建和運(yùn)營成本,降低網(wǎng)絡(luò)帶寬消耗,也能提升用戶使用的安全性。

端云融合才是語音AI芯片的最終歸宿

當(dāng)然,說云端搬到端側(cè),實際上在很多場景下端側(cè)和云端不是非此即彼的關(guān)系,從長期來看,端側(cè)和云端是相互融合、相輔相成的關(guān)系。

隨著端側(cè)語音芯片功能、性能、可靠性變得越來越強(qiáng)大,價格越來越低,端側(cè)語音識別將實現(xiàn)可靠性、隱私保護(hù)、成本和靈活性等多方面的優(yōu)勢,再加上集成聯(lián)網(wǎng)功能可實現(xiàn)AIOT,從而實現(xiàn)大數(shù)據(jù)爆發(fā)時代下的有效數(shù)據(jù)分析和場景利用。

以空調(diào)為例,傳統(tǒng)的空調(diào)大都只有調(diào)溫的功能,但在差異化競爭的今天,大廠空調(diào)正在往機(jī)器人的方向發(fā)展,可以提供更多智慧化的服務(wù),比如調(diào)整空氣的溫濕度、清新程度、含氧量、PM 2.5值,以及在早晨起床時放音樂營造氛圍、營養(yǎng)咨詢等。而這些服務(wù)的基礎(chǔ)是語音交互,并且一定是延遲更低、工作更穩(wěn)定的端側(cè)語音識別,而背后的服務(wù)交易、用戶的習(xí)慣大數(shù)據(jù)等則更適合放在云端,達(dá)到協(xié)同的效果。

寫在最后

國內(nèi)語音AI芯片正呈現(xiàn)出爆發(fā)式增長的趨勢,誰將成為領(lǐng)頭者?何云鵬表示:“該市場領(lǐng)域未來發(fā)展壯大后,會呈現(xiàn)典型的頭部領(lǐng)先市場通吃的局面。而啟英泰倫在語料數(shù)據(jù)、算法模型、芯片架構(gòu)、AI開發(fā)平臺及應(yīng)用方案落地等多維度的迭代已經(jīng)產(chǎn)生了馬太效應(yīng)。經(jīng)過長達(dá)近7年的發(fā)展后,啟英泰倫已經(jīng)積累了B端客戶超過5000名,平臺開發(fā)者超過1萬名,使用啟英泰倫智能語音平臺的在校AI學(xué)員則超過10萬名。如今,整個離線語音行業(yè)快速發(fā)展,年內(nèi)裝機(jī)量將突破2000萬臺,未來兩年,年出貨將朝著1億臺邁進(jìn)。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34421

    瀏覽量

    275800
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    BOE(京東方)“照亮成長路”公益項目新十年啟幕 科技無界照亮美好未來

    的“世界高城”理塘,寓意該項目歷經(jīng)十年耕耘達(dá)到了全新的高度,也標(biāo)志著BOE(京東方)下一個十年公益征程的嶄新起點將由此啟幕。活動現(xiàn)場,BOE(京東方)宣布,今年將繼續(xù)向四川理塘縣、陜西富平縣、青海玉樹州雜多縣等地區(qū)捐建30間智慧
    的頭像 發(fā)表于 06-10 09:01 ?105次閱讀

    關(guān)于AI工廠三階段模型

    在今天(20255月20日)的Computex大會上,富士康董事長劉揚(yáng)偉發(fā)表了以“AI工廠三階段模型”及“Genesis”為核心的Keynote演講,提到鴻海集團(tuán)在AI轉(zhuǎn)型中的戰(zhàn)略布
    的頭像 發(fā)表于 05-20 23:26 ?332次閱讀
    關(guān)于<b class='flag-5'>AI</b>工廠<b class='flag-5'>三階段</b>模型

    嵌入式開發(fā)入門指南:從零開始學(xué)習(xí)嵌入式

    基礎(chǔ) 3. 學(xué)習(xí)路徑推薦第一階段:熟悉開發(fā)環(huán)境(如Keil、IAR、STM32)第二階段:掌握裸機(jī)編程與驅(qū)動開發(fā)第三階段:學(xué)習(xí)RTOS(實時操作系統(tǒng))如FreeRTOS第四階段:深入理
    發(fā)表于 05-15 09:29

    開關(guān)電源接地技術(shù)

    時,設(shè)備的外殼就會有危險電壓產(chǎn)生。由于我們在電流回路中采取了合理的保護(hù)措施,產(chǎn)生的故障電流使得電源熔絲或空氣開關(guān)斷開,以防止設(shè)備外殼繼續(xù)有危險電壓產(chǎn)生,從而起到了保護(hù)人身安全的作用。 1.3、第三階段
    發(fā)表于 05-07 14:51

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗】+初品Agent

    大模型落地的重要方向,也是AI技術(shù)的下一個風(fēng)口。 因此該書適于對AI感興趣的讀者,尤其是Agent的學(xué)習(xí)者與開發(fā)者,如想要提升工作效率的職場人、推動企業(yè)AI深化應(yīng)用的管理者、希望在
    發(fā)表于 04-22 11:51

    ad7616 burst模式讀取數(shù)據(jù)時,是否可以在下一個convst啟動轉(zhuǎn)換?

    ad7616 burst模式讀取數(shù)據(jù)時,是否可以在下一個convst啟動轉(zhuǎn)換,但busy還沒有拉低的情況下繼續(xù)讀取上次轉(zhuǎn)換的數(shù)據(jù)嗎?主要是串行讀取時,有可能出現(xiàn)convst臨界的情況,如果這樣可以的話,能夠提升小部分con
    發(fā)表于 04-15 07:50

    KT148A語音芯片mp3語音,有辦法分成一段一段的嗎

    步:生成語音素材:到這步,就實現(xiàn)了語音素材的生成,下載下來就是整個mp3文件 詳見KT148A資料包里面的文檔說明 第二步:將需
    的頭像 發(fā)表于 01-22 16:11 ?433次閱讀
    KT148A<b class='flag-5'>語音</b><b class='flag-5'>芯片</b><b class='flag-5'>一</b><b class='flag-5'>個</b>mp3<b class='flag-5'>語音</b>,有辦法分成<b class='flag-5'>一段</b><b class='flag-5'>一段</b>的嗎

    紫光同創(chuàng)2024度精彩回顧

    一年,紫光同創(chuàng)開啟下一個十年”。公司始終堅持質(zhì)量為先的原則,著力贏得客戶的信任和認(rèn)可,管理效能和技術(shù)底蘊(yùn)持續(xù)躍升!
    的頭像 發(fā)表于 12-31 14:50 ?1108次閱讀

    華為預(yù)制模塊化數(shù)據(jù)中心連續(xù)十年蟬聯(lián)全球第

    近日,第三方國際權(quán)威機(jī)構(gòu)Omdia發(fā)布《2023全球預(yù)制模塊化數(shù)據(jù)中心報告》,對全球預(yù)制模塊化數(shù)據(jù)中心市場動態(tài)、市場份額、發(fā)展趨勢進(jìn)行洞察和分析。報告顯示,2023華為預(yù)制模塊化數(shù)據(jù)中心位居全球市場份額第,至今已連續(xù)
    的頭像 發(fā)表于 12-31 11:41 ?787次閱讀

    何小鵬宣布未來十年愿景,加速全球化AI汽車布局

    在11月6日的小鵬AI科技日上,小鵬汽車董事長何小鵬分享了公司的宏偉藍(lán)圖,即在未來十年內(nèi),將小鵬汽車打造成為家享譽(yù)全球的AI汽車公司。   何小鵬感慨地表示,過去往往是國外的先
    的頭像 發(fā)表于 11-07 13:40 ?926次閱讀

    聯(lián)想集團(tuán)公布下一階段Smarter AI for all愿景

    全球數(shù)字經(jīng)濟(jì)領(lǐng)導(dǎo)企業(yè)聯(lián)想集團(tuán)在Tech World上公布了下一階段Smarter AI for all愿景,并展示了全面的人工智能解決方案、服務(wù)和設(shè)備組合,為全球千行百業(yè)和千家萬戶帶來了轉(zhuǎn)型和切實的投資回報,同時,聯(lián)想集團(tuán)還宣布了
    的頭像 發(fā)表于 10-17 09:13 ?970次閱讀

    使用tSPI協(xié)議減少下一個多電機(jī)BLDC設(shè)計的布線

    電子發(fā)燒友網(wǎng)站提供《使用tSPI協(xié)議減少下一個多電機(jī)BLDC設(shè)計的布線.pdf》資料免費(fèi)下載
    發(fā)表于 09-26 10:40 ?0次下載
    使用tSPI協(xié)議減少<b class='flag-5'>下一個</b>多電機(jī)BLDC設(shè)計的布線

    特斯拉與晶圓廠商或簽訂十年長單,深化供應(yīng)鏈合作

    韓國領(lǐng)先的晶圓代工廠商東部高科正積極籌備與美國電動汽車巨頭特斯拉簽署項意義重大的長期供貨協(xié)議,聚焦于電源管理芯片(PMIC)的代工合作。據(jù)悉,該合同若順利獲得最終批準(zhǔn),將鎖定至少十年的合作期限,目前雙方正處于合同簽署前的最后驗
    的頭像 發(fā)表于 09-25 16:08 ?1647次閱讀

    一下一個單片機(jī)的io口分別控制四燈板該怎么設(shè)計電路?

    各位大佬,我想問一下一個單片機(jī)的io口分別控制四燈板該怎么設(shè)計電路,每個燈板上有四種不同類型的燈,每種類型的燈有兩都通過極管來驅(qū)動,那么每種類型的燈都連接到同
    發(fā)表于 07-15 19:03

    聆思CSK6視覺語音大模型AI開發(fā)板入門資源合集(硬件資料、大模型語音/多模態(tài)交互/英語評測SDK合集)

    大模型語音問答、拍照識圖、大模型繪圖等豐富供能示例,支持語音喚醒、多輪語音交互。 2智能對話除了大模型語音對話,還集成了可離線運(yùn)行的坐姿檢測算法,是
    發(fā)表于 06-18 17:33
    主站蜘蛛池模板: 亚洲成人网在线播放 | 欧美系列在线播放 | 午夜神马福利免费官方 | 在线免费你懂的 | 韩国三级中文 | 色婷婷5月 | 欧美人与动性xxxxbbbb | 99热成人精品热久久669 | 久操福利 | 给我免费播放片黄色 | 综合激情在线 | 韩国三级中文 | 午夜亚洲视频 | 亚洲免费黄色网址 | www.狠狠操.com | 四虎tv在线观看884aa | 免费观看视频网站 | 国产午夜毛片v一区二区三区 | 国产三级国产精品国产普男人 | 天堂在线中文无弹窗全文阅读 | 美国一级毛片不卡无毒 | 色综合欧美综合天天综合 | 日本黄视频网站 | 天天综合色网 | 欧美天堂视频 | 四虎影视在线观看 | 萌白酱香蕉白丝护士服喷浆 | 手机在线小视频 | 国产在线精品观看一区 | 国产午夜精品片一区二区三区 | 日本69xxxxxxxx69 | 亚洲一区二区三区电影 | 国产高清色视频免费看的网址 | 岛国大片在线 | 美女扒开尿口给男人看大全 | 国产又黄又爽又猛的免费视频播放 | 成人在线综合网 | 五月激情综合网 | 操的网站| 日本一道dvd在线中文字幕 | 亚洲特级毛片 |