近日,中國領(lǐng)先的一站式醫(yī)療健康生態(tài)平臺(tái)平安好醫(yī)生(01833.HK)宣布,平安好醫(yī)生客戶端“聲紋登陸系統(tǒng)”在經(jīng)過多次模型優(yōu)化和升級(jí)迭代后,登陸成功率接近 99%,達(dá)行業(yè)一流水準(zhǔn)。該系統(tǒng)由云知聲提供聲紋技術(shù)支持。
聲紋識(shí)別(Voiceprint Recognition,VPR)也稱說話人識(shí)別,是一種通過聲音判別說話人身份的技術(shù),分為說話人辨識(shí)和說話人確認(rèn)。前者用以判斷某段語音是若干人中的哪一個(gè)所說的,即“ N 選一”;后者用以確認(rèn)某段語音是否是指定的某人所說,是“1對(duì)1匹配”問題。不同的任務(wù)和應(yīng)用會(huì)使用不同的聲紋識(shí)別技術(shù),如縮小刑偵范圍時(shí)可能需要辨認(rèn)技術(shù),而銀行交易時(shí)則需用到確認(rèn)技術(shù)。
作為國內(nèi)為數(shù)不多具備全棧語音技術(shù)能力的人工智能公司,云知聲已在聲紋技術(shù)領(lǐng)域深耕多年。團(tuán)隊(duì)多位技術(shù)骨干曾在美國國家標(biāo)準(zhǔn)技術(shù)署(NIST)主辦的說話人識(shí)別技術(shù)評(píng)測中多次屢次斬獲第一名。
早在 2004 年,尚就職于摩托羅拉公司的云知聲創(chuàng)始人黃偉博士便帶領(lǐng)團(tuán)隊(duì)研發(fā)出世界上第一款手機(jī)聲紋認(rèn)證系統(tǒng),搭載該系統(tǒng)的相關(guān)產(chǎn)品總計(jì)銷量超 2 億臺(tái)。
近年來,伴隨深度學(xué)習(xí)的興起,云知聲在國內(nèi)率先將這一技術(shù)使用到語音識(shí)別中,且后續(xù)引入到聲紋識(shí)別領(lǐng)域,解決了一系列聲紋技術(shù)實(shí)用難點(diǎn),并應(yīng)用到實(shí)際產(chǎn)品上。此次,云知聲和平安好醫(yī)生聯(lián)手打造的平安好醫(yī)生客戶端用戶聲紋登錄系統(tǒng)便是其中一項(xiàng)成功案例。
雖然聲紋識(shí)別優(yōu)勢明顯,但要想準(zhǔn)確分辨聲音特征卻并非易事。首先,聲紋識(shí)別系統(tǒng)性能會(huì)受用戶發(fā)聲狀態(tài)影響,如用戶的身體狀況、情緒等都會(huì)影響識(shí)別準(zhǔn)確度。其次,環(huán)境的嘈雜度,以及采集、傳輸音頻的硬件配置,都會(huì)在不同程度上對(duì)識(shí)別系統(tǒng)行成干擾。
為解決上述問題,云知聲聲紋技術(shù)團(tuán)隊(duì)進(jìn)行了一系列技術(shù)攻堅(jiān)與創(chuàng)新:
首先,依托云知聲強(qiáng)大的語音信號(hào)前端處理技術(shù),如 VAD、語音降噪等,準(zhǔn)確地捕捉到人聲并進(jìn)行背景噪聲消除。
其次,云知聲將 DNN 引入到傳統(tǒng)聲紋識(shí)別 ivector 技術(shù)框架中,并融合最新端到端聲紋識(shí)別技術(shù),基于云知聲超算平臺(tái)和海量聲紋訓(xùn)練數(shù)據(jù),使得模型得以學(xué)習(xí)到數(shù)萬說話人,每人多種發(fā)聲的特性,且在云端針對(duì)每個(gè)用戶采用說話人自適應(yīng)技術(shù),達(dá)到越用越好的效果。
在信道處理上,采用 PLDA 信道補(bǔ)償技術(shù),可將信道影響降到最小。
與此同時(shí),為保障用戶登陸的“安全性”,云知聲為平安好醫(yī)生客戶端聲紋登錄系統(tǒng)提供數(shù)字串注冊(cè)和登錄的“文本弱相關(guān)”技術(shù),工程難度更高,安全性更強(qiáng)。與傳統(tǒng)固定口令登錄方式不同,該系統(tǒng)采用隨機(jī)數(shù)字串登錄方式,即在用戶進(jìn)行登錄時(shí),系統(tǒng)會(huì)隨機(jī)下發(fā) 8 位隨機(jī)數(shù)字串,可有效規(guī)避錄音攻擊等安全問題。
在同一賬號(hào)下,云知聲聲紋識(shí)別產(chǎn)品可支持 6 人注冊(cè)。在客戶端云知聲提供封裝好的 SDK,支持聲紋注冊(cè)、登錄、解綁等接口,供上層調(diào)用 API 實(shí)現(xiàn)產(chǎn)品邏輯。同時(shí),云知聲還提供成熟的聲紋服務(wù)私有化部署方案,基于在金融、客服、快遞等不同行業(yè)豐富的私有云部署經(jīng)驗(yàn),可有效保障客戶數(shù)據(jù)安全。
在移動(dòng)醫(yī)療領(lǐng)域,云知聲與平安好醫(yī)生已建立深度合作關(guān)系——2017年12 月,雙方合資成立上海澔醫(yī)智能科技有限公司,共同探索以智能語音識(shí)別等技術(shù)為基礎(chǔ)的家庭智慧醫(yī)療服務(wù)終端建設(shè)。
-
人工智能
+關(guān)注
關(guān)注
1804文章
48496瀏覽量
245250 -
智能語音
+關(guān)注
關(guān)注
11文章
795瀏覽量
49320 -
聲紋識(shí)別
+關(guān)注
關(guān)注
3文章
142瀏覽量
21814
發(fā)布評(píng)論請(qǐng)先 登錄
刷臉支付安全隱患引人深思,聲紋識(shí)別“動(dòng)態(tài)”優(yōu)勢凸顯
基于dsp聲紋識(shí)別,求指點(diǎn)
聲紋識(shí)別技術(shù)應(yīng)用及關(guān)鍵問題
SpeakIn推出全球首款專用于聲紋識(shí)別的AI芯片和模組
SpeakIn發(fā)布用戶語音畫像識(shí)別和聲紋識(shí)別小程序插件

聲紋識(shí)別具備怎樣的優(yōu)勢
聲紋識(shí)別技術(shù)研究的方向在哪里
聲紋識(shí)別未來的研究方向會(huì)是往哪里
聲紋識(shí)別是怎樣的一情況
小米電視5將上線聲紋識(shí)別功能,功能很好很強(qiáng)大
聲紋識(shí)別全面應(yīng)用需要多長的時(shí)間
聲紋識(shí)別具備怎樣的優(yōu)勢
人工智能領(lǐng)域的又一黑科技:聲紋識(shí)別
聲紋識(shí)別技術(shù)與智慧城市建設(shè)同步發(fā)展

評(píng)論