隨著聲紋識別技術(shù)的日益成熟,其已被廣泛應(yīng)用到信息、公共安全、金融、智能安防和智能家居等各個領(lǐng)域。聲紋是一種具有顯著聲學(xué)特性的生物特征信息,與指紋、人臉、虹膜等生物識別信息一樣,能夠用于身份識別與鑒定,而且還能應(yīng)用于具有聲學(xué)特性的異常診斷和故障識別。 作為國內(nèi)自主原創(chuàng)遠(yuǎn)場聲學(xué)技術(shù)的開創(chuàng)者,聲智科技在聲紋采集與識別技術(shù)領(lǐng)域不斷沉淀突破,基于壹元大模型(AzeroGPT)的能力,推出了全新的聲紋采集終端與聲紋采集建庫平臺、聲紋數(shù)據(jù)庫、智能聲紋鑒定系統(tǒng)、聲紋反欺詐系統(tǒng)、聲紋識別引擎、數(shù)字人智能外呼等技術(shù)與應(yīng)用,面向更多復(fù)雜場景助力多元行業(yè)發(fā)展。
· 聲紋采集陣列 助力犯罪打擊 ·
以電信詐騙為代表的非接觸式詐騙一直以來具有舉證難、追贓難的問題,是公安破案的重難點。如今其行騙手段逐漸由群發(fā)式發(fā)展為靶向式,對人民的生命財產(chǎn)安全造成進一步威脅。在實際犯罪過程中,犯罪嫌疑人往往冠以虛假身份,仿冒受害人親友、電商客服甚至公權(quán)力機構(gòu)騙取信任并誘騙人民群眾財產(chǎn)。隨著現(xiàn)代科技的發(fā)展,聲紋采集識別技術(shù)對此提供了解法。
聲紋采集與識別系統(tǒng)
聲紋采集系統(tǒng)為公安部門打擊犯罪提供了重要可靠的技術(shù)手段,通過聲紋采集設(shè)備,建立重點人員聲紋數(shù)據(jù)庫,在 110 接警、重點區(qū)域范圍、重大活動期間等,一旦發(fā)現(xiàn)重點人員、黑名單人員聲紋信息,即進行預(yù)警,有效進行事前預(yù)防。
聲智科技在聲紋采集、識別技術(shù)領(lǐng)域已累積深厚的探索經(jīng)驗,其自主知識產(chǎn)權(quán)的6麥環(huán)形陣列,搭載聲學(xué)定位、聲學(xué)降噪、聲紋識別等算法,可實現(xiàn)360度全方向拾音,高保真錄音和高精度聲紋識別與鑒定。
該設(shè)備對目標(biāo)聲紋進行采集錄入后,對定向采集到的音頻進行降噪、去混響等一系列聲學(xué)技術(shù)處理,隨后輸出至聲紋采集軟件進行聲紋信息的質(zhì)量評估,將符合采集標(biāo)準(zhǔn)的音頻與聲紋上傳聲紋庫,以用于后期的聲紋比對校驗,可實現(xiàn)與現(xiàn)有公安系統(tǒng)的無縫對接,一次錄入即可采集到符合聲紋建庫要求的高質(zhì)量聲紋數(shù)據(jù)。另外,其具備語音定向采集、采集人員信息管理、聲音質(zhì)量檢測、聲紋采集管理等功能,這一聲紋采集系統(tǒng)已經(jīng)通過公安部質(zhì)量檢測認(rèn)證。
· 聲紋識別比對 行業(yè)質(zhì)檢賦能 ·
基于全場景、全應(yīng)用的聲紋高質(zhì)量采集,聲智采用端-云結(jié)合的方案,其聲紋識別技術(shù)擁有海量篩查優(yōu)勢,進行“案查人”“人查案”“案查案”與“人查人”等多種排查方式。其聲紋鑒定技術(shù)可以對電信詐騙等案件中的涉案語音進行個體、團伙的識別,確定犯罪嫌疑人身份,為偵查破案、案件訴訟提供技術(shù)支撐。上述聲紋識別工具結(jié)合壹元大模型(AzeroGPT),為現(xiàn)有的聲紋識別技術(shù)增添新維度,進一步提高其鑒定準(zhǔn)確性。
聲智聲紋庫數(shù)據(jù)采用分布式存儲方式,通過某人與目標(biāo)線索聲紋的1:1對比驗證,判斷某段音頻是否為某人所說;也能完成1:N的多項聲紋檢索,即從若干人中比對識別出匹配目標(biāo)聲紋的某人。檢測結(jié)果反饋快速,聲紋識別檢索響應(yīng)時間小于2秒(百萬級),還具有傳輸穩(wěn)定可靠、讀寫分離、彈性擴容等特點。
聲智“聲紋數(shù)據(jù)駕駛艙”
聲智搭建了“聲紋數(shù)據(jù)駕駛艙”這一數(shù)據(jù)后臺,支持對聲紋庫案件數(shù)量、錄音數(shù)據(jù)的統(tǒng)計分析和實時查看,從全局視角縱覽案情、把握進度。
除此之外,面向精密制造、工業(yè)互聯(lián)網(wǎng)等行業(yè),通過集成聲智特有的采集終端,利用聲紋識別、異音診斷等技術(shù),完成高于傳統(tǒng)人工質(zhì)檢規(guī)范性和一致性的工業(yè)產(chǎn)品質(zhì)檢任務(wù),形成標(biāo)準(zhǔn)化、智能化質(zhì)檢體系。
· 高并發(fā)智能外呼 多領(lǐng)域擬真應(yīng)答 ·
反欺詐勸阻與宣傳也是電信詐騙防患于未然的重要一環(huán),聲智結(jié)合語音技術(shù)、5G和多模態(tài)模型的發(fā)展,實現(xiàn)多模態(tài)數(shù)字人應(yīng)用落地。聲智數(shù)字人智能外呼基于聲紋技術(shù)(Voiceprint)、語音識別(ASR)、語音合成(TTS)、壹元大模型(AzeroGPT)等技術(shù)構(gòu)成,通過外呼話術(shù)語料庫搭建、外呼任務(wù)自定義、外呼語音交互擬人化和外呼數(shù)據(jù)可視化的共同協(xié)作來滿足用戶需求,達(dá)成更佳勸阻及傳播效果。與傳統(tǒng)人工外呼相比,擁有更高的日撥打量、工作投入度,更強的數(shù)據(jù)統(tǒng)計、客戶跟進能力及更低的培訓(xùn)成本。
聲智與北京市公安建立了反詐勸阻的深度合作,通過數(shù)字人智能外呼建構(gòu)起來的反欺詐勸阻平臺,已在北京市公安局刑偵總隊及東城區(qū)、朝陽區(qū)、海淀區(qū)、西城區(qū)、昌平區(qū)、大興區(qū)、門頭溝區(qū)、房山區(qū)等公安分局投入實際應(yīng)用,精準(zhǔn)宣防勸阻呼叫數(shù)量446萬,勸阻成功率達(dá)81%,為電信反欺詐勸阻及宣防工作做出貢獻(xiàn)。
除了公安刑偵外,聲智數(shù)字人智能外呼還在多個領(lǐng)域發(fā)揮作用,為金融、電商、政務(wù)等多行業(yè)提供自動電話外呼和應(yīng)答,應(yīng)用場景包括但不限于低賬齡催收、宣傳營銷等,還曾為北京冬奧會及北京防疫提供智能外呼的基礎(chǔ)能力支持。
關(guān)于聲智
聲智基于自主研發(fā)的Azero人工智能開發(fā)框架,以多模態(tài)遠(yuǎn)場感知和多技能語言模型為特色,具備大流量、高并發(fā)、低延遲、多活熱備的算法與硬件融合能力,面向數(shù)字經(jīng)濟和生命健康等領(lǐng)域,為小米、BAT、中國移動、北京協(xié)和醫(yī)院、全國人大、故宮博物院等1萬+客戶、2億+用戶提供產(chǎn)品、技能與服務(wù)。聲智承擔(dān)了工信部揭榜掛帥人工智能重點項目、北京公安局反欺詐和聲紋平臺、新冠健康防疫平臺等重點項目,曾在北京冬奧會和冬殘奧會、聯(lián)合國COP15、建黨100周年等重大活動中提供服務(wù)保障。聲智與中國科學(xué)院等高校院所成立3個人工智能交叉學(xué)科聯(lián)合實驗室,出版人工智能教材2部,發(fā)起參與100余項國家、行業(yè)及團體標(biāo)準(zhǔn),獲得5項行業(yè)發(fā)明專利獎、300余項榮譽資質(zhì)和2000余項知識產(chǎn)權(quán),入選“科創(chuàng)中國”電子信息先導(dǎo)技術(shù)榜,榮獲北京市科技進步獎、吳文俊人工智能科技進步獎等四項省部級獎項。
-
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3816瀏覽量
64465 -
智能家居
+關(guān)注
關(guān)注
1928文章
9571瀏覽量
185362 -
聲智科技
+關(guān)注
關(guān)注
0文章
28瀏覽量
1515
原文標(biāo)題:聲智語音與聲紋技術(shù)全面升級,優(yōu)化壹元大模型多模態(tài)能力
文章出處:【微信號:聲智科技,微信公眾號:聲智科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論