紫光展銳新一代系統(tǒng)級(jí)安全的高性能5G移動(dòng)平臺(tái)T820,采用八核CPU架構(gòu),6nm EUV先進(jìn)工藝,金融級(jí)全內(nèi)置安全方案,在性能、功耗與5G通信體驗(yàn)等方面,較上一代產(chǎn)品更為出色。
此前,已經(jīng)為大家講解過(guò)T820的拍照、AI、安全性能(文末查看往期T820相關(guān)文章)。今天,小展將帶你一同探索T820的音頻性能。
聲音是人類感知與交互的重要組成部分,音頻應(yīng)用早已覆蓋了人們生活的方方面面,紫光展銳T820從用戶角度出發(fā),在語(yǔ)音通話、語(yǔ)音交互、音頻播放與錄制等維度進(jìn)行技術(shù)創(chuàng)新,帶來(lái)了全面的體驗(yàn)升級(jí)!
自研通話AI降噪,讓彼此交流“更清晰”
從手機(jī)通話到直播、游戲和音視頻會(huì)議,用戶通話的需求越來(lái)越多,場(chǎng)景變的越來(lái)越復(fù)雜,對(duì)更清晰的語(yǔ)音訴求越來(lái)越強(qiáng)烈。復(fù)雜的使用場(chǎng)景對(duì)通話降噪算法提出了更大的挑戰(zhàn),傳統(tǒng)的通話降噪算法在一些復(fù)雜噪聲場(chǎng)景下,如鳴笛和風(fēng)噪,很容易出現(xiàn)語(yǔ)音失真嚴(yán)重和降噪量不足的問題。如何讓用戶在各種復(fù)雜場(chǎng)景下,仍然能夠不受周圍環(huán)境噪聲的干擾,聽到“更清晰”的語(yǔ)音,成為用戶最為緊迫的訴求。AI技術(shù)是解決這一訴求的不二之選,不過(guò)AI降噪面臨以下技術(shù)難點(diǎn):
-
智能終端設(shè)備的內(nèi)存和算力非常有限,大規(guī)模的網(wǎng)絡(luò)模型難以部署;
-
噪聲場(chǎng)景和種類復(fù)雜多變,需要網(wǎng)絡(luò)具有極高的泛化能力。
通過(guò)運(yùn)用重要性剪枝、基于聽覺特性的特征裁剪和損失融合技術(shù),紫光展銳AI降噪技術(shù)成功解決了以上難點(diǎn)。目前AI降噪已應(yīng)用在T820 5G芯片上,支持蜂窩通信、直播、游戲、音視頻會(huì)議等各種通話應(yīng)用場(chǎng)景。T820能夠在平穩(wěn)、非平穩(wěn)等各種噪聲場(chǎng)景下實(shí)現(xiàn)優(yōu)異的噪聲抑制效果,獲取更加清晰的語(yǔ)音。圖1為平穩(wěn)噪聲場(chǎng)景處理前后的語(yǔ)音頻譜對(duì)比圖。圖2為非平穩(wěn)噪聲場(chǎng)景處理前后的語(yǔ)音頻譜對(duì)比圖。可以看出,無(wú)論在何種場(chǎng)景下,紫光展銳AI降噪技術(shù),均能在保證噪聲抑制干凈的前提下,做到非常完整的語(yǔ)音保留,從而為用戶提供 “更清晰”的交流空間。

圖1.平穩(wěn)噪聲場(chǎng)景AI降噪處理前后的語(yǔ)音頻譜對(duì)比圖

圖2.非平穩(wěn)噪聲場(chǎng)景AI降噪處理前后的語(yǔ)音頻譜對(duì)比圖
視聽一體化錄制技術(shù),讓生活記錄“更真實(shí)”
隨著Vlog等生活方式的流行,人人都可以用智能手機(jī)來(lái)記錄生活,這也對(duì)錄制技術(shù)有了更高的要求。手機(jī)音頻錄制功能也得到越來(lái)越多的關(guān)注,近年來(lái)該功能常作為產(chǎn)品主推的技術(shù)亮點(diǎn)之一。視頻錄制的效果很大程度得益于真實(shí)、清晰的音頻錄制,現(xiàn)在的智能手機(jī)拍攝畫面的質(zhì)量越來(lái)越高,能拍得更遠(yuǎn)更清晰。但在許多場(chǎng)景下,想要錄制清晰的聲音并不簡(jiǎn)單。當(dāng)沒有與高質(zhì)量畫面匹配的高質(zhì)量音頻時(shí),再好的視頻內(nèi)容也總是不完美的。
圖3.視聽一體化錄制技術(shù)示意圖
紫光展銳視聽一體化錄制技術(shù),在錄制視頻時(shí)凸顯畫面中的目標(biāo)聲音,針對(duì)性衰減目標(biāo)之外的干擾,同時(shí)結(jié)合視頻畫面信息對(duì)錄音進(jìn)行控制,增加音頻與畫面的匹配度。

圖4.非目標(biāo)方向干擾抑制性能展示
當(dāng)前市場(chǎng)上,大部分廠商具備類似差異化功能產(chǎn)品均采用三麥方案,而大部分智能手機(jī)均采用雙麥方案。紫光展銳視聽一體化錄制技術(shù)支持雙麥陣列方案,在保證性能情況下,極大地減小了技術(shù)的應(yīng)用成本。在保證目標(biāo)聲音無(wú)失真、底噪無(wú)明顯放大的情況下,最大可放大目標(biāo)聲音12dB以上,最大噪聲抑制量可達(dá)到6dB左右。如圖4,除目標(biāo)方向90°無(wú)衰減外,其余方向均有相應(yīng)干擾抑制。在突顯目標(biāo)聲音能力和噪聲抑制能力兩項(xiàng)關(guān)鍵性能上,均能達(dá)到市場(chǎng)上競(jìng)品三麥方案水平,甚至優(yōu)于部分廠商三麥方案。
紫光展銳視聽一體化錄制技術(shù)將以優(yōu)秀的性能,助力各種視頻錄制場(chǎng)景,給用戶帶來(lái)“更真實(shí)”的音視頻錄制體驗(yàn)。
智能功放解決方案,讓音頻播放 “更動(dòng)聽”
在播放音視頻和游戲娛樂等場(chǎng)景中,手機(jī)揚(yáng)聲器發(fā)出的聲音是否動(dòng)聽極大影響用戶的使用體驗(yàn)。但隨著手機(jī)越來(lái)越輕薄,能夠給到揚(yáng)聲器的空間極為有限,使得揚(yáng)聲器更容易受到振幅、溫度的影響。如果揚(yáng)聲器的振膜位移或音圈溫度超過(guò)安全大小均會(huì)導(dǎo)致永久損壞。在保護(hù)揚(yáng)聲器安全的前提下,使揚(yáng)聲器播放出音質(zhì)更好、音量更大的聲音,是業(yè)界技術(shù)發(fā)展的共同目標(biāo)。
紫光展銳的智能功放ISC(Intelligent Speaker Control)技術(shù),能夠建立準(zhǔn)確的揚(yáng)聲器模型,通過(guò)控制電壓來(lái)控制振膜和溫度,使揚(yáng)聲器物盡其用,發(fā)揮出最大的性能潛力。目前ISC技術(shù)支持前饋及反饋兩種方案,滿足不同客戶的需求。前饋方案無(wú)需增加硬件,以較低成本獲得最優(yōu)性能,使智能功放成為普惠技術(shù)。而反饋方案增加了電壓電流(I/V)的監(jiān)測(cè)通路,能夠?qū)崟r(shí)獲得揚(yáng)聲器的工作狀態(tài),發(fā)揮每個(gè)單體揚(yáng)聲器的性能可以獲得比前饋方案更優(yōu)的性能。

圖5.智能功放ISC
圖6為錄制得到的揚(yáng)聲器播放的聲音信號(hào),可以看到,與無(wú)ISC算法處理相比,ISC算法處理后聲音大小顯著提高,聲壓級(jí)提升5~8dB,低頻提升6-10dB。

圖6.ISC處理效果--聲壓
除核心的揚(yáng)聲器控制及保護(hù)技術(shù)外,ISC技術(shù)還支持包括音量增強(qiáng)、頻響精細(xì)調(diào)整、動(dòng)態(tài)范圍控制、低音增強(qiáng)等功能。頻響精細(xì)調(diào)整功能能夠根據(jù)客戶的需求,得到更均衡的頻響。低音增強(qiáng)技術(shù)利用心理聲學(xué)虛擬音調(diào)原理,生成低頻的諧波即“虛擬低音”,改善小型揚(yáng)聲器低頻音質(zhì),使用戶感知到更具沖擊力的低頻效果。
紫光展銳的智能功放ISC(intelligent Speaker Control)技術(shù)能夠發(fā)揮揚(yáng)聲器的性能,用戶無(wú)論在聽音樂還是打游戲時(shí),均能聽到更悅耳的聲音,獲取更佳的聽音體驗(yàn)。
專用低功耗語(yǔ)音喚醒IC,讓終端交互“更智能”
語(yǔ)音助手如今已是智能終端的標(biāo)配,語(yǔ)音喚醒作為語(yǔ)音交互的門戶,從某種程度上來(lái)說(shuō),其綜合性能的好壞,決定了用戶使用語(yǔ)音助手的意愿,同時(shí)也成為了終端實(shí)現(xiàn)智能化的瓶頸。
語(yǔ)音喚醒主要面臨以下技術(shù)難點(diǎn):
-
24小時(shí)不間斷運(yùn)行(always on),要求具有極致的低功耗;
-
嚴(yán)苛的高喚醒率、低誤喚醒率要求,確保使用語(yǔ)音助手的用戶體驗(yàn);
-
較低的計(jì)算和內(nèi)存開銷,要求滿足實(shí)時(shí)性和低成本。
傳統(tǒng)的語(yǔ)音喚醒方案,通過(guò)集成智能麥克風(fēng)或?qū)S玫恼Z(yǔ)音喚醒芯片來(lái)解決低功耗問題。但這種多芯片堆疊的方式無(wú)疑大幅增加了產(chǎn)品成本,影響了特性在中低端市場(chǎng)的下沉。展銳5G芯片T820集成了專用低功耗語(yǔ)音喚醒IC,僅需要一顆芯片,就能支持完整的喚醒功能,不僅有效解決了性能和功耗之間的矛盾,還降低了下游廠商的方案成本,加速了產(chǎn)品“智能化”的普及。

圖7.T820語(yǔ)音喚醒方案
除以上專用IC之外,展銳在算法層面還提供從輕量級(jí)到常規(guī)級(jí)的喚醒與識(shí)別算法,形成一整套完整的軟硬件一體化解決方案,算法、芯片定制化技術(shù),讓資源開銷更為合理,綜合性能實(shí)現(xiàn)安靜環(huán)境95%、嘈雜環(huán)境90%以上的喚醒率,同時(shí)誤喚醒率小于1次/24小時(shí),為終端語(yǔ)音交互智能化體驗(yàn)保駕護(hù)航。
紫光展銳將持續(xù)打造業(yè)界領(lǐng)先的軟硬件一體化音頻技術(shù),為消費(fèi)者帶來(lái)極致的影音體驗(yàn)!

End
?
往期推薦
1. 紫光展銳發(fā)布系統(tǒng)級(jí)安全的高性能5G SoC移動(dòng)平臺(tái)T820
2. 紫光展銳5G芯片T820,給你滿滿的安全感!
3. 紫光展銳5G芯片T820—AI釋放大能量
4. 紫光展銳T820,拍照質(zhì)量和性能雙提升
原文標(biāo)題:聲音的新科技 | 拆解紫光展銳5G芯T820的音頻技術(shù)
文章出處:【微信公眾號(hào):紫光展銳UNISOC】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
紫光展銳
+關(guān)注
關(guān)注
15文章
880瀏覽量
41410
原文標(biāo)題:聲音的新科技 | 拆解紫光展銳5G芯T820的音頻技術(shù)
文章出處:【微信號(hào):gh_2c8fa897d02f,微信公眾號(hào):紫光展銳UNISOC】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
紫光展銳聯(lián)合美格智能推出第二代5G Sub6G R16模組SRM812
紫光展銳5G SoC T8300優(yōu)勢(shì)特性解讀 八核CPU架構(gòu) 雙核GPU架構(gòu)

德明利高端存儲(chǔ)芯片eMMC通過(guò)紫光展銳移動(dòng)芯片平臺(tái)認(rèn)證

評(píng)論