在聽(tīng)覺(jué)信號(hào)中存在著一些線索可以供我們來(lái)判斷聲源的距離遠(yuǎn)近。這篇文章就以其中的一個(gè)線索--初始時(shí)間延遲差為例,來(lái)介紹應(yīng)該如何設(shè)計(jì)對(duì)應(yīng)的聽(tīng)力測(cè)試,探究其在雙耳距離感知中的作用。通常來(lái)說(shuō),一個(gè)聽(tīng)力測(cè)試可以分成三大部分:理論背景,測(cè)試準(zhǔn)備(包括測(cè)量和程序編寫(xiě))以及結(jié)果分析。下面就通過(guò)具體的步驟來(lái)進(jìn)行說(shuō)明。
1. 初始時(shí)間延遲差
房間脈沖響應(yīng)是房間的屬性之一,表示聲源和麥克風(fēng)之間的傳遞函數(shù)。它可以分為三個(gè)部分:直達(dá)聲、早期反射聲和混響聲。初始時(shí)間延遲差(Initial Time Delay Gap,后文簡(jiǎn)寫(xiě)為ITDG)是直達(dá)聲和第一個(gè)從表面反射的聲音之間的時(shí)間間隔,如圖1所示。
圖1: 房間脈沖響應(yīng)示意圖
ITDG被一些學(xué)者認(rèn)為是距離感知的線索。Stephan 和 Simone 證明,通過(guò)修改 ITDG 的長(zhǎng)度可以改變?nèi)祟惖木嚯x感知【1】。這是因?yàn)椋鐖D2所示,當(dāng)麥克風(fēng)的位置固定時(shí),聲源的距離越遠(yuǎn),直達(dá)聲與第一此反射聲之間的路徑差就越小,從而 ITDG 也越小。因此,提出了通過(guò)修改 ITDG 來(lái)影響人類雙耳距離感知的假設(shè)。然而,值得注意的是,這種假設(shè)只在地板被認(rèn)為是唯一反射表面的情況下成立,如在半消聲室或相對(duì)空曠的房間中。而聲源和麥克風(fēng)之間存在多個(gè)物體會(huì)影響第一個(gè)反射,從而影響這個(gè)假設(shè)的有效性。也有學(xué)者持反對(duì)意見(jiàn),F(xiàn)otis 通過(guò)實(shí)驗(yàn)發(fā)現(xiàn), ITDG 似乎并不是距離感知中的一個(gè)顯著線索【2】。
圖2: 在只考慮地面反射情況下的ITDG,其中dR代表直達(dá)聲路徑,dD代表第一次反射聲的路徑
?
2. 實(shí)驗(yàn)設(shè)計(jì)
2.1 雙耳室內(nèi)脈沖響應(yīng)(BRIR)的測(cè)量
為了探究 ITDG 在雙耳音頻距離感知中的作用,首先必須建立BRIRs(Binaural Room Impulse Responses)的數(shù)據(jù)庫(kù)。為此,在Chalmers的兩個(gè)房間EH和LR中,使用人工頭(Dummy head或者Artificial head)和掃頻正弦信號(hào)測(cè)量雙耳室內(nèi)脈沖響應(yīng)。分別在 2 米、4 米、6 米和 8 米的距離上,測(cè)量了四個(gè)不同方位角(0度、30度、60度、90度)BRIRs 。為了確保獲得可用的 ITDG,測(cè)量過(guò)程中移除了聲源和麥克風(fēng)之間的任何物體。隨后,使用fade-in和fade-out窗口函數(shù)處理所有測(cè)量到的BRIRs。在理想的測(cè)量環(huán)境中,如半消聲室,人工頭和聲源位于 1.6 米高度時(shí)的 ITDG 曲線應(yīng)該和圖3中所示的理想曲線相似。對(duì)從EH和LR房間中,人工頭的左右耳測(cè)量的脈沖響應(yīng)進(jìn)行處理并提取ITDG數(shù)據(jù),發(fā)現(xiàn)測(cè)量結(jié)果與理想曲線相匹配。為了簡(jiǎn)化過(guò)程,在本研究中,使用左耳的脈沖響應(yīng)作為進(jìn)一步分析和修改的基準(zhǔn)。
圖3: 在僅考慮地面反射時(shí),1.6米高度的 ITDG 曲線以及來(lái)自 EH 和 LR 的測(cè)量數(shù)據(jù)
? 2.2 ITDG的修改方法
修改算法的核心概念是調(diào)整特定脈沖響應(yīng) ITDG 的長(zhǎng)度(例如,30度時(shí)的2米處的BRIR),使其產(chǎn)生與同一角度下的任何距離(例如,30度時(shí)的6米處的BRIR)具有相同的距離感知。一旦這種方法被證明是有效的,便可以通過(guò)測(cè)量少量BRIRs來(lái)表達(dá)整個(gè)區(qū)域的響應(yīng)。為了實(shí)現(xiàn)這個(gè)目標(biāo),將測(cè)量到的脈沖響應(yīng)分為三個(gè)不同的部分:直接部分(從脈沖信號(hào)開(kāi)始到直達(dá)聲峰值后的 1 毫秒),早期反射部分(直接部分后的 35 毫秒),和混響部分(早期反射部分之后,直到信號(hào)結(jié)束)。這些部分如圖4所示。
圖4: 在 ITDG 修改前后的脈沖響應(yīng),由于本文僅將來(lái)自地面的反射視為距離線索,因此在測(cè)量的脈沖響應(yīng)中出現(xiàn)了一個(gè)虛假峰值
? 為了準(zhǔn)確地確定來(lái)自地面的第一次反射聲的起始點(diǎn),并排除 ITDG 中的虛假峰值的影響,采用了改進(jìn)的峰度算法與理想 ITDG 曲線相結(jié)合的方法來(lái)對(duì)測(cè)量的BRIRs進(jìn)行分析【3】。此外,為了簡(jiǎn)化過(guò)程,在修改脈沖響應(yīng)時(shí),優(yōu)先考慮靠近聲源的一側(cè);具體來(lái)說(shuō),右耳的修改長(zhǎng)度與左耳直接相關(guān)(因?yàn)樵谶@次測(cè)量中,左耳總是更加靠近聲源)。例如,當(dāng)左耳的 ITDG 縮短 1 毫秒時(shí),右耳也縮短相同的時(shí)間。通過(guò)保持直接和混響部分不變,壓縮或擴(kuò)展與 ITDG 重疊的早期反射部分,以實(shí)現(xiàn)目標(biāo)距離處所需的 ITDG。由于修改部分與 BRIRs 中的總數(shù)據(jù)相比要小得多,因此,由此操作產(chǎn)生的聲壓級(jí)和頻譜特性的任何變化都被認(rèn)為是可以忽略不計(jì)的。
2.3 程序設(shè)計(jì)
實(shí)驗(yàn)旨在研究在不同場(chǎng)景下修改 ITDG 是否會(huì)影響人類聽(tīng)覺(jué)的距離感知。研究了以下 2 個(gè)因素:目標(biāo)距離(2 米或6 米)和音頻材料(演講聲或鼓聲)。由于 BRIRs 是在兩個(gè)房間內(nèi)進(jìn)行測(cè)量的,因此總共有2x2x2=8 次試驗(yàn)。聽(tīng)覺(jué)實(shí)驗(yàn)是根據(jù) MUSHRA設(shè)計(jì)的【4】,但并不完全相同,例如在這個(gè)實(shí)驗(yàn)中沒(méi)有錨點(diǎn)。MUSHRA是音頻測(cè)試中一個(gè)很常用的方法,需要注意的是,其中文版存在著一些翻譯錯(cuò)誤,因此推薦查看其他版本。實(shí)驗(yàn)程序使用MATLAB APP designer進(jìn)行設(shè)計(jì),實(shí)驗(yàn)頁(yè)面如圖5所示。在每個(gè)試驗(yàn)中,有3個(gè)參考音頻和4個(gè)選項(xiàng)音頻。參考音頻是通過(guò)將音頻材料與實(shí)際測(cè)量的BRIR卷積得到的。四個(gè)選項(xiàng)分別是ref,orig,drr和drr+itdg 。所有參考音頻和選項(xiàng)音頻均經(jīng)過(guò)調(diào)整,以具有相同的響度,以排除響度對(duì)距離感知的影響。
以其中一個(gè)試驗(yàn)為例。在這個(gè)試驗(yàn)中,目標(biāo)距離為6米,修改后的 BRIR 來(lái)自 2 米處,測(cè)量值來(lái)自入口大廳,材料是演講。各選項(xiàng)的描述如下:
ref:與 6 米處的參考音頻完全相同
orig:與 2 米處的參考音頻完全相同
drr:僅將 2 米處的 BRIR 調(diào)整至與 6 米處的 BRIR 具有相同的 drr,而不改變 ITDG。
drr+itdg:按照前文所述方法,將 2 米處的BRIR的 ITDG 長(zhǎng)度修改為與 6 米處相同。然后保持直接部分不變,修改剩余部分的幅值,直到其drr與 6 米處的BRIR的drr相同。
需要注意的是,4個(gè)選項(xiàng)的順序是隨機(jī)的,因此測(cè)試人員無(wú)法猜測(cè)每個(gè)選項(xiàng)對(duì)應(yīng)的音頻。
圖5: 聽(tīng)力測(cè)試程序的操作頁(yè)面
3. 結(jié)果分析
由于實(shí)驗(yàn)難度較大,共有五名參與者參加了實(shí)驗(yàn),他們都具有豐富的聽(tīng)力測(cè)試經(jīng)驗(yàn),并報(bào)告稱沒(méi)有聽(tīng)力缺陷。參考 MUSHRA 驗(yàn)證方法對(duì)結(jié)果的準(zhǔn)確性和人類距離感知的可壓縮性,如果某個(gè)參與者在超過(guò) 15% 的所有試驗(yàn)中對(duì)隱藏參考音頻的評(píng)分超過(guò)真實(shí)距離的 10%(即對(duì)于 2 米,評(píng)估在 1.8-2.2 米之外;對(duì)于 6 米,評(píng)估在 5.4-6.6 米之外),那么將排除該結(jié)果。所有參與者都通過(guò)了篩選條件,因此認(rèn)為他們的結(jié)果有效。
聽(tīng)力測(cè)試結(jié)果用小提琴圖來(lái)呈現(xiàn),該圖顯示了密度曲線和箱線圖的單個(gè)顯示,使得更容易洞察數(shù)據(jù)分布。整體測(cè)試結(jié)果(圖6)顯示,ref和orig的中位數(shù)與實(shí)際測(cè)量距離相同,這證明了實(shí)驗(yàn)結(jié)果的可靠性。進(jìn)一步分析表明, drr和drr+itdg都可以產(chǎn)生與目標(biāo)相似的距離感,但drr+itdg對(duì)drr并沒(méi)有系統(tǒng)性的改進(jìn)。為了深入了解結(jié)果,對(duì)得到的數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)分析。由于實(shí)驗(yàn)參與者人數(shù)較少,并且 MUSHRA 測(cè)試的結(jié)果不符合正態(tài)分布(例如結(jié)果中的ref和orig),因此使用非參數(shù)檢驗(yàn)來(lái)分析數(shù)據(jù)。
圖6:聽(tīng)力實(shí)驗(yàn)總體結(jié)果
Friedman 檢驗(yàn)發(fā)現(xiàn)所有試驗(yàn)的差異在p《0.05處顯著。因此,進(jìn)行了配對(duì)的 Wilcoxon 符號(hào)秩檢驗(yàn)作為事后檢驗(yàn),并進(jìn)行了 Bonferroni-Holm p值校正,結(jié)果如圖7所示。orig與ref、drr、drr+itdg之間有明顯區(qū)別,但在 drr、drr+itdg和ref三者之間沒(méi)有顯著差異。這個(gè)結(jié)果表明 ITDG 在距離感知中并不起到非常重要的作用,這與 Fotis 的結(jié)論一致【2】。
圖7:Bonferroni-Holm 校正的 p 值適用于所有成對(duì)比較測(cè)試,包括speech和drum對(duì)以及近處和遠(yuǎn)處的參考。在p《0.05時(shí),藍(lán)色背景表示顯著差異
? 4. 總結(jié)
本文旨在探討 ITDG 在雙耳音頻距離感知中的作用。通過(guò)在 Chalmers University of Technology 的兩個(gè)房間測(cè)量雙耳室內(nèi)脈沖響應(yīng),并對(duì)其進(jìn)行修改,研究了 ITDG 對(duì)距離感知的影響。結(jié)果表明,盡管修改 ITDG 可以改變雙耳音頻中的距離感知,但這種影響在實(shí)驗(yàn)中并不顯著。這意味著 ITDG 可能不是距離感知中的主要線索。
值得注意的是,本研究的結(jié)論僅適用于考慮地板作為唯一反射表面的情況,如半消聲室或相對(duì)空曠的房間。在實(shí)際環(huán)境中,可能會(huì)有多個(gè)物體位于聲源與接收點(diǎn)之間,從而影響第一次反射和 ITDG 的有效性。并且因?yàn)镮TDG本身不是雙耳線索,在對(duì)其進(jìn)行修改時(shí)進(jìn)行了許多的簡(jiǎn)化,這些誤差也可能對(duì)結(jié)果產(chǎn)生影響。因此,在未來(lái)的研究中,可能需要進(jìn)一步探討更復(fù)雜環(huán)境中 ITDG 對(duì)距離感知的影響。
審核編輯 :李倩
-
脈沖
+關(guān)注
關(guān)注
20文章
899瀏覽量
95969 -
數(shù)據(jù)庫(kù)
+關(guān)注
關(guān)注
7文章
3860瀏覽量
64841 -
函數(shù)
+關(guān)注
關(guān)注
3文章
4350瀏覽量
63135
原文標(biāo)題:為什么我們能判斷聲音的遠(yuǎn)近 - 初始時(shí)間延遲差的作用
文章出處:【微信號(hào):CloudBrain-TT,微信公眾號(hào):云腦智庫(kù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
為什么ADS1298在初始化過(guò)程中START引腳的建立時(shí)間會(huì)有延遲?
半導(dǎo)體雷射導(dǎo)通延遲時(shí)間

OptiSystem應(yīng)用:差分模式延遲和模式帶寬
如何選擇合適的電容 電容在電路中的作用
想在ARM中把TVL320的編碼解出來(lái),判斷有無(wú)聲音輸入?
HDDL-E數(shù)字式電纜故障定點(diǎn)儀操作使用

時(shí)間繼電器接線圖詳解

TAS6422E-Q1: 規(guī)格書(shū)中I2C地址時(shí)間問(wèn)題怎么理解?
集成MOSFET驅(qū)動(dòng)器中的延遲和死區(qū)時(shí)間

差分放大電路的原理和作用
晶體管時(shí)間繼電器的工作原理
時(shí)間繼電器的工作電壓有哪些
網(wǎng)絡(luò)延遲為何如此重要
儲(chǔ)能電容怎么判斷好壞?
差分電壓探頭和羅氏線圈的延遲討論

評(píng)論