人內耳中的basilar membrane(基底膜)有許多的聽覺神經,而這些神經對於不同頻率的聲波各有其敏感度。因此,根據研究,德國科學家巴克豪森(Barkhausen)透過實驗,將聲波區分為24個關鍵頻帶(Critical Bands),並稱之為巴克刻度(Bark scale)。人耳對於相鄰頻帶會有相同距離的感覺。我們知道,人耳對於聲波能量強度的感受大致是對數變化的,但實際上,這個感受可能比單純的對數還要更複雜,因此才會有科學家進一步去研究這種更精緻的對應關係。這種對應是根據主觀實驗得來的,因此不同人的感受會有些微差距。關鍵頻帶之所以稱為'頻帶',就是因為它並不是一個數值,而是一個範圍,同一個範圍內的頻率大致上感受都會差不多。
Bark scale critical bands
Number | Center Frequency (Hz) | Cut-off Frequency (Hz) | Bandwidth (Hz) |
---|---|---|---|
20 | |||
1 | 60 | 100 | 80 |
2 | 150 | 200 | 100 |
3 | 250 | 300 | 100 |
4 | 350 | 400 | 100 |
5 | 450 | 510 | 110 |
6 | 570 | 630 | 120 |
7 | 700 | 770 | 140 |
8 | 840 | 920 | 150 |
9 | 1000 | 1080 | 160 |
10 | 1170 | 1270 | 190 |
11 | 1370 | 1480 | 210 |
12 | 1600 | 1720 | 240 |
13 | 1850 | 2000 | 280 |
14 | 2150 | 2320 | 320 |
15 | 2500 | 2700 | 380 |
16 | 2900 | 3150 | 450 |
17 | 3400 | 3700 | 550 |
18 | 4000 | 4400 | 700 |
19 | 4800 | 5300 | 900 |
20 | 5800 | 6400 | 1100 |
21 | 7000 | 7700 | 1300 |
22 | 8500 | 9500 | 1800 |
23 | 10500 | 12000 | 2500 |
24 | 13500 | 15500 | 3500 |
其中,center frequency表示每個頻帶的中間值,也就是說,若想只用一個頻率值代表一個頻帶的話,就是用center frequency。cut-off frequency就是頻帶的最大和最小值。bandwidth是頻寬,表示一個頻帶的寬度(最大值-最小值)。
Bark scale只定義了24種頻率的對應方式,但是到底要如何對每個頻率f都找到一個對應的Bark scale值呢?研究人員開始試著找出一些數學式來近似這種對應,而ERB(Equivalent Rectangular Bandwidth)就是其中的一種對應方式。
ERB scale指的是有幾個ERB在給定的頻率f以下