2016年4月10日 星期日

ERB Transforms

\begin{figure}
\begin{center}
\epsfig{file=Figures/hearing.ps, width=4in} \end{center} \vspace{-0.25in}
\end{figure}

人內耳中的basilar membrane(基底膜)有許多的聽覺神經,而這些神經對於不同頻率的聲波各有其敏感度。因此,根據研究,德國科學家巴克豪森(Barkhausen)透過實驗,將聲波區分為24個關鍵頻帶(Critical Bands),並稱之為巴克刻度(Bark scale)。人耳對於相鄰頻帶會有相同距離的感覺。我們知道,人耳對於聲波能量強度的感受大致是對數變化的,但實際上,這個感受可能比單純的對數還要更複雜,因此才會有科學家進一步去研究這種更精緻的對應關係。這種對應是根據主觀實驗得來的,因此不同人的感受會有些微差距。關鍵頻帶之所以稱為'頻帶',就是因為它並不是一個數值,而是一個範圍,同一個範圍內的頻率大致上感受都會差不多。

Bark scale critical bands
NumberCenter Frequency (Hz)Cut-off Frequency (Hz)Bandwidth (Hz)
20
16010080
2150200100
3250300100
4350400100
5450510110
6570630120
7700770140
8840920150
910001080160
1011701270190
1113701480210
1216001720240
1318502000280
1421502320320
1525002700380
1629003150450
1734003700550
1840004400700
1948005300900
20580064001100
21700077001300
22850095001800
2310500120002500
2413500155003500
參考: https://en.wikipedia.org/wiki/Bark_scale
其中,center frequency表示每個頻帶的中間值,也就是說,若想只用一個頻率值代表一個頻帶的話,就是用center frequency。cut-off frequency就是頻帶的最大和最小值。bandwidth是頻寬,表示一個頻帶的寬度(最大值-最小值)。

Bark scale只定義了24種頻率的對應方式,但是到底要如何對每個頻率f都找到一個對應的Bark scale值呢?研究人員開始試著找出一些數學式來近似這種對應,而ERB(Equivalent Rectangular Bandwidth)就是其中的一種對應方式。


\mathrm{ERB}(f) = 6.23 \cdot f^2 + 93.39 \cdot f + 28.52

ERB scale指的是有幾個ERB在給定的頻率f以下


\mathrm{ERBS}(f) = 21.4 \cdot log_{10}(1 + 0.00437 \cdot f)