3-3 Human Voice Production (Hn)

(請注意：中文版本並未隨英文版本同步更新！)

人聲的發音與接收流程，可以列出如下：

下列圖形說明人聲的發音機制：

The production mechanism of human voices.
人聲的發音機制

由於聲門（Glottis）的肌肉張力，加上由肺部壓迫出來的空氣，就會造成聲門的快速打開與關閉，這個一疏一密的空氣壓力，就是人聲的源頭，在經由聲道、口腔、鼻腔的共振，就會產生不同的聲音（音色）。換句話說：

下面這一張圖，顯示聲門附近的空氣流速，以及最後在嘴巴附近所量測到的聲波：

Airflow velocity around the glottis and the resultant voices signals

經由下面這個連結，可以看到聲門運動的現象：

要拍到聲門運動，是相當不容易，必須使用高速的攝影機，例如

所以人發音的過程，是由訊號源（聲門），經過濾波器（口腔、鼻腔、嘴型等），才得到最後的聲音，這個過程可以和頻譜訊號一一對應如下：

Source-filter model and the corresponding spectra
人聲發音過程與與頻譜的對應

若用數學模型表示，可用下列方塊圖：

Block diagram representation of source-filter model
人聲發音過程的數學模型

一般來說，當訊號源是間隔規律的波形時，通常代表有聲音，如果訊號源是雜亂的訊號，則得到氣音，以下列的發音「six」為例：

Unvoiced and voiced sounds
氣音和有聲音

其中「s」和「k」都是無聲的氣音，只有「i」是有聲音。

一般而言，中文的氣音只發生在字頭，不會是在字尾。以「清華大學」的「清」為例：

Hint

Just put your hand on your throat, you can feel the vibration of the glottis.
若要判斷你的聲門是否有震動，只要將手放在你的喉嚨位置，就可以感覺到聲門是否有震動。

以下是一些名詞的中英對照表：

Audio Signal Processing and Recognition (音訊處理與辨識)