17-4 Digit Recognition: Changing Acoustic Models (⑥r恁GModel)

在前幾節的說明，我們是以一個中文音節來作為一個語音模型（Acoustic Model），在本節中，我們將每一個音節拆成Phone，並以此Phone為語音模型，此種拆解方式稱為 Monophone，以別於右相關（Right-context dependent, RCD）的Biphone。這些資訊是記錄在 digitMonophone.pam，如下
原始檔（htk/chineseDigitRecog/training/digitMonophone.pam）：（灰色區域按兩下即可拷貝）
ba	b a
er	er
jiou	j i o u
ling	l i ng
liou	l i o u
qi	q i
san	s a n
si	s i
sil	sil
wu	w u
i	i
因此只需將前幾節範例中的 digitSyl.pam 改為 digitMonophone.pam，即可進行訓練及辨識率測試，請見下列範例：
Example 1: htk/chineseDigitRecog/training/goMonophone13.m

此時所產生的 Monophone 列表如下：
原始檔（htk/chineseDigitRecog/training/output/digitMonophone.mnl）：（灰色區域按兩下即可拷貝）
sil
l
i
ng
er
s
a
n
w
u
o
q
b
j
而對應於 Monophone 的 mlf 檔案如下：
Example（htk/chineseDigitRecog/training/output/digitMonophone.mlf）：
若改用26維的MFCC，可見下列範例：
Example 2: htk/chineseDigitRecog/training/goMonoPhone26.m

若改用39維的MFCC，可見下列範例：
Example 3: htk/chineseDigitRecog/training/goMonoPhone39.m

Audio Signal Processing and Recognition (音訊處理與辨識)