在前幾節的說明,我們是以一個中文音節來作為一個語音模型(Acoustic Model),在本節中,我們將每一個音節拆成Phone,並以此Phone為語音模型,此種拆解方式稱為 Monophone,以別於右相關(Right-context dependent, RCD)的Biphone。這些資訊是記錄在 digitMonophone.pam,如下
因此只需將前幾節範例中的 digitSyl.pam 改為 digitMonophone.pam,即可進行訓練及辨識率測試,請見下列範例:
此時所產生的 Monophone 列表如下:
而對應於 Monophone 的 mlf 檔案如下:
若改用26維的MFCC,可見下列範例:
若改用39維的MFCC,可見下列範例:
Audio Signal Processing and Recognition (音訊處理與辨識)