「語音評分」(Speech Assessment)的目的是要以電腦來自動評斷一個人的一句英文發音是否標準,並和老外講的同一句話來進行比較,以圖表列出相近及相異之處,並以聲音或動畫來提示正確發音,讓使用者反覆練習,以達到電腦輔助語言學習(CALL, Computer-Assisted Language Learning)的宗旨。語音評分的流程可以說明如下:
- 對標準語句及測試語句抽取出語音的特徵參數 MFCC(Mel-frequency Cepstral Coefficients)。
- 以 Viterbi Decoding 來進行 Forced Alignment,以便切出來每一個子音及母音。此部分需用到語者無關(Speaker-independent)的英文語音辨識核心。
- 對每一個子音及母音進行評分因素的擷取,包含音量、音高、長度等,以及之前已經取得的 MFCC。
- 對每一個評分因素進行個別評分,然後進行加權平均,得到最後的評分結果。
下圖是波形及經由 Forced Alignment 的結果:
62 page hits since 20040727 |