語音評分(Speech Assessment)

張智星


說明

「語音評分」(Speech Assessment)的目的是要以電腦來自動評斷一個人的一句英文發音是否標準,並和老外講的同一句話來進行比較,以圖表列出相近及相異之處,並以聲音或動畫來提示正確發音,讓使用者反覆練習,以達到電腦輔助語言學習(CALL, Computer-Assisted Language Learning)的宗旨。語音評分的流程可以說明如下:
  1. 對標準語句及測試語句抽取出語音的特徵參數 MFCC(Mel-frequency Cepstral Coefficients)。
  2. 以 Viterbi Decoding 來進行 Forced Alignment,以便切出來每一個子音及母音。此部分需用到語者無關(Speaker-independent)的英文語音辨識核心。
  3. 對每一個子音及母音進行評分因素的擷取,包含音量、音高、長度等,以及之前已經取得的 MFCC。
  4. 對每一個評分因素進行個別評分,然後進行加權平均,得到最後的評分結果。

範例

應用

MIR 實驗室研究方向


48 page hits since 20040727