語音合成展示系統
本實驗室的TTS系統,將輸入的文字經由斷詞以及部分特殊詞的整合, 加上音調微調之後,產生斷詞及其相對應音碼;將這兩個資訊再丟入事先經過加密的音檔 處理序中,完成解密程序並將音檔作連接,合成出整句的音訊檔結果。 本系統除了可以合成繁體中文外,也加入約1000個英文單字及26個英文字母的詞庫和單音 音檔,無論是中英夾雜或是單純英文文字的合成都沒有問題。 目前本TTS系統努力改善的方向為:加入文字詞性、調整合成結果的duration等, 以期達到更接近自然人聲的目標。
使用方式:
ASRA自動語音辨識系統
本系統能將使用者透過麥克風所接收的語音,經由語音辨識技術後的對照結果顯示於網頁上, 使用者可選擇要辨識的語言,目前提供了中文、英文、日文及台語四種語言。
選擇網頁十句文本其中之一,按下錄音鍵後,限時三秒鐘唸完所選句子。錄製的音檔送回實驗室的核心作評分,最後將結果顯示於 flash 畫面中。
按下錄音鍵後,限時三秒鐘任意唸出網頁文本其中之一句,錄製的音檔送回實驗室的核心作辨識,最後將結果顯示於 flash 畫面中。
注意事項:
為達到最佳之評分效果,最好使用指向式麥克風,或品質較好之全向式麥克風,並關閉『麥克風增益』功能。
「華語會話教室」提供給想學習中文會話的外國人士一個方便的管道。 ●使用說明
1. Windows(R) Vista 的使用者,執行本軟體前請先將使用者帳戶控制關閉, 本軟體才能正常執行。使用者帳戶控制位於「控制台 -> 使用者帳戶 -> 管理或開啟使用者帳戶控制」。
2. 為達到最佳之評分效果,最好使用指向式麥克風,或品質較好之全向式麥克風,並關閉『麥克風增益』功能。
預設可辨識三百首唐詩以及兩百句英文,程式載入含有可辨識字句的純文字(.txt)檔案,使用者可以透過麥克風進行語音辨識,對應的結果會顯示於視窗之中,並可以載入您自訂的純文字檔案(檔案中每一行表示一句,記錄中文句子的檔案請勿包含數字或是英文以及符號,記錄英文句子的檔案則請勿包含中文及數字,並以Big5編碼格式儲存,行數無上限,因錄音時間內定為三秒鐘,請自行斟酌每一句的字數),開啟之後可以選擇要辨識中文或是英文,並可利用介面即時做可辨識句子之新增或刪減。 ●使用說明
此旋律辨識程式應用MIR實驗室旋律辨識核心,可對任何使用者自訂的聲音旋律作辨識,此版本結合伺服器內的歌曲資料庫,可依照使用者自錄的聲音,辨識出對應的歌曲。 ●使用說明
"一語中的"是應用MIR實驗室的語音辨識核心做成的遊戲,唸取畫面上不斷落下的成語方塊以獲得分數跟提升等級以挑戰更高的難度,藉以達到練習成語的目的。 遊戲流程說明: 1.開啟程式後,選擇想要的等級,依照等級有不同的難度可以挑戰。 2.按下開始遊戲即可。若想暫停則可按下旁邊的"暫停一下"鈕,想要繼續的話,再按一次鈕即可。
"唸唸不忘"是應用MIR實驗室的語音辨識核心做成的詩詞與華語發音練習遊戲,唸取所選擇的詩詞,系統將依據正確度給予評價或指導,藉以達到練習詩詞及發音的目的。 遊戲流程說明: 1.開啟程式後,按下模式按鈕進入詩詞選擇畫面,可選擇想練習的詩詞。 2.選擇完畢後立即開始背誦,每句可開始錄音時,會有文字及音效提示。若想中途離開則可按下旁邊的紅色按鈕。
"成語接龍"是應用MIR實驗室的語音辨識核心做成的成語練習遊戲,系統辨識使用者所說出的成語後,給予接續的成語完成接龍,藉以達到練習及記憶成語的目的。
"音高急急棒"是應用MIR實驗室的語音辨識核心做成,藉以達到練習音準及娛樂的效果。
"節拍追蹤"是應用MIR實驗室的語音辨識核心做成,藉以達到練習節拍及娛樂的效果。
"曲風分類"是應用MIR實驗室的語音辨識核心做成,藉以達到曲風辨識的效果。
原曲辨識系統
原曲辨識系統(audio fingerprinting, AFP)是一種方便快速且具抗噪性的音樂檢索方式,將使用者錄製的音樂片段作為搜尋目標,在音樂辨識系統中找到最符合使用者想要搜尋的歌曲資訊。 AFP利用雜湊表(hash table)的方式,使查詢過程更加迅速有效,但隨著音樂資料庫變得更加龐大,花費在辨識與搜尋上的時間成本與運算量也就隨之增大。為解決龐大資料所帶來的種種問題,本作品在CUDA平台上實作出音樂辨識的辨識核心,利用GPU的架構,將比對工作分散給數萬個CUDA執行緒(thread)處理,以達到加快辨識速率的目的。
"音高和速度調整"是應用MIR實驗室的語音辨識核心做成,藉以達到調整音高、速度的效果。
"AutoBeat Game(Touch mode)"介紹影片
"AutoBeat Game(Beat mode)"介紹影片
"Beat-off Drum Game"介紹影片
"Speech Scoring Game"介紹影片
"Stress Detection"