中文名稱 英文名稱 主持人 補助單位 計畫編號 補助金額 開始日期 結束日期 以語音辨識及合成為基礎的口說華語文電腦輔助學習系統 A Spoken Mandarin Learning System Based on Speech Recognition and Synthesis 張智星 國科會 95-3113-S-007-001- 1494000 2006/12/1 2007/11/30 聽寫系統之語者調適技術 Speaker Adaptation for an Embedded Dictation System 張智星 賽微科技 500000 2006/11/1 2007/10/31 音樂搜尋的加速與辨識率提升,及其在嵌入式系統的實作與應用(3/3) Speedup Mechansim and Performance Enhancement for Music Information Retrieval, with Applications to Embedded Systems 張智星 國科會 95-2221-E-007-220- 662000 2006/8/1 2007/7/31 PDA中文語音合成系統 Chinese TTS for PDA 張智星 微星科技 1000000 2006/7/1 2007/6/30 強健性關鍵詞語音辨識 Robust Keyword Spotting 張智星 微星科技 1000000 2006/7/1 2007/6/30 手持式裝置的口說中文輔助學習技術 Computer-assisted Spoken Chinese Learning Systems for Hand-held Device 張智星 資策會 500000 2006/3/1 2006/12/31 台灣數位有聲書網之建置與推廣 The Development and Promotion of the Web Portal for Digital Talking Books in Taiwan 張智星、唐傳義、陳宜欣 國科會 NSC 95-2422-H-007 -001 1368140 2006/3/1 2007/2/28
- 以語音辨識及合成為基礎的口說華語文電腦輔助學習系統
- 英文名稱: A Spoken Mandarin Learning System Based on Speech Recognition and Synthesis
- 計畫編號: 95-3113-S-007-001-
- 主持人: 張智星
- 補助單位: 國科會
- 計畫執行期間: 2006/12/1 to 2007/11/30
- 關鍵詞: 華語文教學、電腦輔助語言學習、電腦輔助發音訓練、語音辨識、語音合成
- 摘要簡介:
一種語言的學習,可以大略分成「聽、說、讀、寫」四大面向,其中「聽、說」是牽涉到「語音」的接收和產生,而「讀、寫」則是牽涉到「文字」的接收與產生。本計畫將整合本實驗室開發多年且實際可行的語音技術(包含語音辨識、語音合成、語音轉換等),來輔助學習者在華語文「聽、說」方面的學習,並與元智大學羅鳳珠老師所提出的「完整多元華語文網路學院」計畫合作,使用該計畫的國語日報社、僑教雙週刊、美洲華語課本、中國古典文學等相關素材,並與國語日報社合作,使用相關的教材,目標是產出一個實際可用的「電腦輔助口說華語文發音練習及評分系統」,具有下列三項功能:此三項功能,能夠讓使用者經由與電腦的反覆互動,進行發音練習、情境對話及聽力測驗,並經由電腦的回饋(包含鼓勵、說明、矯正),加強自己口說華語文的正確發音,達到學習華語文的「聽、說」的目標。
- 對使用者的單句華語發音進行評分,評分層級包含每一個注音、字、句,評分標準包含音色、韻律(流利度)、音調、音量等,並給予發音改進的建議。
- 使用語音辨識的技術和使用者進行各種情境對話。
- 以語音合成的方式,來讓使用者進行聽力測驗。
- 聽寫系統之語者調適技術
- 英文名稱: Speaker Adaptation for an Embedded Dictation System
- 計畫編號:
- 主持人: 張智星
- 補助單位: 賽微科技
- 計畫執行期間: 2006/11/1 to 2007/10/31
- 關鍵詞: 語者調適、語音辨識、聽寫系統
- 摘要簡介:
本計畫嘗試使用語者調適之各項技術,改進用於 SmartPhone 之聽寫系統,以便用於手機之語音轉簡訊的功能。
- 音樂搜尋的加速與辨識率提升,及其在嵌入式系統的實作與應用(3/3)
- 英文名稱: Speedup Mechansim and Performance Enhancement for Music Information Retrieval, with Applications to Embedded Systems
- 計畫編號: 95-2221-E-007-220-
- 主持人: 張智星
- 補助單位: 國科會
- 計畫執行期間: 2006/8/1 to 2007/7/31
- 關鍵詞: 音樂資訊檢索、多模式使用者介面、旋律辨識、音高追蹤、多媒體資料庫檢索、動態時間校正
- 摘要簡介:
由於本計畫主持人過去數年在國科會、教育部卓越計畫及清蔚科技之經費支援下,已經成功地建立了一個大型的音樂檢索系統,收集了超過兩萬首歌曲,讓使用者能以哼唱、語音與敲擊等不同方式來選取網際網路上的歌曲。為了能夠以快速的方法對大量資料進行有效的比對,我們除了在比對方法進行深入研究外,也架設了網格運算(Grid Computing)的伺服器平台,期望以平行及分散處理的方式,增進系統的可用性。在此種包含大量資料處理與比對的系統中,衍生了許多相關研究的研究議題,本研究計畫擬以三年時間,針對這些議題進行深入探討,這些議題及相關研究時程列出如下:
- 第一年: 以提高辨識率為主
- 音高追蹤(Pitch Tracking)的各種新方法的嘗試,包含 Combination of Classifiers、ACF/AMDF Map 等。
- 動態時間校正(Dynamic Time Warping)的改進與測試,包含 Local Path Constraints、Path Penalty、Flexible Starting Points 等。
- 第二年:以加快辨識速度為主
- 「兩階段式比對法」的探討與改良,包含以不同的方式進行兩階段比對,例如 Linear Scaling 加 DTW (Dynamic Time Warping)、
- 其他各種音樂檢索方法的探討與加速,包含如何精確地計算 DTW 的 Lower Bound、如何以 FastMap 的方法來將歌曲轉換到高為空間中的點等。
- 隱藏式馬可夫模型(Hidden Markov Models)的嘗試與改進
- 第三年:以嵌入式系統的移植為主
- 音高追蹤與檢索方法的精進與簡化
- 嵌入式系統的實作與應用
- PDA中文語音合成系統
- 英文名稱: Chinese TTS for PDA
- 計畫編號:
- 主持人: 張智星
- 補助單位: 微星科技
- 計畫執行期間: 2006/7/1 to 2007/6/30
- 關鍵詞: 語音合成、嵌入式系統之應用
- 摘要簡介:
完成PC/PDA平台之語音合成演算法及展示程式,用來做為機器人應答系統的基礎。
- 強健性關鍵詞語音辨識
- 英文名稱: Robust Keyword Spotting
- 計畫編號:
- 主持人: 張智星
- 補助單位: 微星科技
- 計畫執行期間: 2006/7/1 to 2007/6/30
- 關鍵詞: 強健性語音辨識、關鍵詞語音辨識
- 摘要簡介:
完成PC平台之強健性語音關鍵詞辨識演算法及展示程式,用來做為機器人聽覺系統的基礎。
- 手持式裝置的口說中文輔助學習技術
- 英文名稱: Computer-assisted Spoken Chinese Learning Systems for Hand-held Device
- 計畫編號:
- 主持人: 張智星
- 補助單位: 資策會
- 計畫執行期間: 2006/3/1 to 2006/12/31
- 關鍵詞: 中文語音辨識、電腦輔助發音訓練、電腦輔助口說語音學習
- 摘要簡介:
本計畫將採用中文語音辨識與語音評分的技術,開發一套電腦輔助口說中文的學習系統,以PDA/SmartPhone等手持式裝置為實現平台。使用者只要對麥克風講一句中文,此系統即可根據輸入語音資料,抓取音色(語音的內容)、聲調(國語四個聲調的分類)、韻律(每一個音的時間長短)、音量(每一個音的強度)等語音特徵,然後進行和目標語句或是語音模型的比對,根據其相似度來產生一個介於0和100之間的分數,並可進行錯誤分析,給予使用者發音改進的建議。雖然語音辨識的系統已有許多,但是多半還是在PC平台的應用,因此本計畫的最大挑戰,就是將語音辨識與評分,移植到計算能力較差的手持式裝置,這方面的技術門檻很高,目前市面上還沒有看到類似的產品。
- 台灣數位有聲書網之建置與推廣
- 英文名稱: The Development and Promotion of the Web Portal for Digital Talking Books in Taiwan
- 計畫編號: NSC 95-2422-H-007 -001
- 主持人: 張智星、唐傳義、陳宜欣
- 補助單位: 國科會
- 計畫執行期間: 2006/3/1 to 2007/2/28
- 關鍵詞: DAISY Book、 數位有聲書、語音辨識、語音合成、語音檢索
- 摘要簡介:
在國際上DAISY (Digital Accessible Information System) 有聲書在視障與學障的學習方面,已經成為不可或缺的工具,為了讓台灣視障讀者都可享有數位學習的優點,並充分享用DAISY 有聲書的特色,因此發展一套適合華人使用的環境刻不容緩。在93、94 年的數位典藏計畫中,我們已經完成了兩項相關系統:基於前述兩項系統的成功,我們希望在95 年度的計畫中,製作一個DAISY 有聲書網,並將DAISY 中文播放器移植到各種可用的平台(包含PC、PDA、SmartPhone),推廣給視障與學障使用,並研究解決智財權的問題,探討推廣至一般民眾,期望達成的具體效果有:
- 台灣視障用數位典藏之語音檢索系統:此系統可讓使用者直接經由聲控的方式,檢索有聲書圖書館內的藏書,並可以使用語音合成的方式,來唸出書名,以便使用者下載聆聽。(此系統已經實際上線,並用於清大盲友會,用戶已經達到283 人,下載次數累計7326次,94/11/28 止)。
- 具有聲控功能的DAISY 中文播放器:這是一個以Java 程式語音所編寫的DAISY 中文播放器,適用於一般PC,同時加上了語音檢索與語音合成的功能,是全球第一個中文DAISY播放器,也是全球目前唯一具有語音檢索與語音合成功能的DAISY 播放器。
- 提供視障者一個便捷取得有聲書的管道,以降低數位落差。
- 提供可於不同平台(包含PC、PDA、SmartPhone)使用的DAISY 中文播放器,並具有語音檢索與合成的功能。
- 利用網路科技整合國內各有聲製作單位,以節省整体社會成本。
- 利用標準化的數位有聲書製作規範,方便流通單位間的交流。
- 引進國際有聲書製作技術,方便讀者聽讀,以增進有聲書的流通。
- 利用數位製作、典藏與流通,符合國際趨勢,為國際有聲書交流舖路。
- 除了能夠具有語音檢索功能外,也能夠提供自然悅耳的語音合成效果,以降低有聲書的製作成本。