2006年研究計畫概況

張智星

簡表

中文名稱英文名稱主持人補助單位計畫編號補助金額開始日期結束日期

以語音辨識及合成為基礎的口說華語文電腦輔助學習系統 A Spoken Mandarin Learning System Based on Speech Recognition and Synthesis 張智星國科會 95-3113-S-007-001- 1494000 2006/12/1 2007/11/30

聽寫系統之語者調適技術 Speaker Adaptation for an Embedded Dictation System 張智星賽微科技 500000 2006/11/1 2007/10/31

音樂搜尋的加速與辨識率提升，及其在嵌入式系統的實作與應用（3/3） Speedup Mechansim and Performance Enhancement for Music Information Retrieval, with Applications to Embedded Systems 張智星國科會 95-2221-E-007-220- 662000 2006/8/1 2007/7/31

PDA中文語音合成系統 Chinese TTS for PDA 張智星微星科技 1000000 2006/7/1 2007/6/30

強健性關鍵詞語音辨識 Robust Keyword Spotting 張智星微星科技 1000000 2006/7/1 2007/6/30

手持式裝置的口說中文輔助學習技術 Computer-assisted Spoken Chinese Learning Systems for Hand-held Device 張智星資策會 500000 2006/3/1 2006/12/31

台灣數位有聲書網之建置與推廣 The Development and Promotion of the Web Portal for Digital Talking Books in Taiwan 張智星、唐傳義、陳宜欣國科會 NSC 95-2422-H-007 -001 1368140 2006/3/1 2007/2/28

中文名稱	英文名稱	主持人	補助單位	計畫編號	補助金額	開始日期	結束日期
以語音辨識及合成為基礎的口說華語文電腦輔助學習系統	A Spoken Mandarin Learning System Based on Speech Recognition and Synthesis	張智星	國科會	95-3113-S-007-001-	1494000	2006/12/1	2007/11/30
聽寫系統之語者調適技術	Speaker Adaptation for an Embedded Dictation System	張智星	賽微科技		500000	2006/11/1	2007/10/31
音樂搜尋的加速與辨識率提升，及其在嵌入式系統的實作與應用（3/3）	Speedup Mechansim and Performance Enhancement for Music Information Retrieval, with Applications to Embedded Systems	張智星	國科會	95-2221-E-007-220-	662000	2006/8/1	2007/7/31
PDA中文語音合成系統	Chinese TTS for PDA	張智星	微星科技		1000000	2006/7/1	2007/6/30
強健性關鍵詞語音辨識	Robust Keyword Spotting	張智星	微星科技		1000000	2006/7/1	2007/6/30
手持式裝置的口說中文輔助學習技術	Computer-assisted Spoken Chinese Learning Systems for Hand-held Device	張智星	資策會		500000	2006/3/1	2006/12/31
台灣數位有聲書網之建置與推廣	The Development and Promotion of the Web Portal for Digital Talking Books in Taiwan	張智星、唐傳義、陳宜欣	國科會	NSC 95-2422-H-007 -001	1368140	2006/3/1	2007/2/28

詳細資料

以語音辨識及合成為基礎的口說華語文電腦輔助學習系統

英文名稱: A Spoken Mandarin Learning System Based on Speech Recognition and Synthesis
計畫編號: 95-3113-S-007-001-
主持人: 張智星
補助單位: 國科會
計畫執行期間: 2006/12/1 to 2007/11/30
關鍵詞: 華語文教學、電腦輔助語言學習、電腦輔助發音訓練、語音辨識、語音合成
摘要簡介:
一種語言的學習，可以大略分成「聽、說、讀、寫」四大面向，其中「聽、說」是牽涉到「語音」的接收和產生，而「讀、寫」則是牽涉到「文字」的接收與產生。本計畫將整合本實驗室開發多年且實際可行的語音技術（包含語音辨識、語音合成、語音轉換等），來輔助學習者在華語文「聽、說」方面的學習，並與元智大學羅鳳珠老師所提出的「完整多元華語文網路學院」計畫合作，使用該計畫的國語日報社、僑教雙週刊、美洲華語課本、中國古典文學等相關素材，並與國語日報社合作，使用相關的教材，目標是產出一個實際可用的「電腦輔助口說華語文發音練習及評分系統」，具有下列三項功能：

對使用者的單句華語發音進行評分，評分層級包含每一個注音、字、句，評分標準包含音色、韻律（流利度）、音調、音量等，並給予發音改進的建議。
使用語音辨識的技術和使用者進行各種情境對話。
以語音合成的方式，來讓使用者進行聽力測驗。
此三項功能，能夠讓使用者經由與電腦的反覆互動，進行發音練習、情境對話及聽力測驗，並經由電腦的回饋（包含鼓勵、說明、矯正），加強自己口說華語文的正確發音，達到學習華語文的「聽、說」的目標。

聽寫系統之語者調適技術

英文名稱: Speaker Adaptation for an Embedded Dictation System
計畫編號:
主持人: 張智星
補助單位: 賽微科技
計畫執行期間: 2006/11/1 to 2007/10/31
關鍵詞: 語者調適、語音辨識、聽寫系統
摘要簡介:
本計畫嘗試使用語者調適之各項技術，改進用於 SmartPhone 之聽寫系統，以便用於手機之語音轉簡訊的功能。

音樂搜尋的加速與辨識率提升，及其在嵌入式系統的實作與應用（3/3）

英文名稱: Speedup Mechansim and Performance Enhancement for Music Information Retrieval, with Applications to Embedded Systems
計畫編號: 95-2221-E-007-220-
主持人: 張智星
補助單位: 國科會
計畫執行期間: 2006/8/1 to 2007/7/31
關鍵詞: 音樂資訊檢索、多模式使用者介面、旋律辨識、音高追蹤、多媒體資料庫檢索、動態時間校正
摘要簡介:
由於本計畫主持人過去數年在國科會、教育部卓越計畫及清蔚科技之經費支援下，已經成功地建立了一個大型的音樂檢索系統，收集了超過兩萬首歌曲，讓使用者能以哼唱、語音與敲擊等不同方式來選取網際網路上的歌曲。為了能夠以快速的方法對大量資料進行有效的比對，我們除了在比對方法進行深入研究外，也架設了網格運算（Grid Computing）的伺服器平台，期望以平行及分散處理的方式，增進系統的可用性。在此種包含大量資料處理與比對的系統中，衍生了許多相關研究的研究議題，本研究計畫擬以三年時間，針對這些議題進行深入探討，這些議題及相關研究時程列出如下：

第一年：以提高辨識率為主

音高追蹤（Pitch Tracking）的各種新方法的嘗試，包含 Combination of Classifiers、ACF/AMDF Map 等。
動態時間校正（Dynamic Time Warping）的改進與測試，包含 Local Path Constraints、Path Penalty、Flexible Starting Points 等。

第二年：以加快辨識速度為主

「兩階段式比對法」的探討與改良，包含以不同的方式進行兩階段比對，例如 Linear Scaling 加 DTW (Dynamic Time Warping)、
其他各種音樂檢索方法的探討與加速，包含如何精確地計算 DTW 的 Lower Bound、如何以 FastMap 的方法來將歌曲轉換到高為空間中的點等。
隱藏式馬可夫模型（Hidden Markov Models）的嘗試與改進

第三年：以嵌入式系統的移植為主

音高追蹤與檢索方法的精進與簡化
嵌入式系統的實作與應用

PDA中文語音合成系統

英文名稱: Chinese TTS for PDA
計畫編號:
主持人: 張智星
補助單位: 微星科技
計畫執行期間: 2006/7/1 to 2007/6/30
關鍵詞: 語音合成、嵌入式系統之應用
摘要簡介:
完成PC/PDA平台之語音合成演算法及展示程式，用來做為機器人應答系統的基礎。

強健性關鍵詞語音辨識

英文名稱: Robust Keyword Spotting
計畫編號:
主持人: 張智星
補助單位: 微星科技
計畫執行期間: 2006/7/1 to 2007/6/30
關鍵詞: 強健性語音辨識、關鍵詞語音辨識
摘要簡介:
完成PC平台之強健性語音關鍵詞辨識演算法及展示程式，用來做為機器人聽覺系統的基礎。

手持式裝置的口說中文輔助學習技術

英文名稱: Computer-assisted Spoken Chinese Learning Systems for Hand-held Device
計畫編號:
主持人: 張智星
補助單位: 資策會
計畫執行期間: 2006/3/1 to 2006/12/31
關鍵詞: 中文語音辨識、電腦輔助發音訓練、電腦輔助口說語音學習
摘要簡介:
本計畫將採用中文語音辨識與語音評分的技術，開發一套電腦輔助口說中文的學習系統，以PDA/SmartPhone等手持式裝置為實現平台。使用者只要對麥克風講一句中文，此系統即可根據輸入語音資料，抓取音色（語音的內容）、聲調（國語四個聲調的分類）、韻律（每一個音的時間長短）、音量（每一個音的強度）等語音特徵，然後進行和目標語句或是語音模型的比對，根據其相似度來產生一個介於0和100之間的分數，並可進行錯誤分析，給予使用者發音改進的建議。雖然語音辨識的系統已有許多，但是多半還是在PC平台的應用，因此本計畫的最大挑戰，就是將語音辨識與評分，移植到計算能力較差的手持式裝置，這方面的技術門檻很高，目前市面上還沒有看到類似的產品。

台灣數位有聲書網之建置與推廣

英文名稱: The Development and Promotion of the Web Portal for Digital Talking Books in Taiwan
計畫編號: NSC 95-2422-H-007 -001
主持人: 張智星、唐傳義、陳宜欣
補助單位: 國科會
計畫執行期間: 2006/3/1 to 2007/2/28
關鍵詞: DAISY Book、數位有聲書、語音辨識、語音合成、語音檢索
摘要簡介:
在國際上DAISY (Digital Accessible Information System) 有聲書在視障與學障的學習方面，已經成為不可或缺的工具，為了讓台灣視障讀者都可享有數位學習的優點，並充分享用DAISY 有聲書的特色，因此發展一套適合華人使用的環境刻不容緩。在93、94 年的數位典藏計畫中，我們已經完成了兩項相關系統：

台灣視障用數位典藏之語音檢索系統：此系統可讓使用者直接經由聲控的方式，檢索有聲書圖書館內的藏書，並可以使用語音合成的方式，來唸出書名，以便使用者下載聆聽。（此系統已經實際上線，並用於清大盲友會，用戶已經達到283 人，下載次數累計7326次，94/11/28 止）。
具有聲控功能的DAISY 中文播放器：這是一個以Java 程式語音所編寫的DAISY 中文播放器，適用於一般PC，同時加上了語音檢索與語音合成的功能，是全球第一個中文DAISY播放器，也是全球目前唯一具有語音檢索與語音合成功能的DAISY 播放器。
基於前述兩項系統的成功，我們希望在95 年度的計畫中，製作一個DAISY 有聲書網，並將DAISY 中文播放器移植到各種可用的平台（包含PC、PDA、SmartPhone），推廣給視障與學障使用，並研究解決智財權的問題，探討推廣至一般民眾，期望達成的具體效果有：

提供視障者一個便捷取得有聲書的管道，以降低數位落差。
提供可於不同平台（包含PC、PDA、SmartPhone）使用的DAISY 中文播放器，並具有語音檢索與合成的功能。
利用網路科技整合國內各有聲製作單位，以節省整体社會成本。
利用標準化的數位有聲書製作規範，方便流通單位間的交流。
引進國際有聲書製作技術，方便讀者聽讀，以增進有聲書的流通。
利用數位製作、典藏與流通，符合國際趨勢，為國際有聲書交流舖路。
除了能夠具有語音檢索功能外，也能夠提供自然悅耳的語音合成效果，以降低有聲書的製作成本。