2006年研究計畫概況

張智星


簡表

中文名稱 英文名稱 主持人 補助單位 計畫編號 補助金額 開始日期 結束日期
以語音辨識及合成為基礎的口說華語文電腦輔助學習系統  A Spoken Mandarin Learning System Based on Speech Recognition and Synthesis  張智星  國科會  95-3113-S-007-001-  1494000  2006/12/1  2007/11/30 
聽寫系統之語者調適技術  Speaker Adaptation for an Embedded Dictation System  張智星  賽微科技    500000  2006/11/1  2007/10/31 
音樂搜尋的加速與辨識率提升,及其在嵌入式系統的實作與應用(3/3)  Speedup Mechansim and Performance Enhancement for Music Information Retrieval, with Applications to Embedded Systems  張智星  國科會  95-2221-E-007-220-  662000  2006/8/1  2007/7/31 
PDA中文語音合成系統  Chinese TTS for PDA  張智星  微星科技    1000000  2006/7/1  2007/6/30 
強健性關鍵詞語音辨識  Robust Keyword Spotting  張智星  微星科技    1000000  2006/7/1  2007/6/30 
手持式裝置的口說中文輔助學習技術  Computer-assisted Spoken Chinese Learning Systems for Hand-held Device  張智星  資策會    500000  2006/3/1  2006/12/31 
台灣數位有聲書網之建置與推廣  The Development and Promotion of the Web Portal for Digital Talking Books in Taiwan  張智星、唐傳義、陳宜欣  國科會  NSC 95-2422-H-007 -001  1368140  2006/3/1  2007/2/28 

詳細資料

  1. 以語音辨識及合成為基礎的口說華語文電腦輔助學習系統

    • 英文名稱: A Spoken Mandarin Learning System Based on Speech Recognition and Synthesis
    • 計畫編號: 95-3113-S-007-001-
    • 主持人: 張智星
    • 補助單位: 國科會
    • 計畫執行期間: 2006/12/1 to 2007/11/30
    • 關鍵詞: 華語文教學、電腦輔助語言學習、電腦輔助發音訓練、語音辨識、語音合成
    • 摘要簡介:
      一種語言的學習,可以大略分成「聽、說、讀、寫」四大面向,其中「聽、說」是牽涉到「語音」的接收和產生,而「讀、寫」則是牽涉到「文字」的接收與產生。本計畫將整合本實驗室開發多年且實際可行的語音技術(包含語音辨識、語音合成、語音轉換等),來輔助學習者在華語文「聽、說」方面的學習,並與元智大學羅鳳珠老師所提出的「完整多元華語文網路學院」計畫合作,使用該計畫的國語日報社、僑教雙週刊、美洲華語課本、中國古典文學等相關素材,並與國語日報社合作,使用相關的教材,目標是產出一個實際可用的「電腦輔助口說華語文發音練習及評分系統」,具有下列三項功能:
      1. 對使用者的單句華語發音進行評分,評分層級包含每一個注音、字、句,評分標準包含音色、韻律(流利度)、音調、音量等,並給予發音改進的建議。
      2. 使用語音辨識的技術和使用者進行各種情境對話。
      3. 以語音合成的方式,來讓使用者進行聽力測驗。
      此三項功能,能夠讓使用者經由與電腦的反覆互動,進行發音練習、情境對話及聽力測驗,並經由電腦的回饋(包含鼓勵、說明、矯正),加強自己口說華語文的正確發音,達到學習華語文的「聽、說」的目標。

  2. 聽寫系統之語者調適技術

    • 英文名稱: Speaker Adaptation for an Embedded Dictation System
    • 計畫編號:
    • 主持人: 張智星
    • 補助單位: 賽微科技
    • 計畫執行期間: 2006/11/1 to 2007/10/31
    • 關鍵詞: 語者調適、語音辨識、聽寫系統
    • 摘要簡介:
      本計畫嘗試使用語者調適之各項技術,改進用於 SmartPhone 之聽寫系統,以便用於手機之語音轉簡訊的功能。

  3. 音樂搜尋的加速與辨識率提升,及其在嵌入式系統的實作與應用(3/3)

    • 英文名稱: Speedup Mechansim and Performance Enhancement for Music Information Retrieval, with Applications to Embedded Systems
    • 計畫編號: 95-2221-E-007-220-
    • 主持人: 張智星
    • 補助單位: 國科會
    • 計畫執行期間: 2006/8/1 to 2007/7/31
    • 關鍵詞: 音樂資訊檢索、多模式使用者介面、旋律辨識、音高追蹤、多媒體資料庫檢索、動態時間校正
    • 摘要簡介:
      由於本計畫主持人過去數年在國科會、教育部卓越計畫及清蔚科技之經費支援下,已經成功地建立了一個大型的音樂檢索系統,收集了超過兩萬首歌曲,讓使用者能以哼唱、語音與敲擊等不同方式來選取網際網路上的歌曲。為了能夠以快速的方法對大量資料進行有效的比對,我們除了在比對方法進行深入研究外,也架設了網格運算(Grid Computing)的伺服器平台,期望以平行及分散處理的方式,增進系統的可用性。在此種包含大量資料處理與比對的系統中,衍生了許多相關研究的研究議題,本研究計畫擬以三年時間,針對這些議題進行深入探討,這些議題及相關研究時程列出如下:
      1. 第一年: 以提高辨識率為主
        1. 音高追蹤(Pitch Tracking)的各種新方法的嘗試,包含 Combination of Classifiers、ACF/AMDF Map 等。
        2. 動態時間校正(Dynamic Time Warping)的改進與測試,包含 Local Path Constraints、Path Penalty、Flexible Starting Points 等。
      2. 第二年:以加快辨識速度為主
        1. 「兩階段式比對法」的探討與改良,包含以不同的方式進行兩階段比對,例如 Linear Scaling 加 DTW (Dynamic Time Warping)、
        2. 其他各種音樂檢索方法的探討與加速,包含如何精確地計算 DTW 的 Lower Bound、如何以 FastMap 的方法來將歌曲轉換到高為空間中的點等。
        3. 隱藏式馬可夫模型(Hidden Markov Models)的嘗試與改進
      3. 第三年:以嵌入式系統的移植為主
        1. 音高追蹤與檢索方法的精進與簡化
        2. 嵌入式系統的實作與應用

  4. PDA中文語音合成系統

    • 英文名稱: Chinese TTS for PDA
    • 計畫編號:
    • 主持人: 張智星
    • 補助單位: 微星科技
    • 計畫執行期間: 2006/7/1 to 2007/6/30
    • 關鍵詞: 語音合成、嵌入式系統之應用
    • 摘要簡介:
      完成PC/PDA平台之語音合成演算法及展示程式,用來做為機器人應答系統的基礎。

  5. 強健性關鍵詞語音辨識

    • 英文名稱: Robust Keyword Spotting
    • 計畫編號:
    • 主持人: 張智星
    • 補助單位: 微星科技
    • 計畫執行期間: 2006/7/1 to 2007/6/30
    • 關鍵詞: 強健性語音辨識、關鍵詞語音辨識
    • 摘要簡介:
      完成PC平台之強健性語音關鍵詞辨識演算法及展示程式,用來做為機器人聽覺系統的基礎。

  6. 手持式裝置的口說中文輔助學習技術

    • 英文名稱: Computer-assisted Spoken Chinese Learning Systems for Hand-held Device
    • 計畫編號:
    • 主持人: 張智星
    • 補助單位: 資策會
    • 計畫執行期間: 2006/3/1 to 2006/12/31
    • 關鍵詞: 中文語音辨識、電腦輔助發音訓練、電腦輔助口說語音學習
    • 摘要簡介:
      本計畫將採用中文語音辨識與語音評分的技術,開發一套電腦輔助口說中文的學習系統,以PDA/SmartPhone等手持式裝置為實現平台。使用者只要對麥克風講一句中文,此系統即可根據輸入語音資料,抓取音色(語音的內容)、聲調(國語四個聲調的分類)、韻律(每一個音的時間長短)、音量(每一個音的強度)等語音特徵,然後進行和目標語句或是語音模型的比對,根據其相似度來產生一個介於0和100之間的分數,並可進行錯誤分析,給予使用者發音改進的建議。雖然語音辨識的系統已有許多,但是多半還是在PC平台的應用,因此本計畫的最大挑戰,就是將語音辨識與評分,移植到計算能力較差的手持式裝置,這方面的技術門檻很高,目前市面上還沒有看到類似的產品。

  7. 台灣數位有聲書網之建置與推廣

    • 英文名稱: The Development and Promotion of the Web Portal for Digital Talking Books in Taiwan
    • 計畫編號: NSC 95-2422-H-007 -001
    • 主持人: 張智星、唐傳義、陳宜欣
    • 補助單位: 國科會
    • 計畫執行期間: 2006/3/1 to 2007/2/28
    • 關鍵詞: DAISY Book、 數位有聲書、語音辨識、語音合成、語音檢索
    • 摘要簡介:
      在國際上DAISY (Digital Accessible Information System) 有聲書在視障與學障的學習方面,已經成為不可或缺的工具,為了讓台灣視障讀者都可享有數位學習的優點,並充分享用DAISY 有聲書的特色,因此發展一套適合華人使用的環境刻不容緩。在93、94 年的數位典藏計畫中,我們已經完成了兩項相關系統:
      1. 台灣視障用數位典藏之語音檢索系統:此系統可讓使用者直接經由聲控的方式,檢索有聲書圖書館內的藏書,並可以使用語音合成的方式,來唸出書名,以便使用者下載聆聽。(此系統已經實際上線,並用於清大盲友會,用戶已經達到283 人,下載次數累計7326次,94/11/28 止)。
      2. 具有聲控功能的DAISY 中文播放器:這是一個以Java 程式語音所編寫的DAISY 中文播放器,適用於一般PC,同時加上了語音檢索與語音合成的功能,是全球第一個中文DAISY播放器,也是全球目前唯一具有語音檢索與語音合成功能的DAISY 播放器。
      基於前述兩項系統的成功,我們希望在95 年度的計畫中,製作一個DAISY 有聲書網,並將DAISY 中文播放器移植到各種可用的平台(包含PC、PDA、SmartPhone),推廣給視障與學障使用,並研究解決智財權的問題,探討推廣至一般民眾,期望達成的具體效果有:
      1. 提供視障者一個便捷取得有聲書的管道,以降低數位落差。
      2. 提供可於不同平台(包含PC、PDA、SmartPhone)使用的DAISY 中文播放器,並具有語音檢索與合成的功能。
      3. 利用網路科技整合國內各有聲製作單位,以節省整体社會成本。
      4. 利用標準化的數位有聲書製作規範,方便流通單位間的交流。
      5. 引進國際有聲書製作技術,方便讀者聽讀,以增進有聲書的流通。
      6. 利用數位製作、典藏與流通,符合國際趨勢,為國際有聲書交流舖路。
      7. 除了能夠具有語音檢索功能外,也能夠提供自然悅耳的語音合成效果,以降低有聲書的製作成本。