2005年研究計畫概況

張智星


簡表

中文名稱 英文名稱 主持人 補助單位 計畫編號 補助金額 開始日期 結束日期
音樂搜尋的加速與辨識率提升,及其在嵌入式系統的實作與應用(2/3)  Speedup Mechansim and Performance Enhancement for Music Information Retrieval, with Applications to Embedded Systems  張智星  國科會  NSC 93-2213-E-007-058  695000  2005/8/1  2006/7/31 
利用台灣現有視障用數位典藏資料製作盲人電子書-發展DAISY中文播放器及相關之語音辨識與合成功能(子計畫二)  On the Development of DAISY Chinese Player with Speech-enabled Interface Based on Speech Recognition and Synthesis  張智星  國科會  NSC 94-2422-H-007-005  919600  2005/3/1  2006/2/28 

詳細資料

  1. 音樂搜尋的加速與辨識率提升,及其在嵌入式系統的實作與應用(2/3)

    • 英文名稱: Speedup Mechansim and Performance Enhancement for Music Information Retrieval, with Applications to Embedded Systems
    • 計畫編號: NSC 93-2213-E-007-058
    • 主持人: 張智星
    • 補助單位: 國科會
    • 計畫執行期間: 2005/8/1 to 2006/7/31
    • 關鍵詞: 音樂資訊檢索、多模式使用者介面、旋律辨識、音高追蹤、多媒體資料庫檢索、動態時間校正
    • 摘要簡介:
      由於本計畫主持人過去數年在國科會、教育部卓越計畫及清蔚科技之經費支援下,已經成功地建立了一個大型的音樂檢索系統,收集了超過兩萬首歌曲,讓使用者能以哼唱、語音與敲擊等不同方式來選取網際網路上的歌曲。為了能夠以快速的方法對大量資料進行有效的比對,我們除了在比對方法進行深入研究外,也架設了網格運算(Grid Computing)的伺服器平台,期望以平行及分散處理的方式,增進系統的可用性。在此種包含大量資料處理與比對的系統中,衍生了許多相關研究的研究議題,本研究計畫擬以三年時間,針對這些議題進行深入探討,這些議題及相關研究時程列出如下:
      1. 第一年: 以提高辨識率為主
        1. 音高追蹤(Pitch Tracking)的各種新方法的嘗試,包含 Combination of Classifiers、ACF/AMDF Map 等。
        2. 動態時間校正(Dynamic Time Warping)的改進與測試,包含 Local Path Constraints、Path Penalty、Flexible Starting Points 等。
      2. 第二年:以加快辨識速度為主
        1. 「兩階段式比對法」的探討與改良,包含以不同的方式進行兩階段比對,例如 Linear Scaling 加 DTW (Dynamic Time Warping)、
        2. 其他各種音樂檢索方法的探討與加速,包含如何精確地計算 DTW 的 Lower Bound、如何以 FastMap 的方法來將歌曲轉換到高為空間中的點等。
        3. 隱藏式馬可夫模型(Hidden Markov Models)的嘗試與改進
      3. 第三年:以嵌入式系統的移植為主
        1. 音高追蹤與檢索方法的精進與簡化
        2. 嵌入式系統的實作與應用

  2. 利用台灣現有視障用數位典藏資料製作盲人電子書-發展DAISY中文播放器及相關之語音辨識與合成功能(子計畫二)

    • 英文名稱: On the Development of DAISY Chinese Player with Speech-enabled Interface Based on Speech Recognition and Synthesis
    • 計畫編號: NSC 94-2422-H-007-005
    • 主持人: 張智星
    • 補助單位: 國科會
    • 計畫執行期間: 2005/3/1 to 2006/2/28
    • 關鍵詞: DAISY, speech recognition, speech synthesis
    • 摘要簡介:
      本研究計畫的主要目標,在建立一個中文化的 DAISY 軟體播放器,以服務台灣地區的視障同胞,並在此軟體加上語音辨識與合成功能,以延伸原先 DAISY 軟體播放器的功能,提供盲胞以語音來操控軟體或進行全文檢索,並將檢索所得的資訊以與音的方式來呈現。目前提供公開下載的 DAISY 軟體播放器大概有十多種,但是都是國外發展的系統,沒有中文化的介面,我們會參考現存的播放器,發展出中文化的系統,以符合台灣地區的需求。另外,我們也會將語音合成與語音辨識加入此系統,讓使用者可以使用語音命令來搜尋 DAISY 內容,若只找到文字內容,系統也可以使用語音合成來播放,延伸原先的 DAISY 播放器的功能,讓盲胞及視障朋友更易於使用此系統,降低因為身體障礙所可能造成的數位落差。