2009年研究計畫概況

張智星


簡表

中文名稱 英文名稱 主持人 補助單位 計畫編號 補助金額 開始日期 結束日期
適用於嵌入式系統的電腦輔助口說華語發音練習系統    張智星  國科會 & 鈦思科技    403000  2009/11/1  2010/10/31 
用於音訊音樂的計算聽覺場景分析(3/3)  Computational Auditory Scene Analysis for Audio Music  張智星  國科會  NSC 96-2628-E-007 -141 -MY3  521000  2009/8/1  2010/7/31 
台灣自主處理器Android平台深耕計畫    李政崑  經濟部學研計畫    800000  2009/6/1  2010/5/31 
唱作俱佳有聲書電子公仔計畫    金仲達  經濟部學研計畫    800000  2009/6/1  2010/5/31 
以語者辨識為基礎之智慧型人機介面  Intelligent Man-machine Interface based on Speaker Recognition  張智星  資策會    600000  2009/3/1  2009/12/31 
從語音對話進行情緒辨識  Emotion Detection from Spoken Dialog  張智星  資策會    800000  2009/3/1  2009/12/31 
嵌入式多核心編譯器與應用軟體平台研發計畫    李政崑  清華大學    1940000  2009/3/1  2010/12/31 

詳細資料

  1. 適用於嵌入式系統的電腦輔助口說華語發音練習系統

    • 英文名稱:
    • 計畫編號:
    • 主持人: 張智星
    • 補助單位: 國科會 & 鈦思科技
    • 計畫執行期間: 2009/11/1 to 2010/10/31
    • 關鍵詞:
    • 摘要簡介:

  2. 用於音訊音樂的計算聽覺場景分析(3/3)

    • 英文名稱: Computational Auditory Scene Analysis for Audio Music
    • 計畫編號: NSC 96-2628-E-007 -141 -MY3
    • 主持人: 張智星
    • 補助單位: 國科會
    • 計畫執行期間: 2009/8/1 to 2010/7/31
    • 關鍵詞: Computational Auditory Scene Analysis, Music Information Retrieval, Audio Music Analysis
    • 摘要簡介:
      所謂「計算聽覺場景分析」(Computational Auditory Scene Analysis,簡稱CASA) 的目標,就是要將單聲道的聲音(可能由多個音源所產生),經由電腦的自動計算,採 用各種方法(例如快速傅立葉轉換、動態規劃、機器學習等),並應用我們對音源所具 有的各種知識,來抽取出這些音源的聲音,以便進行下一步的處理。自從Bregman 在 1990 年提出Auditory Scene Analysis 的概念後,相關的研究持續不斷,但都注重在 一般語音的處理,直到近幾年來,音樂經由網際網路大量傳播,相關的分析與檢索也 越來越重要,因此CASA 在音訊音樂(Audio Music)方面的研究和應用也在這幾年開 始萌芽。本計畫將整合本實驗室開發多年的音訊處理技術(包含旋律辨識、語音辨識、 語音與歌聲合成、強韌式音高追蹤、語音轉換等),經由CASA 的架構來應用於音訊音 樂,希望建立有效的分析模式與方法,能夠對音訊音樂進行分析與處理。計畫的主要 目標,是希望針對一般流行音樂,做到下列幾點:
      1. 對音訊音樂進行主旋律的音高追蹤。
      2. 判斷歌聲存在的位置。
      3. 由音訊音樂抽取單音歌聲。
      4. 多重音高追蹤。
      5. 抽取其他單音樂器的聲音(例如鼓聲)。
      經由這些分析,我們可以對音訊音樂進行更精密的分類與檢索,相關的應用則有:
      1. 音訊音樂的自動分類與檢索
      2. 音訊音樂的哼唱檢索
      3. 音訊音樂的節拍追蹤
      4. 音訊音樂的歌詞同步顯示
      5. 音訊音樂的情緒內容分析

  3. 台灣自主處理器Android平台深耕計畫

    • 英文名稱:
    • 計畫編號:
    • 主持人: 李政崑
    • 補助單位: 經濟部學研計畫
    • 計畫執行期間: 2009/6/1 to 2010/5/31
    • 關鍵詞:
    • 摘要簡介:

  4. 唱作俱佳有聲書電子公仔計畫

    • 英文名稱:
    • 計畫編號:
    • 主持人: 金仲達
    • 補助單位: 經濟部學研計畫
    • 計畫執行期間: 2009/6/1 to 2010/5/31
    • 關鍵詞:
    • 摘要簡介:

  5. 以語者辨識為基礎之智慧型人機介面

    • 英文名稱: Intelligent Man-machine Interface based on Speaker Recognition
    • 計畫編號:
    • 主持人: 張智星
    • 補助單位: 資策會
    • 計畫執行期間: 2009/3/1 to 2009/12/31
    • 關鍵詞: 語者辨識、語音訊號處理、生物認證、智慧型人機介面
    • 摘要簡介:
      使用人的聲音來進行生物認證,是一項非常有吸引力的技術發展方向,因為聲音的擷取非常容易,不需要特殊的硬體,同時也不會造成使用者的擔心害怕,侵入性較低。但是聲音也容易受到外界雜訊的干擾,同時也容易受到說話者本身的身體情況所影響,這是此技術的缺點。由於電腦運算速度的突飛猛進,因此語者辨識的發展也漸漸突破這些門檻,逐漸變成實際可用的技術。本計畫將開發一套文本相關的語者辨識系統,以便實證此技術的可用度與成熟度,並設法克服語者辨識在實用上會碰到的問題,以便優化整體系統,達到可實際進行商業用途的目標。

  6. 從語音對話進行情緒辨識

    • 英文名稱: Emotion Detection from Spoken Dialog
    • 計畫編號:
    • 主持人: 張智星
    • 補助單位: 資策會
    • 計畫執行期間: 2009/3/1 to 2009/12/31
    • 關鍵詞: 語音訊號處理、樣式辨認、關鍵詞擷取
    • 摘要簡介:
      一個人的情緒外在表現,主要經由肢體動作、臉部表情、口說語言等三種方式來表現,而其中牽涉到的資料量(指可以直接送入電腦分析的資料),又以口說語言為最少(只有一維的音訊資料),但口說語言卻可以表達出很細膩的情緒,因此在情緒辨識的研究方面,語音對話就變成一個非常重要的研究線索,這也是近幾年來非常熱門的研究題材。

      在應用方面,以「語音進行情緒辨識」也有不同的面像和著力點,例如,在互動電子寵物的應用上,我們可以經由主人的語音來偵測其情緒,並進而推論最佳的回話與互動方式,以便提供體貼入微的服務,讓主人有貼心的感覺。在商業應用方面,我們可以經由客戶在客服專線的語音對話來判知其情緒,並進而瞭解客服人員在安撫客戶的功力及表現。此外,在一般手機通話的應用,我們也可以開通「心心相映指數」服務,以語音來判斷兩人對話的愉悅度。

      除了語音之外,互動電子寵物也能夠經由攝影機輕易地取得到主人的臉部表情和動作等,因此才能夠更進一步地「察言觀色」。經由這種多模式的情感計算(Multi-modal Affective Computing),才能夠更準確地判斷一個人的情緒狀態,這也是本計畫的整合研究重點。

  7. 嵌入式多核心編譯器與應用軟體平台研發計畫

    • 英文名稱:
    • 計畫編號:
    • 主持人: 李政崑
    • 補助單位: 清華大學
    • 計畫執行期間: 2009/3/1 to 2010/12/31
    • 關鍵詞: 嵌入式系統
    • 摘要簡介: