2008年研究計畫概況

張智星

簡表

中文名稱英文名稱主持人補助單位計畫編號補助金額開始日期結束日期

嵌入式異多核心系統技術研發3年計畫(第2期) Embedded heterogeneous multi-core system technology research and development 3-year plan 張智星經濟部科專計畫 600000 2008/11/1 2010/10/31

Intel聯合研發計畫 Intel Joint Research and Development Program 張智星 Intel 600000 2008/8/1 2009/7/31

用於音訊音樂的計算聽覺場景分析（2/3） Computational Auditory Scene Analysis for Audio Music 張智星國科會 NSC 96-2628-E-007 -141 -MY3 521000 2008/8/1 2009/7/31

聯發科嵌入式系統技術研究及人才培育計畫（第四子計畫：視訊及語音應用開發） MediaTek Embedded System Technology Research and Talent Cultivation Program (Fourth Sub-Program: Video and Voice Application Development) 張智星聯發科 600000 2008/8/1 2009/7/31

Tri-tone的連續聲調塑模及偵錯技術 Tri-tone Based Continuous Tone Modeling and Analysis 張智星資策會 600000 2008/3/1 2008/11/30

語音辨識系統開發 Speech Recognition System Development 張智星中科院 800000 2008/2/1 2008/11/30

中文名稱	英文名稱	主持人	補助單位	計畫編號	補助金額	開始日期	結束日期
嵌入式異多核心系統技術研發3年計畫(第2期)	Embedded heterogeneous multi-core system technology research and development 3-year plan	張智星	經濟部科專計畫		600000	2008/11/1	2010/10/31
Intel聯合研發計畫	Intel Joint Research and Development Program	張智星	Intel		600000	2008/8/1	2009/7/31
用於音訊音樂的計算聽覺場景分析（2/3）	Computational Auditory Scene Analysis for Audio Music	張智星	國科會	NSC 96-2628-E-007 -141 -MY3	521000	2008/8/1	2009/7/31
聯發科嵌入式系統技術研究及人才培育計畫（第四子計畫：視訊及語音應用開發）	MediaTek Embedded System Technology Research and Talent Cultivation Program (Fourth Sub-Program: Video and Voice Application Development)	張智星	聯發科		600000	2008/8/1	2009/7/31
Tri-tone的連續聲調塑模及偵錯技術	Tri-tone Based Continuous Tone Modeling and Analysis	張智星	資策會		600000	2008/3/1	2008/11/30
語音辨識系統開發	Speech Recognition System Development	張智星	中科院		800000	2008/2/1	2008/11/30

詳細資料

嵌入式異多核心系統技術研發3年計畫(第2期)

英文名稱: Embedded heterogeneous multi-core system technology research and development 3-year plan
計畫編號:
主持人: 張智星
補助單位: 經濟部科專計畫
計畫執行期間: 2008/11/1 to 2010/10/31
關鍵詞:
摘要簡介:

Intel聯合研發計畫

英文名稱: Intel Joint Research and Development Program
計畫編號:
主持人: 張智星
補助單位: Intel
計畫執行期間: 2008/8/1 to 2009/7/31
關鍵詞:
摘要簡介:
In this subproject, we shall devote to the deployment of speech technology for innovative and user-aware and location-aware MID applications, including the following potential items:

Voice commands for MID applications
Using simple voice commands for invoking MID applications is likely to be a feasible way of enable speech technology for natural user interface.
Speaker identification/verification
We can use voiceprint to identify a user and then adopt personalized MID settings. Such user-aware scenario will definitely improve user experience. Moreover, we can also apply speaker verification for authentication on MID.
Computer-assisted pronunciation training (CAPT)
Spoken language learning is a newly developed application area in speech technology. We can implement CAPT on MID for spoken language learning, including English and Mandarin.
Speech-based retrieval of location-aware information
Speech-enable interface for retrieving location-aware information is a practical application for everyday’s needs. In particular, we can focus on specific domains, such as travel and sightseeing. Most commonly used keywords for such domain are “restaurant”, “rest room”, “department store”, “bus stop”, and so on. Once our system receives the keyword, it should retrieve the corresponding information based on the geographic location to give location-aware results that can best suit the user’s needs.

用於音訊音樂的計算聽覺場景分析（2/3）

英文名稱: Computational Auditory Scene Analysis for Audio Music
計畫編號: NSC 96-2628-E-007 -141 -MY3
主持人: 張智星
補助單位: 國科會
計畫執行期間: 2008/8/1 to 2009/7/31
關鍵詞: Computational Auditory Scene Analysis, Music Information Retrieval, Audio Music Analysis
摘要簡介:
所謂「計算聽覺場景分析」（Computational Auditory Scene Analysis，簡稱CASA）的目標，就是要將單聲道的聲音（可能由多個音源所產生），經由電腦的自動計算，採用各種方法（例如快速傅立葉轉換、動態規劃、機器學習等），並應用我們對音源所具有的各種知識，來抽取出這些音源的聲音，以便進行下一步的處理。自從Bregman 在 1990 年提出Auditory Scene Analysis 的概念後，相關的研究持續不斷，但都注重在一般語音的處理，直到近幾年來，音樂經由網際網路大量傳播，相關的分析與檢索也越來越重要，因此CASA 在音訊音樂（Audio Music）方面的研究和應用也在這幾年開始萌芽。本計畫將整合本實驗室開發多年的音訊處理技術（包含旋律辨識、語音辨識、語音與歌聲合成、強韌式音高追蹤、語音轉換等），經由CASA 的架構來應用於音訊音樂，希望建立有效的分析模式與方法，能夠對音訊音樂進行分析與處理。計畫的主要目標，是希望針對一般流行音樂，做到下列幾點：

對音訊音樂進行主旋律的音高追蹤。
判斷歌聲存在的位置。
由音訊音樂抽取單音歌聲。
多重音高追蹤。
抽取其他單音樂器的聲音（例如鼓聲）。
經由這些分析，我們可以對音訊音樂進行更精密的分類與檢索，相關的應用則有：

音訊音樂的自動分類與檢索
音訊音樂的哼唱檢索
音訊音樂的節拍追蹤
音訊音樂的歌詞同步顯示
音訊音樂的情緒內容分析

聯發科嵌入式系統技術研究及人才培育計畫（第四子計畫：視訊及語音應用開發）

英文名稱: MediaTek Embedded System Technology Research and Talent Cultivation Program (Fourth Sub-Program: Video and Voice Application Development)
計畫編號:
主持人: 張智星
補助單位: 聯發科
計畫執行期間: 2008/8/1 to 2009/7/31
關鍵詞:
摘要簡介:

Tri-tone的連續聲調塑模及偵錯技術

英文名稱: Tri-tone Based Continuous Tone Modeling and Analysis
計畫編號:
主持人: 張智星
補助單位: 資策會
計畫執行期間: 2008/3/1 to 2008/11/30
關鍵詞: 電腦輔助發音練習、聲調辨識、隱藏式馬可夫模型、音高追蹤
摘要簡介:
由於電腦速度的增進以及語音科技的演進，語音辨識的應用領域已經從單純的人機介面轉到複雜度更高、用途更廣泛的電腦輔助發音訓練與評分。以華語而言，評分的標準除了音色之外，還包含聲調，因為華語是所謂的tonal language，尤其是對於外國人而言，正確的聲調遠比音色來得困難，因此本計畫將探討如何使用語音相關技術，來進行聲調的塑模與分析，並嘗試使用本計畫所開發的聲調辨識於整合性的華語電腦輔助學習系統之中，以提高電腦輔助發音訓練在華語方面的全面性與可用性。

語音辨識系統開發

英文名稱: Speech Recognition System Development
計畫編號:
主持人: 張智星
補助單位: 中科院
計畫執行期間: 2008/2/1 to 2008/11/30
關鍵詞:
摘要簡介: