1997年研究計畫概況

張智星

簡表

中文名稱英文名稱主持人補助單位計畫編號補助金額開始日期結束日期

分散式多伺服器隨意視訊系統(III)(子計劃三) 智慧型查詢系統 (以歌選歌) An Intelligent Interface of Query by Singing in VOD (Video on Deman) 張智星國科會 NSC87-2213-E-007-013 1997/8/1 1998/7/1

軟式計算在資料模型化的應用 Soft Computing in Data Modeling 張智星國科會 NSC87-2213-E-007-009 1997/8/1 1998/7/1

中文名稱	英文名稱	主持人	補助單位	計畫編號	補助金額	開始日期	結束日期
分散式多伺服器隨意視訊系統(III)(子計劃三) 智慧型查詢系統 (以歌選歌)	An Intelligent Interface of Query by Singing in VOD (Video on Deman)	張智星	國科會	NSC87-2213-E-007-013		1997/8/1	1998/7/1
軟式計算在資料模型化的應用	Soft Computing in Data Modeling	張智星	國科會	NSC87-2213-E-007-009		1997/8/1	1998/7/1

詳細資料

分散式多伺服器隨意視訊系統(III)(子計劃三) 智慧型查詢系統 (以歌選歌)

英文名稱: An Intelligent Interface of Query by Singing in VOD (Video on Deman)
計畫編號: NSC87-2213-E-007-013
主持人: 張智星
補助單位: 國科會
計畫執行期間: 1997/8/1 to 1998/7/1
關鍵詞: Content-based Audio Retrieval, Pattern Recognition, Signal Processing
摘要簡介:

對於資料庫的查詢方面，除了給定關鍵字以進行一般的查詢外，更希望能更進一步，讓使用者能以聲音檔 (Audio Files) 或視訊檔 (Video Files) 的內容來編製索引及加速檢索。以KTV 為例，期望能做到 “以歌選歌”，也就是說，要讓歌者能清唱一段歌曲或旋律，電腦即以即時錄下音波，進行必要的數為信號處理，然後比對資料庫中的資料，依可能性列出所有可能的歌。除此以外，一個自然的延伸則是將歌者的歌聲進行處理後，找出各項特性（如音調及拍子準確性、音色與原歌者相似性等）來做自動評分。
由於本子計畫牽涉到聲音訊號的處理、識別、分類等，所以需要各個領域特有的技術與研究相互配合，包含下列數項：

數位訊號處理 (DSP, Digital Signal Processing): 尤其是對於聲音訊號的轉換 (Transforms)與濾波 (Filtering)，茲分述如下。

轉換：音波訊號包含的資料量非常豐富，一段十秒鐘的聲音所佔的磁碟空間在未壓縮前約為80 Kbyte（8-bit解析度，8 KHz）。從時域 (Time Domain) 方面來看音波，通常所得有限，很難找出和語音識別相關的特徵量 (Features)。一般的作法則是從頻域 (Frequency Domain) 方面著手，亦即對音波進行離散傅立葉轉換 (Discrete Fourier Transform)，算出前幾個低頻分量 (Low-frequency component)的係數，來代表所給音波的特性。其他還有各種不同的轉換和變形技巧，例如Wavelet Transform, Ceptral Analysis及, 他們各有各的長處和短處。
濾波 (Filtering)：音波的取得，一定多少會被不相關的訊號（即噪音）所污染。因此在進行音波的處理之前，一定要進行濾波。濾波的方式有很多種，最簡單的方式是將訊號通過一個低通濾波器 (Low-pass Filter)。更複雜的方法則是將此濾波器的特性變為即時可調 (On-line Adaptive) 。

圖形識別 (Pattern Recognition): 尤其是語音識別 (Speech Recognition) 及語者識別 (Speaker Recognition)。聲音訊號的量通常很大，所以在進行DSP以抓取特徵量後，仍需進行資料的縮減 (Data Reduction)，以利圖形識別的進行。在這方面最常用到的方法是Condense及Editing。對於這兩種方法在語者辨認方面的應用，我們曾經加以改良，獲致不錯的結果。
軟式計算 (Soft Computing) : 包含類神經網路 (Artificial Neural Networks)、模糊邏輯 (Fuzzy Logic) ，以及各種無須導式 (Derivative-free) 的最佳化 (Optimization) 方法。在實作上，我們常常需要找出一個給定的目標函數的最小值，此目標函題可能已相當繁複，其梯度 (Gradient Vector) 可能難以計算，同此我們無法以傳統最佳化的方法來求解。解決之道乃選用軟式計算 (Soft Comping) 中的各種無須導式 (Derivative-free) 的方法，例如基因演算法 (Genetic Algorithms)，模擬退火法 (Simulated Annealing)，雜亂搜尋法 (Random Search Method)，以及下坡Simplex法 (Downhill Simplex Method)。

軟式計算在資料模型化的應用

英文名稱: Soft Computing in Data Modeling
計畫編號: NSC87-2213-E-007-009
主持人: 張智星
補助單位: 國科會
計畫執行期間: 1997/8/1 to 1998/7/1
關鍵詞: 軟式計算（Soft Computing）、資料模型化（Data Modeling）、類神經網路（Artificial Neural Networks）、模糊邏輯（Fuzzy Logic）、系統識別（System Identification）、圖型辨識（Pattern Recognition）、資料探勘（Data Mining）、知識發掘（Knowledge Discovery）
摘要簡介:

軟式計算（Soft Computing）是近年來Professor Lotfi Zadeh（模糊邏輯之父，任教於U.C. Berkeley）提倡的新方向，其精神乃是結合類神經網路（Artificial Neural Networks）及模糊邏輯（Fuzzy Logic）的優點，並輔以不須導式的最佳化（Derivative free Optimization）方法，例如遺傳演算法（Genetic Algorithms）及模擬退火法（Simulated Annealing）等，來對資料及既有的專家知識（Expert Knowledge）進行分析及微調（Fine tuning），以建立一個具有學習能力的智慧型系統，並可對於時變（Time-varying）的環境進行自我即時調適（On-line Adaptation），以獲取最佳結果。
在模型的選取上，軟式計算是偏向於使用類神經網路成模糊邏輯這兩類模型。由於類神經網路是具有學習或調適能力（Learning or Adaptation Capability）的黑箱模型（Blackbox Model），而模糊推演系統（Fuzzy Inference Systems）則是能表示專家知識的模糊規則庫系統（Fuzzy Rule-based Systems），因此軟式計算特別強調這兩者的結合，形成兼具兩者之長的神經模糊推演系統（Neuro-Fuzzy Inference Systems），其應用範圍相當廣泛，舉凡對於資料或專家知識的模型化（Modeling），均可用得上。近幾年來我們已經可以看到使用類神經網路或模糊邏輯（或兩者兼備）的小型家用電器產品，例如洗衣機、吸塵器、電動刮鬍刀、冷氣機、照相機、V8攝錄放影機等。更大型的應用則可見於汽車反鎖煞車系統（ABS，Anti-lock Braking Systems）及傳動系統（Transmission Systems）的控制，以及電梯﹑電車的自動控制。然而在實際的應用上，仍有許多問題亟待克服，例如輸入變數的選取（Input Selection）和變形（Transformation）、輸入空間的分割（Input Space Partitioning）、模糊規則數（Number of Fuzzy Rules）的選定、破壞式及增長式的學習（Destructive and Constructive Learning）等等，這些都是本計畫的研究重點。
神經模糊系統的基本學習方法為逆傳導法（Backpropagation），即為簡單的梯度下降法（Gradient Descent）或是最速下降法（Steepest Descent），更複雜先進的方法則是在統計或非線性迴歸（Nonlinear Regression）中常用到的Gauss-Newton Method或是Levenberg-Marquardt Method。但是這些方法都須要用到梯度向量（Gradient Vector）而梯度向量在複雜系統中並不容易計算，因此對於較複雜的大型系統，軟式計算偏向於使用不須導式的最佳化方法（Derivative-free Optimization），例如遺傳演算法（Genetic Algorithms）、模擬退火法（Simulated Annealing）、下坡式Simplex搜尋（Downhill Simplex Search）、雜亂搜尋（Random Search）、它布搜尋（Tabu Search）等。這些方法各有優缺點，本計畫的另一重點則在於找出如果選取這些方法的控制參數（Control Parameters）的步驟，以便使用於資料模型化（Data Modeling）之上。
近年來由於網際網路（Internet）日漸興盛，WWW (World Wide Web)的使用越來越普遍，各種電子資訊的流通與取得也是垂手可得。因此如何從大量的資料中找出有用的因果關係，便成為一個重要的課題。這方面的研究稱為資料探勘（Data Mining）或知識發掘（Knowledge Discovery），一般採用的方法有統計、粗糙集（Rough Sets）機器學習（Machine Learning）中的ID3、非參數式回歸（Nonparametric Regression）中的CART（Classification and Regression Trees）等。本計畫將嘗試以軟式計算用在資料模型化的技巧，用在資料探勘及知識發掘的各種Benchmark Problems。