1998年研究計畫概況

張智星


簡表

中文名稱 英文名稱 主持人 補助單位 計畫編號 補助金額 開始日期 結束日期
有聲電子圖書館的自動化技術與工具  A Study of Techniques and Tools for Audio/Textual Digital Library  張俊盛、唐傳義、張智星  國科會      1998/8/1  1999/7/1 
軟式計算中的誤差預估與結構辨識  Error Estimation and Structure Identification in Soft Computing  張智星  國科會  NSC88-2213-E-007-007    1998/8/1  1999/7/1 
無線電網台分析  The Analysis of Radio Communication Networks  張智星  中科院      1998/8/1  1999/7/1 
網站檢索搜尋引擎與網路即時新聞服務  Web Search Engines and On-line News Service and Technology  張智星  太一信通      1998/7/1   
網路即時新聞服務的技術開發  Web On-line News Service and Technology  張智星、張俊盛  太一信通      1998/3/1  1998/7/1 
清蔚園網路書院發展計畫  Cyber University  黃一農、楊叔卿、張智星  教育部      1998/1/1  1998/7/1 

詳細資料

  1. 有聲電子圖書館的自動化技術與工具

    • 英文名稱: A Study of Techniques and Tools for Audio/Textual Digital Library
    • 計畫編號:
    • 主持人: 張俊盛、唐傳義、張智星
    • 補助單位: 國科會
    • 計畫執行期間: 1998/8/1 to 1999/7/1
    • 關鍵詞: 電子化有聲詞典、資訊檢索、圖書分類、網路搜尋引擎
    • 摘要簡介:

      製作有聲電子圖書需要整合文字、聲訊、語音合成等等多種媒體與技術。除了此一整合工作,尚需要加入大綱、索引等結構性的資料。對整體有聲電子圖書館而言,更必須具備電子化的圖書目錄、主題索引、甚而書內與書間的互見(cross references)等等資訊。如此,有聲電子圖書才能提供友善、互動式界面。目前這些作業完全都是手工進行,工作煩瑣、重複,十分耗費人力,有必要研發自動化的技術與工具。另外為了節省儲存空間、提高聲訊品質,相當需要錄音訊號的壓縮、強化、消除背景雜訊、決定發聲者位置等等聲訊處理技術。

      電腦的多媒體環境,已經日趨成熟,可以善加利用來建立有聲的電子圖書館,消除視障者接觸資訊的障礙。高速的CPU、彩色螢幕、音效卡、視窗作業環境都已經成為標準配備。多媒體的處理作業也慢慢形成工業界的標準。建立有聲電子圖書館的其他社會、技術條件也逐漸改善。例如:容易取得許多出版品的電子版本;語音技術十分成熟,可以在標準的PC配備下,由文字合成相當自然的語音。

  2. 軟式計算中的誤差預估與結構辨識

    • 英文名稱: Error Estimation and Structure Identification in Soft Computing
    • 計畫編號: NSC88-2213-E-007-007
    • 主持人: 張智星
    • 補助單位: 國科會
    • 計畫執行期間: 1998/8/1 to 1999/7/1
    • 關鍵詞: 軟式計算(Soft Computing)、資料模型化(Data Modeling)、類神經網路(Artificial Neural Networks)、模糊邏輯(Fuzzy Logic)、系統識別(System Identification)、圖型辨識(Pattern Recognition)、資料探勘(Data Mining)、知識發掘(Knowledge Discovery)
    • 摘要簡介:

      本計畫乃在延續上年度之國科會計畫("軟式計算在資料模型化的應用"),其目的有三:

      1. 延續並應用上年度之研究心得,以裨益於將今年研究重點集中於神經模糊模型(Neuro-fuzzy models)之誤差預估(Error measure estimation)與結構辨識(Structure identification)。
      2. 將所得方法與心得應用於WWW (World Wide Web)上的實際問題,例如user modeling, on-line news categorization, prediction of file access intervals in a proxy server等,並和傳統方法比較。
      3. 繼續維護Working Group on Data Modeling的首頁(此為在IEEE Neural Networks Council Standards Committee之下的Subcommittee),並加強其內容。

      軟式計算(Soft computing)是近年來Professor Lotfi Zadeh(模糊邏輯之父,任教於U.C. Berkeley)提倡的新方向,其精神乃是結合類神經網路(Artificial neural networks)及模糊邏輯(Fuzzy logic)的優點,並輔以不須導式的最佳化(Derivative-free optimization)方法,例如遺傳演算法(Genetic algorithms)及模擬退火法(Simulated annealing)等,來對資料及既有的專家知識(Expert knowledge)進行分析及微調(Fine tuning),以建立一個具有學習能力的智慧型系統,並可對於時變(Time-varying)的環境進行自我即時調適(On-line adaptation),以獲取最佳結果。

      在模型的選取上,軟式計算是偏向於使用類神經網路或模糊推演系統這兩類模型。由於類神經網路是具有學習或調適能力(Learning or adaptation capability)的黑箱模型(Black-box model),而模糊推演系統(Fuzzy inference systems)則是能表示專家知識的模糊規則庫系統(Fuzzy rule-based systems),因此軟式計算特別強調這兩者的結合,形成兼具兩者之長的神經模糊推演系統(Neuro-fuzzy inference systems),其應用範圍相當廣泛,舉凡對於資料或專家知識的模型化(Modeling),均可用得上。近幾年來我們已經可以看到使用類神經網路或模糊邏輯(或兩者兼備)的小型家用電器產品,例如洗衣機、吸塵器、電動刮鬍刀、冷氣機、照相機、V8攝錄放影機等。更大型的應用則可見於汽車反鎖煞車系統(ABS,Anti-lock Braking Systems)及傳動系統(Transmission systems)的控制,以及電梯、電車的自動控制。然而在實際的應用上,仍有許多問題亟待克服,例如輸入變數的選取(Input selection)和變形(Transformation)、輸入空間的分割(Input space partitioning)、模糊規則數目的選定、破壞式及增長式的學習(Destructive and constructive learning)等等,這些問題都是在進行結構辨識(Structure identification)時所需解決的問題,也都是本計畫的研究重點。尤其重要的是,我們希望能推導出能夠快速計算誤差指標(Error measure)的方法,才能正確的引導結構辨識的進行。

      神經模糊系統的基本學習方法為逆傳導法(Back-propagation),即為簡單的梯度下降法(Gradient descent)或是最速下降法(Steepest descent),更複雜先進的方法則是在統計或非線性迴歸(Nonlinear regression)中常用到的Gauss-Newton Method或是Levenberg-Marquardt Method。但是這些方法都須要用到梯度向量(Gradient vectors)而梯度向量在複雜系統中並不容易計算,因此對於較複雜的大型系統,軟式計算偏向於使用不須導式的最佳化方法(Derivative-free optimization)[Jang97book],例如遺傳演算法(Genetic algorithms)、模擬退火法(Simulated annealing)、下坡式Simplex搜尋(Downhill simplex search)、雜亂搜尋(Random search)、它布搜尋(Tabu search)等。這些方法各有優缺點,本計畫的另一重點則在於找出如何搭配 Derivative-free 及 Derivative-based這兩種最佳化方法,以使模型選取的工作能順利進行。

      近年來由於網際網路(Internet)日漸興盛,WWW (World Wide Web)的使用越來越普遍,各種電子資訊的流通與取得也是垂手可得。因此如何從大量的資料中找出有用的因果關係,便成為一個重要的課題。這方面的研究稱為資料探勘(Data Mining)或知識發掘(Knowledge Discovery),一般採用的方法有統計、粗糙集(Rough Sets)機器學習(Machine Learning)中的ID3、非參數式回歸(Nonparametric regression)中的CART(Classification and Regression Trees)等。本計畫將嘗試以軟式計算及模型結構選取的方法,用在WWW上的資料探勘及知識發掘等,例如 User modeling, on-line news categorization 及 File access interval prediction等。

      為提高台灣在此方面研究的知名度,並促進技術及研究的交流,本計畫將繼續維護Working Group on Data Modeling的首頁,此為在IEEE Neural Networks Council Standards Committee之下的Subcommittee, URL地址為:"http://www.cs.nthu.edu.tw/~jang/benchmark".

  3. 無線電網台分析

    • 英文名稱: The Analysis of Radio Communication Networks
    • 計畫編號:
    • 主持人: 張智星
    • 補助單位: 中科院
    • 計畫執行期間: 1998/8/1 to 1999/7/1
    • 關鍵詞: Data Clustering, Pattern Recognition, System Modeling and Simulation
    • 摘要簡介:

      無線電網台分析器(Radio Network Analyzer)的任務是從截收到的無線電訊號中,逐一辨識出相對映之無線電通信機之發話、無線電通信機,以及無線電網。在此提及的各項名詞存在一個階層式的關係:

      1. 無線電網是由數個無線電通信機所組成
      2. 無線電通信機可進行不限定次數之發話
      3. 每一個發話是由一連串的hop所組成

      截收器記錄下來的無線電訊號即是一連串的hop,而無線網台分析器的功能即是將hop歸類至可能之發話,並進而分析計算出此發話可能源自某一無線電通信機,以及此無線電通信機可能隸屬的無線電網。因此無線電網台分析可分為三步驟:

      1. 發話分析:將hop 歸類到某一發話
      2. 無線電通信機分析:將發話歸類到某一無線電通信機
      3. 無線電網分析:將無線電通信機歸到某一無線電網

      在這三個步驟中,有一個共同的分析方法,就是必須將資料加以分類,因此本計畫的首要目標即是嘗試以各種群聚分析(Clustering Analysis) 及圖形辨識(Pattern Recognition)的方法,來進行無線電網台分析。傳統的群聚分析有下列數種:

      1. K-means clustering
      2. ISODATA
      3. Hierarchical clustering (single, complete, and average linkage)

      傳統的圖形辨識方法有下列數種:

      1. K nearest neighbor rule (KNNL)
      2. Histogram analysis
      3. Kernel and window estimators
      4. Multi-dimensional Gaussian density approach

      這些傳統方法都是我們將嘗試的方法。除此之外,我們亦可加入以類神娙網路(Artificial Neural Networks) 或模糊邏輯(Fuzzy Logic)為基礎的各種軟式計算(Soft Computing) 的方法,例如:

      1. Multilayer perceptrons (MLPs)
      2. Radial basis function networks (RBFNs)
      3. Adaptive networks
      4. Fuzzy c-means clustering
      5. Adaptive fuzzy classifications
      6. Derivative-free optimization:
        • Genetic algorithms
        • Simulated annealing
        • Random search
        • Downhill simplex method

      本計晝預計完成一套MATLAB的程式庫,將包含進行無線電網台分析所須的各種圖形辨識、群聚分析、及軟式計算的各種方法。

  4. 網站檢索搜尋引擎與網路即時新聞服務

    • 英文名稱: Web Search Engines and On-line News Service and Technology
    • 計畫編號:
    • 主持人: 張智星
    • 補助單位: 太一信通
    • 計畫執行期間: 1998/7/1 to
    • 關鍵詞: 搜尋引擎、網路自動機、新聞自動分類、聚叢分析、網頁自動生成、反轉檔案、語意分析
    • 摘要簡介:

      當使用者面對網路上與日俱增的文章時,常有不知從何找起之憾,如果能夠先行蒐集網路上的各類文章,處理成便於查詢的反轉檔案(Inverted File),再由搜尋引擎利用使用者提供相關字詞做為查詢項,即可輕易地找出使用者想要的資訊。

      網路即時新聞服務的興起,使得一般的使用者可以輕易的瀏覽世界各地、各種文字的新聞網。然而想要閱讀同一事件的報導,就必須不斷的切換螢幕,連結不同的網站,相當不便利。網路速度緩慢的狀況下,更屬不可行。如果能夠自動蒐集很多新聞網站的資料。綜合各個網站的新聞網頁,加以分類整理,形成一個結構井然有序的新聞集錦(Web News Capsule),就可以解決上述問題。

      本計畫預計研究開發一系列的網路資源探勘、文字分析、網頁程式設計,以及多種檢索技巧,以便於提供每日網路新聞集錦和搜尋引擎的完善解決方案。

  5. 網路即時新聞服務的技術開發

    • 英文名稱: Web On-line News Service and Technology
    • 計畫編號:
    • 主持人: 張智星、張俊盛
    • 補助單位: 太一信通
    • 計畫執行期間: 1998/3/1 to 1998/7/1
    • 關鍵詞: 網路自動機、新聞自動分類、聚叢分析、網頁自動生成
    • 摘要簡介:

      網路即時新聞服務的興起,使得一般的使用者可以輕易的來去世界各地、各種文字的新聞網站,瀏覽當日的新聞。然而想要閱讀同一事件的報導,就必須不斷的切換螢幕,連結不同的網站,相當不便利。網路速度緩慢的狀況下,更屬不可行。如果能夠自動蒐集很多新聞網站的資料。綜合各個網站的新聞網頁,加以分類整理,形成一個結構井然有序的新聞集錦(Web News Capsule),就可以解決上述問題。本計畫預計研究開發一系列的網路資源探勘、文字分析、網頁程式設計,提供每日網路新聞集錦的完整解決方案。

  6. 清蔚園網路書院發展計畫

    • 英文名稱: Cyber University
    • 計畫編號:
    • 主持人: 黃一農、楊叔卿、張智星
    • 補助單位: 教育部
    • 計畫執行期間: 1998/1/1 to 1998/7/1
    • 關鍵詞: WWW, Distance Learning, Cyber University
    • 摘要簡介:

      網際網路(Internet)自1993年開始興起,在短短數年間不僅成為世界性最受歡迎的媒體,而且已成為國際間資訊競爭的利器,甚至成為衡量各國資訊競爭力的重要指標。網際網路在臺灣開始普及,不過是近兩、三年間的事,但卻已發展成十幾至二十幾歲青少年生活中日益重要的資訊媒介,例如,依據最近天下雜誌八十六年十一月份所進行台灣第一次全面性的「網際網路的使用調查」結果指出,目前六成六的網路族未滿三十歲。相對地,目前四十歲以上的社會中堅份子(包含大多數的學術界人士和教育主管官員),對網路文化卻頂多具有一模糊的印象。亦即,網路文化的興起已明顯在社會上造成愈來愈深的代溝。

      網際網路雖然具備各種不同功能,但目前其在臺灣的應用,卻多偏重於商業性質,或僅拿來做為個人、機關或公司行號的介紹。許多人甚至更利用其既隱蔽又開放的特性,開設具有商業行為的情色網站,這些網站不僅數目眾多,而且往往都是目前中文網路世界中最熱門的站址。當我們社會的網路資源,有如此大的比例被用於處理這些情色的內容,那麼即使政府投資在硬體上的經費再多,都將因此被大量虛耗掉。此外,一個有心人如果要嘗試上網尋覓知性的內容時,卻會痛心發現台灣的網路文化竟是如此貧瘠,我們需要花費好大力量,才找得到少數一些較具內涵的網站。這是近年來最常聽到的聲音:「網際網路上沒有什麼好的中文網站」,有任教大學的教授視為理所當然地說:「我從不上中文的網站,中文站沒什麼好看的,我只上英文的」。

      在此時政府積極推動「三百萬人上網」,網路使用幾已成為全民運動,我們不禁要問:「中文網路發展應何去何從?」我們應思考:「在這種以西方科技文明主導的數位網路浪潮下,中文的網路文化在此新一代的媒體革命中應否佔有一席位置?又該是誰的責任?」我們相信唯有經由這種意識覺醒並鼓勵大家積極投入網路中文化的行動,華人未來的網路世界不致淪為英文文化的殖民地,尤其我們高級知識份子座擁高科技環境,相對地,在技術、資源較社會一般人優勢,更是責無旁貸,此故,雖然我們的時間和力量都相當有限,但我們有心付出,期盼能多少替這塊土地上的網路文化注入清新的血液。

      籌設清蔚園網際網路資訊園區(Web-based Information Park),並在其中開設各種虛擬博物館,如科學館、藝文館等,以舉辦大型的知性博覽會,並且規劃網路書院,以容納各種課程,進而有計劃培訓各級師資並成立地區性網路教學中心,結合有意願使用電腦高科技教學的各階層教師,就是我們目前努力的目標。這樣一個模仿真實博物館運作的大型網際網路資訊園區,在臺灣、甚至全世界都相當罕見。當一些公立的博物館必須花費數以幾十億計的經費購置土地並建築硬體時,而當網際網路正形成一無遠弗屆的溝通媒介之際,或許這樣一個「小而省」、「小而好」、「功能多媒體多元化」、「立足數位而放眼地球村」的全新類型的園區,是值得我們社會認真思考並努力的方向。

      我們計劃每年將提供近百項國內外各種類型的展覽,我們希望將來清蔚園網際網路資訊園中的展覽能更豐富地涵蓋藝文類(如國內外各種網路畫展)、科學類(如與天文、生態、理化或科技史等內容)和史地民俗類等不同面向,更有不同程度的網展內容,以適應不同教育背景的網友的需要,並加以累積,而透過網際展覽製作營的舉辦,我們也有機會將發展精緻網路文化的種籽,散布至社會許多角落。希望此一資訊園區能成為各種年齡層或不同教育程度的網友們吸取知識、擴展見聞的一處文化長廊,並提供社會一終生學習的重要渠道。希望藉此努力開拓遠距學習的另一個新世界,落實終身教育的理想。更希望能因此帶動有心人士的共同努力,讓中文的網路世界有機會成功地扮演網路世界知識領航的角色。