22-5 袘Pi

由於電腦運算能力的突飛猛進，以及內存容量的大幅增長，各種AI應用可說是日新月異。目前使用語音來進行和數位助理的對話（如設定鬧鐘、預訂餐廳、查詢電影等），已經不再是夢想，而使用哼唱的方式來找到你想聽或唱的歌，也是隨處可見。我們可以想見，未來在音訊應用方面，AI可以幫我們做的事情還有很多，例如：

在醫療方面，我們可以使用AI來進行特定疾病診斷，所用的訊號（都是類似音訊的時間序列）可能是：腦波（EEG）、心電圖（ECG）、肌電圖（EMG）、體溫、聽診器收音、呼吸強度、心跳強度等。我們也可以使用和病患的語音對話來偵測病患情緒、是否有憂鬱症、失智程度，或進行測謊等。
在音訊事件（audio events）的偵測方面，我們可以使用音訊來判斷相關事件，例如甩門、打架、咒罵、打破玻璃、打破杯子、撞擊聲、跌倒、呼救、嬰兒哭喊等、緊急煞車、救護車鳴笛等，可用於在安全預警及遠距照護方面。
在製造業方面，我們可以偵測設備可能產生的異音，並進而決定設備是否要進廠維修、橋樑是否要封閉等。
更進一步，我們相信未來的電腦能夠自動收聽新聞廣播或人與人之間的對話，並擷取相關資訊來進行分析，然後可以進行更高層次的心智互動，例如打屁聊天、互動教學、即席演講、編寫故事、自由辯論、吟詩作對、唱歌配樂、作詞作曲等，這些活動都牽涉到大量的音訊辨識與合成，以及內部大量的資訊處理與資料結構，在電腦運算能力與演算法的持續進步下，這些夢想或許已經不遠了，且讓我們洗耳恭聽、拭目以待！
Audio Signal Processing and Recognition (音訊處理與辨識)