由於電腦運算能力的突飛猛進,以及內存容量的大幅增長,各種AI應用可說是日新月異。目前使用語音來進行和數位助理的對話(如設定鬧鐘、預訂餐廳、查詢電影等),已經不再是夢想,而使用哼唱的方式來找到你想聽或唱的歌,也是隨處可見。我們可以想見,未來在音訊應用方面,AI可以幫我們做的事情還有很多,例如:
更進一步,我們相信未來的電腦能夠自動收聽新聞廣播或人與人之間的對話,並擷取相關資訊來進行分析,然後可以進行更高層次的心智互動,例如打屁聊天、互動教學、即席演講、編寫故事、自由辯論、吟詩作對、唱歌配樂、作詞作曲等,這些活動都牽涉到大量的音訊辨識與合成,以及內部大量的資訊處理與資料結構,在電腦運算能力與演算法的持續進步下,這些夢想或許已經不遠了,且讓我們洗耳恭聽、拭目以待!
- 在醫療方面,我們可以使用AI來進行特定疾病診斷,所用的訊號(都是類似音訊的時間序列)可能是:腦波(EEG)、心電圖(ECG)、肌電圖(EMG)、體溫、聽診器收音、呼吸強度、心跳強度等。我們也可以使用和病患的語音對話來偵測病患情緒、是否有憂鬱症、失智程度,或進行測謊等。
- 在音訊事件(audio events)的偵測方面,我們可以使用音訊來判斷相關事件,例如甩門、打架、咒罵、打破玻璃、打破杯子、撞擊聲、跌倒、呼救、嬰兒哭喊等、緊急煞車、救護車鳴笛等,可用於在安全預警及遠距照護方面。
- 在製造業方面,我們可以偵測設備可能產生的異音,並進而決定設備是否要進廠維修、橋樑是否要封閉等。
Audio Signal Processing and Recognition (音訊處理與辨識)