動機:
心血管疾病(Cardiovascular Diseases, CVD)是一種心臟疾病,世界衛生組織(World Health Organization, WHO)指出心血管疾病是全球死亡的頭號殺手,每年都造成全球約1,790萬人死亡,占總死亡人數的31%。總部位於布魯塞爾的European Heart Networks組織報告顯示,心血管疾病每年在歐洲導致390萬人死亡,造成每年高達2100億歐元的損失。我國衛生福利部公布統計資料顯示,心血管疾病為第二大死亡因素,並且近二十年來在國人十大死因中持續位居前三名。
心電圖(Electrocardiography, ECG)分析是評估心臟健康的有效方法,因此,識別和ECG信號的分類有助於早期發現心血管疾病。心電圖是一種視覺時間序列(Time Series),記錄人體心臟實時心動週期的電活動訊號,現在廣泛用於心率檢測。這種無創檢測方式操作簡便,成為用於協助醫生分析病理的必備工具。 現階段心血管疾病的判斷主要依據醫生的經驗。 但是,心血管病有很多種類,長時間人工檢測,容易造成誤檢。 如何快速準確地分析ECG訊號是一個問題,基於機器學習(Machine Learning)的心電信號智慧篩查可望快速準確地分析ECG訊號,減輕醫療人員工作負荷,提高醫療資源使用效率。
數據集:ECG5000
ECG5000 數據集是由 Eamonn Keogh 和 Yanping Chen 發布的 ECG 數據庫,在 UCR 時間序列分類檔案中公開可用。 它包含 5000 個心跳(從單個患者中提取),每個心跳的長度為 140 個點。
方法:
採用自編碼器(Autoencoder, AE)對ECG訊號進行降維,自編碼器是一種神經網路,透過編碼器將輸入壓縮成隱變量/表示(Latent Variable/ Representation),經過解碼器將隱變量還原成原始訊號,因此,這個隱變量可以作為原始訊號在低維度空間的表示,不僅達到降維的目的,該隱變量更能作為訊號特徵。此專題使用異常檢測(Abnormaly Detection),以正常ECG樣本訓練AE,使得正常ECG數據以及異常ECG數據在AE輸入與輸出之間的損失函數分佈可區分,達成異常檢測目的。
採用時間序列成像(Time Series Imaging)技術,常見的方法為格拉姆角場(Gramian Angular Field, GAF)以及馬可夫轉移場(Markov Transition Field, MTF),此專題使用MTF。
成果:
正常ECG訊號MTF成像
異常ECG訊號MTF成像
正常/異常ECG訊號AE損失函數分佈圖
分類效能指標/混淆矩陣