【生活】
「死亡天使」? 從一張 Excel 表格開始的統計冤案
「死亡天使」? 從一張 Excel 表格開始的統計冤案
張貼日期:May 06, 2025
作者:陳宏賓 副教授(國立中興大學應用數學系)
當數學走上法庭
Netflix 真實事件改編電影《死亡天使》(The Good Nurse)描述的是至少 40 人在醫院被毒死的真實故事。美國有一位加護病房護士查爾斯·卡倫,在 16 年間(1987-2002)於九間不同醫院悄悄謀殺了上百位病患。卡倫被逮捕後,後來承認殺害了至少 40 名病患,但調查人員推測實際人數可能超過 400 人,成為美國史上殺人最多的連環殺手之一。令人震驚的不僅是他的手法,更是整個醫療系統的選擇性失明。雖然護士與藥房早有發現卡倫調取用藥異常,但醫院寧願讓他悄悄轉職到其他醫院,也不想面對潛在的醜聞和法律責任。
然而,同一時期(1990-2001)荷蘭有另一位護士的故事卻走向了截然不同的悲劇。
在尤利安娜兒童醫院工作的露西亞·德·伯克(Lucia de Berk)是一位經常在加護病房與急診室值班的護士,卻因為「一張 Excel 表格上看起來很可疑的統計數據」,被誤判為殺人犯,入獄六年,最終才得以平反。
尤利安娜兒童醫院提供的,在露西亞任職的兩年間的統計資料,發生「可疑醫療事件」僅有9次,9次露西亞全都在場。
統計數據的開端:驚天巧合?
露西亞在 1990 至 2001 年間,任職於數家醫院,包括尤利安娜兒童醫院(Juliana Children’s Hospital)與紅十字醫院(Red Cross Hospital)。在她的值班期間,發生了多起嬰兒猝死或緊急復甦的事件。但要注意的是,這些情況在加護病房中並不罕見,因為裡面都是正在跟死神搏鬥的病人。
然而,尤利安娜兒童醫院的主任保羅·史密茨(Paul Smits)查覺到一絲不尋常的氣息,開始懷疑這並非巧合。他將事件記錄輸入 Excel 表格,整理出死亡事件與露西亞值班的對照表,並計算出一個驚人的結論:露西亞在如此多的緊急復甦和死亡事件中出現的機率「極不可能」,大約七十億分之一。
然後就......報警抓人並且通知了當地媒體......
這個數字太過聳動,很快吸引了警方與媒體的關注。要知道,當時全世界人口也才六十多億,七十億分之一的說法乍聽之下幾乎等於宣判露西亞「一定殺了人」。於是警方展開調查,媒體大肆報導並廣泛地將這個極低的數字報導為露西亞無罪的機率,卻沒有任何數學上的解釋。露西亞很快就遭到逮捕。在媒體的大量報導中,露西亞甚至被比作「死亡天使」(The Angel of Death),可以想像如果在台灣的話露西亞幾乎社會性死亡了吧...
【露西亞起初在地方法院被指控涉嫌4個謀殺加2個謀殺未遂,到了最高法院被檢察官追加到涉嫌7個謀殺加3個謀殺未遂。】
法庭的攻防戰中,統計數據扮演了非常重要的角色。
檢察官請來專家證人漢克·艾佛斯(Henk Elffers),背景是擁有統計學學士學位任職於阿姆斯特丹大學的法律教授,他的工作負責解讀最初醫院整理的 Excel 表格中死亡及嚴重事件的數據含義。艾佛斯的證詞涉及了 p 值,這是統計學中衡量觀測數據與某個假設的指標,p 值很小表示在假設為真的情況下,觀測到如此極端數據的機率很低,此處的假設是【事件是自然發生的】,他使用了醫院提供的死亡及嚴重事件表格進行分析,計算得出的結論是:
「p 值是三億四千兩百萬分之一。也就是說,假設事件是自然發生的,那麼觀測到露西亞剛好出現在這些事件的機率只有三億四千兩百萬分之一。」
並對法官說:「法官大人~ 以我的專業認知,這絕不是巧合,剩下的就交給您了。」
檢方引用這些數字作為關鍵證據,並且解釋成
「這種事件分布(露西亞的班次遇到這些事件)是自然發生的機率三億四千二百萬分之一」
最後,露西亞在 2003 年被判終身監禁。
上訴到了高等法院,檢方再請來另一外專家證人穆爾德(Richard de Mulder),他的背景是資訊科技與法律領域的教授,再次強化了艾佛斯的證詞,他說:「艾佛斯的統計方法是正確的,即使數據不完全正確,結論也不會改變,這絕對不是巧合,露西亞必須解釋她為何總是在場」。
專家都這麼說了,那問題究竟出在哪裡?讓我們逐一拆解這場統計災難的關鍵謬誤。
錯在數學:關鍵的三大統計誤區
錯誤一:事後選定 vs. 事前檢定
這類統計推論的前提應該是:「事前」指定要觀察某位護士是否異常,而非在事件發生後才回頭挑出「這位」看起來不尋常的人再來計算機率。
這就像在幾百位護士中選一個值班期間死亡事件較多的護士,然後問:
「你怎麼那麼『剛好』遇到這些?這樣巧合的機率有多少?」
你問錯問題了!
在一個夠大的樣本中,總會有人落在統計極端值。這種錯誤就像對「某人中了樂透」感到驚訝,卻忘了有幾百萬人在買彩券,總是會有人中頭獎。
錯誤二:將多個 p 值相乘
在法庭上,專家證人艾佛斯提出了三個與露西亞值班事件有關的 p 值(這是假設檢定中使用的機率值,很小的 p 值說明在虛無假說下觀測到的機率很小):
p1=0.0000029854(來自尤利安娜兒童醫院)
p2=0.071559(紅十字醫院病房 A)
p3=0.0136(紅十字醫院病房 B)
然後艾佛斯將這三個數值直接相乘,引出一個令人瞠目結舌的結論:被告同時出現在這些死亡案件的機率僅有 1/342,000,000(約三億四千兩百萬分之一,比醫院主任的七十億分之一還少很多)。
這在數學上聽起來很嚴謹,實際上卻很有問題。
因為 p 值只有在事件間完全獨立的情況下才能相乘。而現實中,醫療事件彼此之間往往密切相關(如病人狀況、工作分配、環境壓力),這樣的運算有誤。儘管艾佛斯作證時有強調,統計相關只是說露西亞跟這些案件有關,並不代表這些死亡案件就是露西亞做的,還有其他可能,例如露西亞可能只是一位技術比較差的不稱職護士,但不是兇手、露西亞輪值的班次比較困難(例如重症病房、急診等)、露西亞輪了較多夜班、或者有第三人設陷阱加害露西亞。但他的計算已經造成很大的偏見誤解。
錯誤三:偏誤的「可疑」事件分類
事件清單本身就有選擇性。原始的「可疑事件清單」僅收錄發生在露西亞當班的事故。舉例來說,兒童凱末爾曾因水合氯醛過量三度需要復甦,但清單上只列出其中兩次,其中沒列入清單的那次僅僅是因為露西亞不在場。同樣地,其他與露西亞無關但性質相似的「可疑」事件也被排除在 Excel 表格之外。
這樣的「選擇性納入」,使得原始資料集早已偏頗,統計結果自然有重大瑕疵。
改變一切的,是兒科主任艾達德克森(Arda Derksen)的堅持。她不僅重新審視所有事件,還比對了那些「未被列入可疑事件」卻同樣嚴重的案例,發現當露西亞不在場時,類似事件照樣發生,只是沒有被納入調查。
她的哥哥,哲學教授湯德克森(Ton Derksen)也深入研究此案,指出:檢方宣稱「先列出可疑事件再比對露西亞是否在場」的說法根本站不住腳,因為許多「可疑事件」明顯是根據露西亞是否值班來定義的。
也就是說,統計基礎建構在一個回圈判斷上:只因為她在場,所以事件被視為可疑;然後再因事件可疑,懷疑她有罪。這不是統計推理,是邏輯循環。
修正數據後,結果驟變
在排除選擇性記錄、補上被遺漏的事件後,重新進行統計分析,結果從原本令人恐懼的「七十億分之一」驟降為「一千兩百分之一」。
這個機率雖然還是偏小,但放在荷蘭 25 萬名護士的基數下,每年出現幾百位像露西亞這樣「數據看起來不尋常」的人,就是非常自然會發生的一件事。
專家證人艾佛斯雖嘗試考慮班表、護理能力與病人分配等可能的影響因子,但他將非獨立的 p 值相乘、依據有偏差的事件表來推論機率,這些錯誤最終成為露西亞遭誤判的根本原因。也就是說,這不是命案的證據,而是一場數學的誤會。
「數據若不被正確使用,它不會帶我們走近真相,反而可能帶我們遠離正義。」
2010 年,經過許多人的努力,法院終於宣告露西亞無罪,撤銷判決,但這場冤案早已對她造成難以彌補的傷害。
參考資料
MATH ON TRIAL: How Numbers Get Used and Abused in the Courtroom, Leila Schneps and Coralie Colmez