實驗設計2 - 控制組的重要性

[回到目錄]

How to design a control group

1. 等一下,對照組(控制組)還需要設計嗎? – 兩個你一定要記住的例子

回想一下你所讀過的paper,在Materials & Methods的地方通常會長篇大論地討論如何設計「實驗組」,比方招募哪些病人,排除或納入條件是什麼,實驗組做了哪些task哪些操弄…… 至於對照組呢? 就什麼都沒有嘛。

如果你認為對照組只是「什麼都沒有什麼都沒做」,那這樣的實驗設計就岌岌可危了。請記得以下兩個例子:

(A) 「病人-健康」對照研究裡,我們研究慢性TMD(顳顎關節障礙) pain超過20年的病患。我們找了沒有TMD問題的大學生當受試者。比較病患組與對照組,我們發現病患的憂鬱程度比較高。請問這個憂鬱程度與該怎麼解釋? 你可以說它是TMD pain的影響,但請注意有20年TMD病史的病患平均年齡也比較高,所以這個憂鬱程度會不會實際上反映了年齡的影響?(記得我們的對照組是大學生)。

這時候你可能會想說,我們就找同樣年齡的人來當對照組好了,這樣我們就可以「控制」住年齡這個變項。結果你一樣發現病患組的憂鬱程度比較高。但你真能確定沒有別的因素影響這個憂鬱程度的變化? 比方,會不會對照組的人因為年齡比較大比較成熟,他們有更多的社會歷練能夠控制自己的情緒? 所以你發現憂鬱程度的變化,並不是病患組更嚴重,而是對照組「比較不憂鬱,比較喜樂」所造成的差異?

(B) 在「介入型」研究中,我們比較「練習口腔咀嚼運動」的TMD病患與「沒有練習」的TMD病患,看看誰在未來容易發生TMD pain。我們發現練習組的人在1年後TMD pain的程度比較輕微,所以可見練習咀嚼運動有助減緩TMD pain。真的是這樣嗎? 請注意,會不會「沒有練習」的TMD病患,他們因為沒做任何事,所以慢慢疏忽了TMD的問題,結果導致飲食作息各方面都開始亂來…… 所以1年後你發現他們的疼痛比較嚴重,並非真的是沒做咀嚼運動,而是他們疏忽TMD導致。

這時候你可能會說,不然我也讓對照組做某一種運動,但不是咀嚼運動。這樣兩組都有做一些事,這樣就能「對照」(contrast)出咀嚼運動這個變因的效果。於是你請這一組人去練習「哈哈笑運動」(所以實驗組每天做咀嚼運動,對照組每天做哈哈笑運動)。但這裡又要注意了: 他每天做哈哈笑運動,可能因此心情開朗很喜樂。一年後你可能發現哈哈笑這一組的疼痛程度反而更低(因為他們很嘿皮),反倒是咀嚼運動組的疼痛程度比較高哩!

千萬別以為上面的例子都是鬼扯(就算鬼扯也只有扯一點啦)。如果你不能掌握好對照組的設計(或者該說是如何定義對照組),你很可能到最後不清楚研究結果該做何解釋!

2. 系統化地去分析哪些變項讓你的對照組「不純」

讓我們看看課本怎麼說吧!

Placebo effect: 「安慰劑效果」如果只發生在其中一組而不會發生在另一組, 那就會造成問題. 但另一方面, 如果我們有理由相信這個效果在兩組都會造成差不多的影響, 那就不會是太大的問題. 但很多時候真正麻煩的是: 我們根本不清楚到底是上述哪一種情況!

3. 一定要小心「control task」很可能本身就是一種intervention

所謂control task就是「用來被對照的task」,比方前面例子提到的「哈哈笑運動」,用來contrast我們真正想了解的口腔咀嚼運動。我們常常會先入為主認為這個null task是無效無用的 – 但請注意所謂「無效無用」往往是根據我們的假設而言。例如我們假設咀嚼練習會協助活動TMJ的neuromuscular system,而哈哈笑運動不會,所以它是無效無用的。但問題是我們觀察的結果是疼痛程度,哈哈笑固然不會影響TMJ neuromuscular system,卻很可能影響人的情緒而間接影響疼痛程度。所以它不但不是無效無用,它本身就是一種有效的改變疼痛經驗的intervention。

4. 兩組「對照」所產生的差異該如何解釋,是根據你的對照組資料,而非實驗組資料

這句話的意思是說,當你發現「病患組與健康組之間某某差異p<0.05」時,你第一個要問的是: 這個差異從何而來? 舉個例子,我現在要研究「恐嚇」對牙痛的影響。在實驗組中我去恐嚇病患,然後問他們治療前後疼痛的變化。在對照組中我不去恐嚇他們。結果我發現實驗組的牙痛比對照組顯著地高。這句話其實代表三種情況:

注意在以上三個圖示裡,兩組都有顯著差異。但意義差非常多! 我們往往先入為主會以為是左圖的狀況,也就是恐嚇的情況下,讓治療前後疼痛經驗的變化升高。假如這是我們的假設,那麼我們會很害怕看到右圖的情況: 右圖告訴我們,同樣兩組有顯著的差異,事實上在恐嚇阻並沒有改變什麼,真正發生變化的是對照(無恐嚇)組 – 因為沒有恐嚇,這些病人可能因此比較安心,結果治療完的疼痛程度反而更低 (同樣是p<0.05,但解釋與我們的假設完全不同!)

所以記得「與對照組發生顯著的差異」這件事並不是那麼了不起,應該要了解的是「對照組實際上發生了什麼」,唯有了解這件事,你才能去解釋這個組間差異到底意味什麼!

5. 如果你真的無法「消除」某個因素的影響,那麼就研究它!

其實有時候與其絞盡腦汁要把某個因素「對照掉」,不如乾脆研究它。例如疼痛程度往往和焦慮程度相關,你或許很難去比較「相同焦慮程度下,不同疼痛的效果」,既然如此何不乾脆把焦慮與疼痛程度兩者一起研究? (我們以後會講到,這就是factorial design厲害的地方。)