實驗設計1 - 實驗設計簡介

[回到目錄]

1. 研究設計

以下是台北榮民總醫院人體試驗委員會審查書的表格, 我們藉這個例子來思考<研究設計>到底有哪些重要的概念.

研究模式

介入性研究

(1) 研究目的:□治療 □預防 □診斷 □支持療法 □篩檢 □衛生政策 □基礎醫學

□其他

(2) 隨機分配:□單一組別 □隨機分配 □非隨機分配

(3) 盲性試驗:□開放 □單盲 □雙盲 □三盲

(4) 對 照 組:□安慰劑 □主動(active) □歷史 □劑量比較 □無

(5) 介入模式:□單組 □雙組平行 □雙組交叉 □3組以上

(6) 研究評估結果(end point):

□安全 □療效 □安全/療效 □生物等效性 □生物有效性 □藥物動力學

□藥效學 □藥物動力學/藥效學

觀察性研究

(1) 觀察模式:□世代研究 □病例對照研究 □病例研究 □個案交叉研究

□生態或社會學研究 □家族研究 □其他

(2) 資料收集期:□回顧性 □前瞻性 □橫斷性 □其他

(3) 生物檢體保留:

□非DNA萃取檢體 (固定組織、電解質)

□保留DNA萃取檢體 (冷凍組織切片)

□無

2. 實驗設計

我們每天都在弄實驗! 老師遇到學生問的第一句話是「實驗進度到哪裡了? 」,學生彼此見面的第一句話也是「啊實驗弄怎樣啊~」,我們真的要變成實驗的奴隸嗎? 為什麼得這樣飽受實驗的摧殘?

其實換一個角度想, 在研究生學習的過程中,能夠「有一個好的實驗去做」,這是一種福氣! 為什麼? 因為我們最後想要論文口試過關畢業, 前提是我們的研究結果能夠說服大家。但不是每一種研究結果都具有說服力 – 如果今天我不做實驗,完全靠我自己的推想得到某種結論,然後寫成論文去闖關, 搞不好大家都不相信我!

但另一方面我有實驗的證據去佐證我的論點 – 這時候「實驗」反而變成我的好朋友,更正確地說是我的「打手」! 老師可不能隨便認為我亂講喔,因為我有實驗證據支持我的說法。所以實驗不是敵人,是朋友,是靠山 – 差別只是這個實驗設計得好不好,他到底能成為一個強而有力的靠山,或只是一個幫不上忙(證據無說服力)的懶朋友。

切記,把實驗當朋友 – 你越去了解它,它就越是你的靠山!

Research Design

(下列表格參考並改編自C. Moorhead,University of New Hampshire,原始網路連結

http://www.dartmouth.edu/~oir/docs/Types_of_Experimental_Designs_Handout.doc)

The "One-Shot Case Study"

Treatment

X

Post-test

O

· No control group. This design has virtually no internal or external validity.

典型的例子就是case report。這種研究其實不能算嚴謹的實驗型(experimental)研究,只能說是一種觀察結果。你很難說觀察結果(post-test)推論出來的結論必然與treatment有關(為什麼?)因此這種研究方法不具有internal validity。注意,你根據case report得到的「結論」也無法推論到群體 – 不管你的cases數目有多大都不行! (很多人以為case report觀察的cases越多結論就越「有效」,這是錯誤的想法!)

2 Group,Post-test Comparison

Treatment

X

Post-test

O

O

· The main advantage of this design is randomization。The post-test comparison with randomized subjects controls for the main effects of history,maturation,and pre-testing; because no pre-test is used there can be no interaction effect of pre-test and X。Another advantage of this design is that it can be extended to include more than two groups if necessary.

典型的例子是「比較某些治療方法效果」的研究。因為現在你有了對照組(non-Treatment),你就可以推論你觀察到的結果是treatment造成的。不過這裡要小心一件事,我們先前討論過 – 到底什麼是對照組? 它應該是「完全什麼事都不做」? 還是應該是一個placebo組? 記得,你真正能推論出來的結論,其實取決於你的對照組到底做了什麼 ; )

3 One group Pre-test,Post-test

Pre-test

O

Treatment

X

Post-test

O

· Minimal Control。There is somewhat more structure,there is a single selected group under observation,with a careful measurement being done before applying the experimental treatment and then measuring after。This design has minimal internal validity,controlling only for selection of subject and experimental mortality。 It has no external validity.

這個可以當成是case study加強版,像longitudinal study基本上就是根據這樣的設計。它有一個對照組: 就是「過去的自己」,也就是within-subject control。假使沒有pre-test(不知道自己到底是什麼樣子),我們就很難確定觀察到的結果(post-test)到底是因為treatment造成的,或是「自己本來就是這樣子」。如果套用在行為實驗裡,pre-test就是告訴我們這個受試者行為的基態(baseline) 。 特別注意pre-test和post-test必須是一樣的,這樣才能反映出這個基態受到treatment的改變。

但這種做法還是不夠完善。記得我們曾經討論過confounding factor中有一項是nature history – 如果今天pre-test和post-test中間時間差了很長一段時間,例如你要研究咀嚼功能,你去比較一個人30歲和60歲的變化,那肯定有問題(隔了三十年,該考慮自然老化的效果)。且你也必須排除這段時間內,是否有其它「不小心的干擾」 – 你以為只有你的treatment,搞不好這之間(意料外)的intervention比你想像的更多哩!

4A Two groups,Nonrandom Selection,Pre-test,Post-test

· The main weakness of this research design is the internal validity is questioned from the interaction between such variables as selection and maturation or selection and testing。 In the absence of randomization,the possibility always exists that some critical difference,not reflected in the pretest,is operating to contaminate the posttest data。 For example,if the experimental group consists of volunteers,they may be more highly motivated,or if they happen to have a different experience background that affects how they interact with the experimental treatment - such factors rather than X by itself,may account for the differences。

4B Two groups,Random Selection,Pre-test,Post-test

· The advantage here is the randomization,so that any differences that appear in the posttest should be the result of the experimental variable rather than possible difference between the two groups to start with。 This is the classical type of experimental design and has good internal validity。The external validity or generalizability of the study is limited by the possible effect of pre-testing。The Solomon Four-Group Design accounts for this.

這兩種都是我們常見的實驗設計,在前一個設計,我們遇到的問題是post-test > pre-test的結果很可能只是treatment的效果,還包括factor A,B,C的效果。但現在因為有了對照組,我們只要比較E > C,就可以抵銷掉這個factor A,B,C的效果。所以我們更可以有信心說能找到treatment本身的影響。

以上兩種設計最大的差異是在randomization。如果還記得先前的討論(Ch5),我們很難控制的是受試者本身 – 如果今天對照組和實驗組本身就很不一樣,那就算你找到了treatment的效果,會不會這個效果「只有在這一群實驗組受試者才有效」?也就是上面說的,treatment與subject(group)之間有interaction。為了避免這種情況,你可以做(1) matched group或是(2) randomization。

這裡你可以比較一下2和4的不同,差異似乎只在於有沒有pre-test而已。我們往往會覺得多做一個pre-test不是更好? 所以4一定比2要來得更好 – 仔細想一想, 很多時候2(不做pre-test)可能是更好的設計!

順帶一提,要分析這種實驗設計的統計方法有很多,其中一定要學習的是2x2 ANOVA,所謂2x2就是同時分析兩個變項,在這裡就是「組別」(實驗組或對照組),「測試階段」(pre-test或post-test)。你可以同時分析這四種組合(2x2)的觀察結果。例如

5 Solomon Four-Group Design

· This design overcomes the external validity weakness in the above design caused when pre-testing affect the subjects in such a way that they become sensitized to the experimental variable and they respond differently than the unpre-tested subjects.