實驗設計4:假設檢定

[回到目錄]

如何寫出一個「好」的研究假設?

1. 研究假設是什麼?

或許這樣有一點武斷,但我們可以說研究假設是科學研究最重要的一環。因為他具有「承先啟後」的重要性。科學方法一開始告訴我們要仔細觀察,不論是根據臨床經驗,根據pilot study或是文獻回顧,形成一種「想法」。接著,我們再來做實驗去驗證這種「想法」有沒有道理。基本上,我們可以把這種「想法」是為是研究假設的核心,簡言之就是「我想知道到底是否證據支持這種說法」的這種「說法」。

這裡,首先就要釐清一件事:研究假設和研究問題不同。研究問題的重點是提出研究的目標與方向,但未必能提出一個可供驗證的論點。研究假設則是一種可供驗證的「說法」。所以在文法上,研究假設是一個「陳述句」。這和研究問題(通常是問句或是一段詞組)是很不同的。例如:

研究問題:老人缺牙數目是否與失智症的風險有關?

研究假設:老人缺牙數目越多,則失智症風險越高。

請注意陳述句的特徵就是,它是一個在邏輯上可以被判定為真或偽的語句,且兩者一定是互相對立排斥的。例如「老人缺牙數目越多,則失智症風險越高.」若為真,那麼「老人缺牙數目越多,失智症風險並未增高」就不可能成立。換言之,如果我們找到的證據,發現老人缺牙數目越多,不見得就比較常得失智症 – 也就是說對立的假設為真 – 那麼我們就得說,最初的研究假設不成立。

所以這裡必須先注意的是,研究假設是一句描述研究變項之間關係的陳述句。他是說明某種關係(例如X越高Y越低,或是A比B強,或是X存在)。這種關係是可以被推翻,可能會錯的(視乎我們找到怎樣的證據)。所以我們可以想像研究假設的本質是一種「猜想」,是我們在找到證據前,對研究變項 之間的關係,所做的最合理的猜測。

2. 研究假設有哪些要素?

前面提到研究假設是描述研究變項之間的關係,所以他最重要的要素就是「研究變項」 - 一個研究假設必須清楚說明你到底要研究哪些變項。

例如「老人缺牙數目越多,則失智症風險越高」顯然這裡討論兩個變項,一個是老人缺牙數目,一個是失智症風險。看起來這個假設說明得非常清楚。但請記得假設是用來驗證其正確性的,所以對這些變項的定義必須「事先」就說明清楚。

例如老人缺牙數目,這是指自然牙,還是說裝上假牙以後的數目? 假牙包括活動還是固定假牙? 另外失智症風險是怎麼計算? 是指10年內產生失智症的機率? 還是只一年後是否產生失智症?

這裡就必須說明科學方法強調的是預測與獲得證據 – 和很多人想得剛好相反,科學家並不是毫無目標,先一籮筐弄出一大堆數據,再開始「看圖說故事」好像發現什麼驚人的理論。其實大部份科學家是反過來,先做出預測(成立假設)然後再看看實驗證據支持或推翻這個假設。所以我們必須一開始就把假設描述得夠嚴謹,夠精確。

說到嚴謹與精確,研究假設的第二個主角就是「關係」:這些變項之間存在哪些關係? 例如研究探討了台北與高雄小學生的身高和體重,那麼我們想驗證的說法是 (1) 台北小學生的身高越高,體重越重,還是(2) 台北小學生的身高比高雄小學生矮,還是更複雜的 (3)台北小學生的身高與體重成正相關,但高雄小學生的身高與體重則無顯著相關性 – 這個關係描述得越精確,假設的意義就越明顯。

上面的例子中(3)已經到了我們所謂「統計假設」的階段,也就是說,要將原本的研究假設轉化成一個可以用統計方法加以檢定的假設。例如「X越高Y 越重」,就可以透過統計上的相關分析去探討兩者個關係。很多時候研究假設會直接 以統計假設的面貌來呈現,原因就是這樣可以更清楚,精確地說明兩者的關係。同樣地,上面(2) 這個假設,如果用更精確的統計學語言來說,可能就是「台北小學生的平均身高在統計上顯著地低於高雄小學的平均身高」.

3. 什麼是「好」的研究假設?

除了上面提到的兩點(變項定義要清楚,關係要描述清楚),常看到同學的研究假設不太理想,還有幾點原因:

A. 文獻回顧做得不夠,不懂為什麼會這樣假設:很多同學因為想強調假設的重要性,所以一劈頭就寫了「本研究的假設是兒童聽古典音樂會比較乖看牙齒」。但問題是,你怎麼知道會「比較乖」? 有沒有可能太多音樂反而讓小朋友太high? 這個假設(這種說法)的根據是什麼? 這就必須建立在文獻與理論的回顧必須充分。這就是從「假設是如何建構出來」這層面,來看一個假設好不好.

B. 忽略了假設的「前提」:在臨床與人類行為的研究裡,很多變項之間的關係錯宗複雜。也就是很多時候我們假設成立與否,要看是放在哪個前提下去討論。例如「修磨牙齒的時間越久,修磨出來的牙齒就越漂亮」。這句話如果放在牙醫系學生上課時,很可能是成立的。但如果放在開業牙醫的場合 – 因為有看診時間的限制,不可能花太多時間求得盡善盡美 – 很可能就不成立。所以在描述假設時,需要注意一些前提 – 這些前提往往就與實驗的取材(到底研究牙醫師或牙科學生)或環境(修磨牙齒是指診所的工作,還是學校課堂演練) 有關。這些因素都是我們在描述假設時需要說明清楚的.

C. 忽略了假設的「條件」(condition):前面提到的假設(小學生,老人缺牙etc.)都是一種靜態性的比較,從實驗設計的角度來看,不需要操弄什麼獨變項,我們只要把資料收集好做正確的觀察就可以了解這個假設是否成立。但對於實驗性質的研究,我們要討論的假設,就是某種「條件」對於觀察變項的影響。例如「只要每天吃三顆以上的維他命,就可以降低口腔癌的風險」。這句話在文法上屬於一種「條件句」,也就是「降低口腔癌風險」這件事,必須建立在前一個條件成立(每天都乖乖吃三顆維他命)。在探討這類型假設時,同學往往著重在「降低口腔癌風險」,例如討論很多有關口腔癌病變的病理機制。但同要重要的是「吃三顆維他命」這件事 – 萬一打從一開始,病人就沒有乖乖吃藥? 萬一病人隨自己高興,不是每天吃三顆而是每兩天吃5顆,這樣可以嗎? – 遇到這種條件假設(conditional hypothesis),如何精確地描述這個「條件」(怎麼吃,吃幾顆)往往是看出一個假設嚴謹性的關鍵。

4. 再談「統計假設」

前面提到研究假設與統計假設之間的轉換,我常覺得這可能是同學一開始最弱的一環。主要原因之一除了對自己研究的題目尚不熟悉以外,還有就是對於統計方法也不熟悉。但我非常建議同學:越早把你的統計假設建立起來,你就越清楚之後要做怎樣的分析,也就越清楚自己可能會得到怎樣的結果。往往看到同學即使要論文答辯了,還不太清楚「為什麼要做這樣的統計分析」,這是很嚴重的問題。以下幾點可供參考:

釐清每個變項的單位

釐清每個變項的測量尺度

了解變項之間關係的方向性

例如身高(cm)體重(kg),這些是很明顯的。那「失智症風險」呢? 是指發生失智症的比率(%),還是「簡易智能量表」測得的分數(是原始分數還是標準劃分數)? 釐清單位往往是瞭解這個變項本質最重要的工作。

統計學教我們觀察值可能是不連續的類別或是連續變量,可能是名目尺度或順序尺度或是比率尺度 – 這些性質都會影響到我們後續該使用哪些統計檢定。

例如,身高往往呈現常態分佈,可以用平均值確描述,可以用t-test這些均值檢定去比較。而疼痛分數很可能是順序尺度(強烈疼痛」中度疼痛,但不知道痛多少),因此可能只能用以排序為基礎的統計方法去分析。

這件事對應了統計檢定中「單尾」與「雙尾」的概念。以身高比較為例,我們的假設是「台北學生比高雄學生來得高」還是「台北學生和高雄學生的身高有差異」? 注意後者事實上包含了前者 (前者可以算是後者的一個特例)。另外在相關性研究中,我們常說「假設缺牙數與失智症風險有關」,這其實是一個雙尾的概念,也就是「正相關」與「負相關」都是我們考慮的方向。

但另一方面,「嚼檳榔的數量越多,口腔癌發生的風險高」, 這是一個只有單一方向(單尾)的假設。請注意單一方向的假設往往更具有臨床上的實務意義,因為你做了一個更精確的預測:不只告訴你嚼檳榔與口腔癌有關,還告訴你嚼越多越嚴重!但要做出這樣一個假設,也就意味著更需要充分回顧文獻與理論。