實驗設計4：假設檢定

如何寫出一個「好」的研究假設？

1. 研究假設是什麼？

或許這樣有一點武斷，但我們可以說研究假設是科學研究最重要的一環。因為他具有「承先啟後」的重要性。科學方法一開始告訴我們要仔細觀察，不論是根據臨床經驗，根據pilot study或是文獻回顧，形成一種「想法」。接著，我們再來做實驗去驗證這種「想法」有沒有道理。基本上，我們可以把這種「想法」是為是研究假設的核心，簡言之就是「我想知道到底是否證據支持這種說法」的這種「說法」。

這裡，首先就要釐清一件事：研究假設和研究問題不同。研究問題的重點是提出研究的目標與方向，但未必能提出一個可供驗證的論點。研究假設則是一種可供驗證的「說法」。所以在文法上，研究假設是一個「陳述句」。這和研究問題(通常是問句或是一段詞組)是很不同的。例如：

研究問題：老人缺牙數目是否與失智症的風險有關?

研究假設：老人缺牙數目越多，則失智症風險越高。

請注意陳述句的特徵就是，它是一個在邏輯上可以被判定為真或偽的語句，且兩者一定是互相對立排斥的。例如「老人缺牙數目越多，則失智症風險越高.」若為真，那麼「老人缺牙數目越多,失智症風險並未增高」就不可能成立。換言之，如果我們找到的證據，發現老人缺牙數目越多，不見得就比較常得失智症 – 也就是說對立的假設為真 – 那麼我們就得說，最初的研究假設不成立。

所以這裡必須先注意的是，研究假設是一句描述研究變項之間關係的陳述句。他是說明某種關係(例如X越高Y越低，或是A比B強，或是X存在)。這種關係是可以被推翻，可能會錯的(視乎我們找到怎樣的證據)。所以我們可以想像研究假設的本質是一種「猜想」，是我們在找到證據前，對研究變項之間的關係，所做的最合理的猜測。

2. 研究假設有哪些要素?

前面提到研究假設是描述研究變項之間的關係，所以他最重要的要素就是「研究變項」 - 一個研究假設必須清楚說明你到底要研究哪些變項。

例如「老人缺牙數目越多，則失智症風險越高」顯然這裡討論兩個變項，一個是老人缺牙數目，一個是失智症風險。看起來這個假設說明得非常清楚。但請記得假設是用來驗證其正確性的，所以對這些變項的定義必須「事先」就說明清楚。

例如老人缺牙數目，這是指自然牙，還是說裝上假牙以後的數目? 假牙包括活動還是固定假牙? 另外失智症風險是怎麼計算? 是指10年內產生失智症的機率? 還是只一年後是否產生失智症?

這裡就必須說明科學方法強調的是預測與獲得證據 – 和很多人想得剛好相反，科學家並不是毫無目標，先一籮筐弄出一大堆數據，再開始「看圖說故事」好像發現什麼驚人的理論。其實大部份科學家是反過來，先做出預測(成立假設)然後再看看實驗證據支持或推翻這個假設。所以我們必須一開始就把假設描述得夠嚴謹，夠精確。

說到嚴謹與精確，研究假設的第二個主角就是「關係」：這些變項之間存在哪些關係? 例如研究探討了台北與高雄小學生的身高和體重，那麼我們想驗證的說法是 (1) 台北小學生的身高越高，體重越重，還是(2) 台北小學生的身高比高雄小學生矮，還是更複雜的 (3)台北小學生的身高與體重成正相關，但高雄小學生的身高與體重則無顯著相關性 – 這個關係描述得越精確，假設的意義就越明顯。

上面的例子中(3)已經到了我們所謂「統計假設」的階段，也就是說，要將原本的研究假設轉化成一個可以用統計方法加以檢定的假設。例如「X越高Y 越重」，就可以透過統計上的相關分析去探討兩者個關係。很多時候研究假設會直接以統計假設的面貌來呈現，原因就是這樣可以更清楚，精確地說明兩者的關係。同樣地，上面(2) 這個假設，如果用更精確的統計學語言來說，可能就是「台北小學生的平均身高在統計上顯著地低於高雄小學的平均身高」.

3. 什麼是「好」的研究假設?

除了上面提到的兩點(變項定義要清楚，關係要描述清楚)，常看到同學的研究假設不太理想，還有幾點原因：

A. 文獻回顧做得不夠，不懂為什麼會這樣假設：很多同學因為想強調假設的重要性，所以一劈頭就寫了「本研究的假設是兒童聽古典音樂會比較乖看牙齒」。但問題是，你怎麼知道會「比較乖」? 有沒有可能太多音樂反而讓小朋友太high? 這個假設(這種說法)的根據是什麼? 這就必須建立在文獻與理論的回顧必須充分。這就是從「假設是如何建構出來」這層面，來看一個假設好不好.

B. 忽略了假設的「前提」：在臨床與人類行為的研究裡，很多變項之間的關係錯宗複雜。也就是很多時候我們假設成立與否，要看是放在哪個前提下去討論。例如「修磨牙齒的時間越久，修磨出來的牙齒就越漂亮」。這句話如果放在牙醫系學生上課時，很可能是成立的。但如果放在開業牙醫的場合 – 因為有看診時間的限制，不可能花太多時間求得盡善盡美 – 很可能就不成立。所以在描述假設時，需要注意一些前提 – 這些前提往往就與實驗的取材(到底研究牙醫師或牙科學生)或環境(修磨牙齒是指診所的工作，還是學校課堂演練) 有關。這些因素都是我們在描述假設時需要說明清楚的.

C. 忽略了假設的「條件」(condition)：前面提到的假設(小學生，老人缺牙etc.)都是一種靜態性的比較，從實驗設計的角度來看，不需要操弄什麼獨變項，我們只要把資料收集好做正確的觀察就可以了解這個假設是否成立。但對於實驗性質的研究，我們要討論的假設，就是某種「條件」對於觀察變項的影響。例如「只要每天吃三顆以上的維他命，就可以降低口腔癌的風險」。這句話在文法上屬於一種「條件句」，也就是「降低口腔癌風險」這件事，必須建立在前一個條件成立(每天都乖乖吃三顆維他命)。在探討這類型假設時，同學往往著重在「降低口腔癌風險」，例如討論很多有關口腔癌病變的病理機制。但同要重要的是「吃三顆維他命」這件事 – 萬一打從一開始，病人就沒有乖乖吃藥? 萬一病人隨自己高興，不是每天吃三顆而是每兩天吃5顆，這樣可以嗎? – 遇到這種條件假設(conditional hypothesis)，如何精確地描述這個「條件」(怎麼吃，吃幾顆)往往是看出一個假設嚴謹性的關鍵。

4. 再談「統計假設」

前面提到研究假設與統計假設之間的轉換，我常覺得這可能是同學一開始最弱的一環。主要原因之一除了對自己研究的題目尚不熟悉以外，還有就是對於統計方法也不熟悉。但我非常建議同學：越早把你的統計假設建立起來，你就越清楚之後要做怎樣的分析，也就越清楚自己可能會得到怎樣的結果。往往看到同學即使要論文答辯了，還不太清楚「為什麼要做這樣的統計分析」，這是很嚴重的問題。以下幾點可供參考:

釐清每個變項的單位

釐清每個變項的測量尺度

了解變項之間關係的方向性

例如身高(cm)體重(kg)，這些是很明顯的。那「失智症風險」呢? 是指發生失智症的比率(%)，還是「簡易智能量表」測得的分數(是原始分數還是標準劃分數)? 釐清單位往往是瞭解這個變項本質最重要的工作。

統計學教我們觀察值可能是不連續的類別或是連續變量，可能是名目尺度或順序尺度或是比率尺度 – 這些性質都會影響到我們後續該使用哪些統計檢定。

例如，身高往往呈現常態分佈，可以用平均值確描述，可以用t-test這些均值檢定去比較。而疼痛分數很可能是順序尺度(強烈疼痛」中度疼痛，但不知道痛多少)，因此可能只能用以排序為基礎的統計方法去分析。

這件事對應了統計檢定中「單尾」與「雙尾」的概念。以身高比較為例，我們的假設是「台北學生比高雄學生來得高」還是「台北學生和高雄學生的身高有差異」? 注意後者事實上包含了前者 (前者可以算是後者的一個特例)。另外在相關性研究中，我們常說「假設缺牙數與失智症風險有關」，這其實是一個雙尾的概念，也就是「正相關」與「負相關」都是我們考慮的方向。

但另一方面，「嚼檳榔的數量越多，口腔癌發生的風險高」，這是一個只有單一方向(單尾)的假設。請注意單一方向的假設往往更具有臨床上的實務意義，因為你做了一個更精確的預測：不只告訴你嚼檳榔與口腔癌有關，還告訴你嚼越多越嚴重！但要做出這樣一個假設，也就意味著更需要充分回顧文獻與理論。

Google Sites

Report abuse