國立臺灣大學生物統計學程

統計應用小小傳

在十九世紀末,英國政治家卡爾皮爾遜(Karl Pearson)藉由觀測質與期望值的比較,首先發展分布適合性度(Goodness-of-Fit)的統計方法,而在同一時期達爾文的表弟高騰(Francis Galton)在研究子女與父母在智商、身高等數量性狀間的關係時,發展出迴歸分析(Regression Analysis)。而迴歸分析在目前二十ㄧ世紀已成為經濟、管理、醫學、生態、環境、工程與品管上重要的研究工具。在二十世紀初,英國統計大師R.A. Fisher 在 Rothamsted 農業試驗場工作時,發展出田間試驗的各種不同設計及變方分析(Analysis of Variance)與變積分析(Analysis of Covariance)方法來分析數據。這些試驗設計與分析方法不但是統計理論與方法上的偉大成就,更對二十世紀糧食的增產與農作物的改良具有不可磨滅的貢獻,而在二十世紀50年代英國的B. Hill將Fisher在農業上的隨機試驗設計應用在醫學與藥物評估上,發展出隨機雙盲的臨床試驗之基礎,對人類健康福祉做出了重大的貢獻。另外,在美國國家衛生研究院任職的J. Cornfield 將統計方法應用在流行病學上證明抽菸與肺癌間的因果關係。自孟德爾在研究碗豆的遺傳性狀與T.H. Morgan 研究果蠅遺傳特徵以來,統計一直是遺傳與育種上不可缺少的研究工具,並且發展出許多研究遺傳的統計方法。另外,生物統計在生態保育與環境保護之應用亦有重大的貢獻。

統計在二十世紀除了在農業、遺傳、生物與醫學方面做出了重大的貢獻外,對於各工業的產品產量與品質的提昇亦有不可磨滅的成就,如在二十世紀初筆名為學生氏(Student)的戈斯特(William Sealy Gosset)在牛津大學畢業後進入位於愛爾蘭都柏林市的吉尼斯釀造公司(Guinness Brewing Co.),即利用統計方法於改善釀造啤酒的技術及提升啤酒的品質與產量,並獨立發展出目前在初等統計課必教的小樣本的學生氏t-檢定法(Student t-test)。另外在1940年左右,美國氰胺公司任職的化學家威爾考特森(Frank Wilcoxon)在應用上述學生氏t-檢定法時發生困擾,在資料不符合常態分布或含有離群值(Outliers)時,對學生氏t-檢定法的結果影響甚大,而且與直覺判斷不合,為了要解決此一在實際應用上的問題,他發展出第一個以排序資料的排列組合為基礎的 Wilcoxon Rank Sum Test 而開創統計學全新的領域-無母數統計學(Nonparametric Statistics)。在應用R.A. Fisher於農業與生物研究所發展出的試驗設計在工業上遇到一些困難,最重要的問題在試驗材料不足導致影響試驗因素甚大,所以美國威斯康新大學(University of Wisconsin)統計系前系主任亦為R.A. Fisher的女婿博克斯教授(G.E.P. Box)與 W.G. Hunter 及 J.S. Hunter兩位教授發展出一系列的不同部分複因子設計(Fractional Factorial Design)解決這些在應用上的問題,但同時亦開始開拓實驗設計的一個新領域。

雖然統計學許多方法均是在實際應用上需要而發展出來,但統計理論上的研究卻是這些新統計方法的基石。首先R.A. Fisher在1930年左右提出評估統計量的標準方法為一致性 (Consistency),不偏性(Unbiasedness)及有效性(Efficiency),並發展出目前標準尋求最佳統計量之最大概似估算法(Maximum Likelihood Estimation);而卡爾皮爾森的兒子艾根皮爾森(E. Pearson)與波蘭統計學家傑瑞尼曼(Jerry Neyman)利用數學建立統計假設檢定(Statistical Hypothesis Testing)之理論架構基礎的尼曼-皮爾遜定理及定義目前在各領域均使用的P-value;另外,尼曼在1934年提出現在已普遍於所有統計分析的信賴區間(Confidence Interval)之觀念。

統計各種理論與方法在經濟學及財務金融方面亦有傑出的貢獻,例如於2006年11月16日去世的諾貝爾經濟獎得主美國芝加哥大學的傅利曼教授(Milton Friedman)是二十世紀最為傑出的計量經濟學者,在貨幣理論、消費分析及總經或個體經濟學上有重大的貢獻,但是傅利曼教授亦是一位傑出的統計學者,曾受教於哥倫比亞大學的荷特林教授(H. Hotelling)並發展出處理兩個變因的無母數方法 Friedman Test,他的理論亦發表於頂尖的統計期刊,如 Journal of the American Statistical Association 與 Annals of Mathematical Statistics。此兩期刊目前亦仍為國科會統計學們認定的重要指標期刊。

美英各大學均了解統計是一門理論與應用並重的科學,所以在各大學除了設立統計系外,另紛紛設置統計實驗室(Statistical Laboratory)開創統計諮詢的先鋒。最有名的為美國愛荷華州立大學(Iowa state University)斯內德克教授(G.W. Snedecor)所創立的統計實驗室,後來成為世界上重要的統計研究中心;而斯內德克教授的學生科克斯教授(G. M. Cox)後來到北卡州立大學(North Carolina State University)創立另一個統計系,亦成為目前統計教學與研究的另一個重鎮;除此知外,美國肯塔基大學(University of Kentucky)則是於1976年由來自北卡州立大學的安德遜(R.L. Anderson)教授所創立。這是一個大學優良統計研究教學單位的畢業生開花結果的典型例子。

經過二十世紀的努力,統計學已在二十一世紀成為各領域如生物、生命科學、農業、醫學、公共衛生、經濟、政治、管理、會計、財金、國企、社會、工程、電子、資訊及品管各方面收集及分析資料與制定決策時必備的工具。許多統計的理論與方法也是自各領域的應用發展而來,所以統計科學是一個極重要跨領域的研究平台。而且成為評估這項產品的重要工具。


統計軟體介紹

R 統計軟體

【 簡介 】

R 是一套統計分析及繪圖的語言及軟體,最初是由紐西蘭奧克蘭大學的Ross Ihaka及Robert Gentleman兩位教授鑒於當時的統計教學實驗室使用的麥金塔電腦,沒有合適的商業用統計軟體,兩人因而仿S語言的架構開發R來輔助統計上的教學,後來R軟體的開發人員逐漸增加並加入自由軟體基金會的GNU計畫,經過多年發展後,R目前已是一套功能強大且廣為使用的自由軟體。

【 特色 】

․免費

․有效的資料處理及存取能力(可與C, C++ 和Fortran等程式連結)

․方便的矩陣操作與運算能力

․完整而連貫的資料分析能力(有大量套件程式可供下載)

․強大的繪圖功能(可參考R graph gallery網站)

․簡單且發展完善的程式語言環境(S 語言)

․可在UNIX (含FreeBSD 與Linux)、Windows 和MacOS執行

【 相關連結 】

1. R 網站:http://www.r-project.org/

2. R graph gallery:http://addictedtor.free.fr/graphiques/

3. Bioconductor:http://www.bioconductor.org/

4. R 相關文件資料下載:http://cran.r-project.org/other-docs.html

5. 臺大統計教學中心R統計實習教材:http://www.statedu.ntu.edu.tw/lab/index.asp

SAS 統計軟體

【 簡介 】

SAS的全名是Statistical Analysis System,最早由美國北卡羅萊納大學統計系教授 A. J. Barr 與 J. H. Goodnight 共同發展,用於協助數學統計分析的軟體。於1972年首次公開出售,之後於1976年由Jim Goodnight博士及John Sall博士等人成立SAS公司,並推出正式版的SAS軟體。SAS軟體在經過多年發展後,除了核心的統計分析功能外,還增加了各行業的資料分析與預測、決策支援等系統,目前使用SAS的單位遍佈全球各地各領域,包括金融、醫藥衛生、生產、運輸、通訊、科學研究、政府和教育等領域,對於統計或資訊工作者來說,使用SAS軟體幾乎是必備的技能之一。

【 特色 】

․完整豐富的統計程式套件及各種功能強大的模組

․詳盡的程式及統計方法說明文件

․良好的售後服務及問題支援

․軟體並非買斷而是在期間(通常是1年)內授權使用

․早期版本為文字操作界面,近年也發展了點選式操作介面

【 相關連結 】

1. SAS版權及軟體下載(臺大教職員生使用):https://web2.cc.ntu.edu.tw/p/s/login2/p1.php

2. SAS公司:http://www.sas.com/

3. SAS臺灣:http://www.sas.com/offices/asiapacific/taiwan/

4. 美國UCLA SAS線上學習網站:http://www.ats.ucla.edu/stat/sas/

5. 臺大統計教學中心SAS電腦實習教材:http://www.statedu.ntu.edu.tw/lab/index.asp

6. 臺大柴惠敏老師SAS學習網站:http://www.pt.ntu.edu.tw/hmchai/SAS/Index.htm

SPSS 統計軟體

【 簡介 】

SPSS早期為Statistical Package for the social Sciences的縮寫,原本是在社會科學研究的商業統計軟體,後來功能逐漸加強,加入許多統計分析相關程式套件,逐漸受各行各業使用。產品定義也轉為 Statistical Product and Service Solutions。SPSS以其試算表的介面及點選式的操作著名,對於部分不擅於編寫程式的使用者來說,SPSS無疑是相當容易上手的一套軟體。SPSS公司於2009年被IBM公司併購,自19版開始,軟體正式名稱為IBM SPSS Statistics。

【 特色 】

․豐富的統計程式套件

․輕鬆繪製清楚精緻的統計圖表

․易上手的點選式操作介面(SPSS也具有程式撰寫的能力)

․軟體中不同的套件分開計價,可買斷版權

․清楚的輔助說明


【 相關連結 】

1. SPSS公司:http://www.spss.com/

2. SPSS臺灣代理:http://www.sinter.com.tw/SPSS/

3. 美國UCLA SPSS線上學習網站:http://www.ats.ucla.edu/stat/spss/default.htm

4. 臺大統計教學中心SPSS電腦實習教材:http://www.statedu.ntu.edu.tw/lab/index.asp

※臺大計算機中心部份電腦裝載SPSS軟體,臺大學生可至電腦教室使用。

Microsoft Office Excel

【 簡介 】

微軟公司所開發的Excel系列軟體,不僅是使用方便且功能完整的試算表軟體,還包含一些統計相關的程式套件,對於簡單的統計分析,一般使用者可從 <工具箱>→ <增益集>→<分析工具箱> 開啟相關程式套件使用。雖然Excel沒有進階的統計分析套件,但其方便熟悉的操作介面與易學快速上手的特色,很適合一般剛接觸統計的同學及用來解決簡單統計分析問題。

【 特色 】

․一般民眾方便取得且熟悉其操作介面

․具備基礎統計分析功能

․方便製作簡單統計圖表

【 相關連結 】

1. Office 版權軟體下載(限臺大教職員生):https://web2.cc.ntu.edu.tw/p/s/login2/p1.php

2. Excel官方網站:http://office.microsoft.com/zh-tw/excel/FX100487621028.aspx

3. 臺大統計教學中心Excel電腦實習教材:http://www.statedu.ntu.edu.tw/lab/index.asp

4. 臺大計算機中心資訊應用課程:http://mis.cc.ntu.edu.tw/register/viewcoursemain.asp (選修課程需繳交費用)