國科會自然處統計學門
研究重點&重點趨勢推動
研究重點
● 統計理論與方法
統計理論與方法乃統計學門之核心,針對資料特性與欲探究課題,探討模型理論並開發分析工具,大量應
用於他學門領域的量化和質化研究。從資料的形態來分類,統計方法大體上有迴歸分析、著重時間變化的
時間序列和函數分析、著重地理空間位置(甚至同時觀察時間和空間變數) 的空間統計、多變量分析和實驗
設計等。理論學派上,有頻率論(frequentist)和貝氏理論(Bayes) ;貝氏方法不同於頻率論方法主要在對模
型參數的不確定性,貝氏方法假設參數是隨機變數,而非一數值。若從對母體分布的假設與否來看,統計
方法又可分為參數方法、非參數方法(non-parametric)、和半參數方法(semi-parametric),半參數模型兼具
非參數模型的彈性與參數模型的解釋能力,在實際應用上亦廣受重視。
● 應用機率
機率學的應用領域約略分為排隊網路、財務數學、馬可夫鏈蒙地卡羅法,及演算法隨機分析等四大方向。
排隊網路探討高使用率和多種類顧客時,網路的穩定性、最佳控制法、排程法和隨機模型法等。財務數學
決定經濟市場中選擇權定價、最佳投資組合、消費選擇、以及壽險的風險控管。馬可夫鏈蒙地卡羅法協助
計算複雜情況下的機率值,多用於貝氏統計估計。而演算法隨機分析目的在分析演算法的效能。
● 生物統計
生物統計為統計理論與方法於公共衛生、醫學與生命科學領域之應用,特別針對疾病診斷與追蹤、醫藥臨
床試驗、遺傳模式與基因體特性、農作改良試驗、和環境生態等發展與推演相關試驗設計與分析技術與工
具。近年來,因新世代基因體定序技術的發展和對個人化醫療和精準醫療的重視,以及異常(或極端)氣候所
引發的生存危機(如糧食短缺、物種遷移等),吸引更多學者投入生物統計領域的研究。
● 工業統計
工業統計是工業界用來處理產品研發、製程監控及售後維修服務等所衍生的相關品質問題之所有數據分析
方法的總稱。越來越多的業界實例顯示,利用統計方法配合工程師專業知識,可有效地改善產品品質/可靠
度,進而提昇產品競爭力。工業統計的研究領域十分廣泛,最主要的有三大子領域-品質管制、實驗設計
及可靠度分析。零件製造業的 SPC (Statistical Process Control)品質管制,對製程建構適當的管制圖來監
控品質,藉由實驗設計有效收集及分析實驗數據,提供消費者產品可靠度(或長期品質)的相關資訊:不可維
修產品的平均壽命或50 百分點壽命;可維修產品的現場失效率、可用度及其維修和更換策略。
● 社會統計
社會統計探討社會中人類的各種活動和行為,包含財務、社會網絡、和教育測驗等。財務統計探討經濟行
為下各種金融工具的價格、交易量、及風險管理,資料多以時間序列的樣貌呈現。社會網絡則度量個體與
他個體之間的遠近關係,觀察集群關係的形成和疏離。教育測驗統計解釋測驗資料與受試者之間關係,包
含傳統測驗理論與現代測驗理論,後者以試題反應理論為主,推論受試者能力與試題間的關係。
● 統計計算與新興應用統計
社會活動與交易行為所產生的巨量資料造就資料採礦、機器學習的蓬勃發展,亦促成相關統計分析工具的
研發。同時,將資料視覺化將可簡化資料的結構與提昇統計結果呈現的多樣性。另外,貝氏計算的複雜與
收斂行為亦提升對演算法、計算機儲存與運算能力的倚重。Jordan 和 Mitchell 認為機器學習之目的在構建
一個能透過經驗回饋而自動修正的計算機系統,因此跨學門與資訊和資管的密切合作顯得更加重要。
重點趨勢推動
● 數據科學
數據科學蓬勃發展的結果產生了新興職業-數據科學家,數據科學家普遍具備程式撰寫與統計分析的能
力,並能結合背景知識,從資料中發掘有價值的訊息。數據科學旨在藉由分析可能大量且複雜的實際資料
以萃取訊息或輔助決策,因此每一位數據科學家都應具備嚴謹的資料分析思維與有效的分析方式,統計科
學應在數據科學中扮演中心角色。這些實際上都是統計科學一直以來發展統計方法的方向,惟現今資料紀
錄技術進步產生與以往不同特性之資料。
● 大數據分析
大數據泛指大量且複雜使得無法使用傳統軟體管理與分析的資料集,但也沒有一致的定義。Laney (2001)
所提出的 3V 描述大數據,通常具有Volume(資料量龐大)、Velocity(資料生成速度快)、以及 Variety(資料的
多樣性)的特性。涉及大數據分析的應用領域非常廣泛,將使統計學家有機會開創新的跨領域應用領域與統
計方法。