課程特色
元培醫事科技大學企業管理系之碩士班大數據分析課程引入AI數據分析方法,在課堂上運用「數學AI建模」軟體,培訓學生對時間序列資料之數據分析能力。
緣由
大數據分析是各種數據分析方法和巨量資料結合在一起所形成的分析技術。從原本的Data analysis到Big data analysis,再分支出主流電腦科學之Big data analytics。從原本分析方法為主,轉為分析工具或技術為主。不過,對管理專業人員來說,大數據分析仍以分析方法與分析結果,甚至更進一步是判讀數據分析結果,為其所需的決策參考所用。因此,針對符合人員所需之能力培養設計出「大數據分析」課程並不會與資訊相關系所相同或相似,而是更偏向數據分析和數據分析結果的判讀。
然而,隨著大數據技術併入人工智慧後,雖然人工智慧目前在數據分析上並未獲得理想成果,但在文字、圖像、影音等以標記分類為主的數據上取得具應用性的成果。對多數的企業數據來說,數字型和非數字型的數據可說是前者更需要被分析且客觀。因此,如何將人工智慧引入到數字型的數據分析就值得被教育體系和企業所關注。
另外,企業所累積的數字型數據通常都是時間序列資料。單就時間序列資料所乘載之時間因素就值得被挖掘,並成為決策關鍵資訊。然而時間對時間序列資料之影響如何引入人工智慧的運算和判斷是個問題。
迴歸分析
時間序列資料最常見的分析方法為統計學之迴歸分析法。傳統的迴歸分析法為直線迴歸(簡單迴歸和複迴歸)。
前提:迴歸線誤差最小原則/最準原則
假設:
條件期望值為直線模式
常態分配
同質變異數
前後獨立
迴歸線數學式:Y = E(Y|X) = β0 + β1 X + ε
目標:找出β0和β1的估計值
方法:根據前提,以最小平方法建立誤差平方和的函數,進行微分後得到目標。或者以最大概似法和常態分配假設,建立概似函數,然後進行微分後得到目標。
此時其實有隱藏的分析前提!
分析人員自己認定:
數據(X,Y)要多少筆
跑數據時是一次性導入數據後,產出一條迴歸線
這有什麼問題呢?
如前所述,真正在實務計算迴歸線時,分析人員已經在訓練過程中會自己認定多少筆數據合適,例如根據他們的問題而切割數據,然後跑數據時,是將他們認定的所有數據一次性計算出迴歸線。確實!這樣得到的迴歸線同樣滿足前提的誤差最小原則,但是這載入的數據量(數據範圍)是分析人員認定的。如果數據可以自己在數據當中自己去認定多少筆形成一條迴歸線,那數據會怎麼選?
沒錯!如果用人工智慧替代這些分析人員,由人工智慧來代表數據,判斷該認定多少筆形成一條迴歸線,那麼分析人員導入的數據就很可能不是一條迴歸線,而可能是多條回歸線。因為人工智慧會根據迴歸分析方法的前提去判斷:迴歸線有沒有最準(誤差最小)。
培訓
「數學AI建模」軟體引進課程當中,可解決企業面對時間序列的數字型數據所乘載之時間因素,並且還能提供較統計學之迴歸分析更多的結果。
對數據分析、大數據分析、人工智慧有基本的認識
了解數字型的數據可運用統計學迴歸分析幫助找到時間為自變數下的迴歸線(又可稱為趨勢線)
每週課程以股價為標的,進行數據更新後產生精準趨勢。
長期追蹤的精準趨勢進行前後比對,以及獲得最新趨勢之特徵起訖日期、趨勢方向、持續時間、平均變動情況。
⭐起訖日期會因為新趨勢形成,變成趨勢轉折點。
⭐趨勢持續時間不同於傳統各種分析方法,真實呈現數據規律特徵,所以每條趨勢線的持續時間可能相同也可能不同。
⭐平均變動情況,即趨勢斜率。相較於傳統分析方法更具備趨勢期間內對數據的代表性。
透過做中學的方式,讓學生在每週動手更新數據與操作軟體的過程中,習慣軟體使用與更新數據,並且因為將可自動化操作程序的動作,以教育軟體呈現,讓學生了解自動化流程中的每個程序,知曉所有程序與人工智慧計算、判斷都是可被客觀驗證的。