元培醫事科技大學企業管理系之大學部大數據分析或視覺化課程引入AI數據分析方法,在課堂上運用「數學AI建模」軟體,培訓學生對時間序列資料之數據分析能力。
大數據分析是各種數據分析方法和巨量資料結合在一起所形成的分析技術。從原本的Data analysis到Big data analysis,再分支出主流電腦科學之Big data analytics。從原本分析方法為主,轉為分析工具或技術為主。不過,對管理專業人員來說,大數據分析仍以分析方法與分析結果,甚至更進一步是判讀數據分析結果,為其所需的決策參考所用。因此,針對符合人員所需之能力培養設計出「大數據分析」課程並不會與資訊相關系所相同或相似,而是更偏向數據分析和數據分析結果的判讀。
然而,隨著大數據技術併入人工智慧後,雖然人工智慧目前在數據分析上並未獲得理想成果,但在文字、圖像、影音等以標記分類為主的數據上取得具應用性的成果。對多數的企業數據來說,數字型和非數字型的數據可說是前者更需要被分析且客觀。因此,如何將人工智慧引入到數字型的數據分析就值得被教育體系和企業所關注。
另外,企業所累積的數字型數據通常都是時間序列資料。單就時間序列資料所乘載之時間因素就值得被挖掘,並成為決策關鍵資訊。然而時間對時間序列資料之影響如何引入人工智慧的運算和判斷是個問題。
時間序列資料最常見的分析方法為統計學之迴歸分析法。傳統的迴歸分析法為直線迴歸(簡單迴歸和複迴歸)。
前提:迴歸線誤差最小原則/最準原則
假設:
條件期望值為直線模式
常態分配
同質變異數
前後獨立
迴歸線數學式:Y = E(Y|X) = β0 + β1 X + ε
目標:找出β0和β1的估計值
方法:根據前提,以最小平方法建立誤差平方和的函數,進行微分後得到目標。或者以最大概似法和常態分配假設,建立概似函數,然後進行微分後得到目標。
此時其實有隱藏的分析前提!
分析人員自己認定:
數據(X,Y)要多少筆
跑數據時是一次性導入數據後,產出一條迴歸線
這有什麼問題呢?
如前所述,真正在實務計算迴歸線時,分析人員已經在訓練過程中會自己認定多少筆數據合適,例如根據他們的問題而切割數據,然後跑數據時,是將他們認定的所有數據一次性計算出迴歸線。確實!這樣得到的迴歸線同樣滿足前提的誤差最小原則,但是這載入的數據量(數據範圍)是分析人員認定的。如果數據可以自己在數據當中自己去認定多少筆形成一條迴歸線,那數據會怎麼選?
沒錯!如果用人工智慧替代這些分析人員,由人工智慧來代表數據,判斷該認定多少筆形成一條迴歸線,那麼分析人員導入的數據就很可能不是一條迴歸線,而可能是多條回歸線。因為人工智慧會根據迴歸分析方法的前提去判斷:迴歸線有沒有最準(誤差最小)。
「數學AI建模」軟體引進課程當中,可解決企業面對時間序列的數字型數據所乘載之時間因素,並且還能提供較統計學之迴歸分析更多的結果。
對數據分析、大數據分析、人工智慧有基本的認識
了解數字型的數據可運用統計學迴歸分析幫助找到時間為自變數下的迴歸線(又可稱為趨勢線)
透過產生圖片,將圖片分享到社群平台與共同協作建構出課程成果網站。同學們在學習過程中不只學會軟體操作、在股價的走勢上看到趨勢線,輔助了解股價趨勢變化。隨著每週新增尚未加入的股價,產生最新的趨勢圖。在網站上,每檔股票就能看到長期追蹤下的趨勢變化。
整體的課程教學當中,符合「做中學」的技職培訓精神。同時在實務操作過程中,讓原本只能課本、板書與紙本考試(或報告)的教學方式轉為更加有助於學生在職場上的職能培訓。
透過課程每週更新數據,獲得新的趨勢圖,建構長期追蹤的學習。集結起過去所做的趨勢圖,觀察與歸納出趨勢變化,從做中學當中獲得大數據建模、趨勢分析、視覺化表現等的技能與知識。