大數據視覺化

元培企管進四技選修課程

元培醫事科技大學企業管理系之大學部「大數據分析」或「大數據視覺化」課程引入AI數據分析方法，在課堂上運用「數學AI建模」軟體，培訓學生對時間序列資料之數據分析能力。

大數據分析是各種數據分析方法和巨量資料結合在一起所形成的分析技術。從原本的Data analysis到Big data analysis，再分支出主流電腦科學之Big data analytics。從原本分析方法為主，轉為分析工具或技術為主。不過，對管理專業人員來說，大數據分析需以分析方法與分析結果，甚至更進一步是判讀數據分析結果，為其所需的決策參考所用。因此，針對符合人員所需之能力培養設計出「大數據分析」課程並不會與資訊相關系所相同或相似，而是更偏向數據分析和數據分析結果的判讀。

然而，隨著大數據技術併入人工智慧後，雖然人工智慧目前在數據分析上並未獲得理想成果，但在文字、圖像、影音等以標記分類為主的數據上取得具應用性的成果。對多數的企業數據來說，數字型和非數字型的數據可說是前者更需要被分析且客觀。因此，如何將人工智慧引入到數字型的數據分析就值得被教育體系和企業所關注。

另外，企業所累積的數字型數據通常都是時間序列資料。單就時間序列資料所乘載之時間因素就值得被挖掘，並成為決策關鍵資訊。然而時間對時間序列資料之影響如何引入人工智慧的運算和判斷是個問題。

基礎：迴歸分析

時間序列資料最常見的分析方法為統計學之迴歸分析法。傳統的迴歸分析法為直線迴歸(簡單迴歸和複迴歸)。

前提：迴歸線誤差最小原則/最準原則

假設：

條件期望值為直線模式
常態分配
同質變異數
前後獨立

迴歸線數學式：Y = E(Y|X) = β0 + β1 X + ε

目標：找出β0和β1的估計值

方法：根據前提，以最小平方法建立誤差平方和的函數，進行微分後得到目標。或者以最大概似法和常態分配假設，建立概似函數，然後進行微分後得到目標。在機器學習系列則是成為損失函數，目標為損失函數極小。

此時其實有隱藏的分析前提！這些前提在人工智慧自動化過程中，變成預設(潛規則)，而非數據本身先得到的自身數學模型結果。

分析人員自己認定：

數據(X,Y)要多少筆
跑數據時是一次性導入數據後，產出一條迴歸線

這有什麼問題呢？

如前所述，真正在實務計算迴歸線時，分析人員已經在訓練過程中會自己認定多少筆數據合適，例如根據他們的問題而切割數據，然後跑數據時，是將他們認定的所有數據一次性計算出迴歸線。確實！這樣得到的迴歸線同樣滿足前提的誤差最小原則，但是這載入的數據量(數據範圍)是分析人員認定的。如果數據可以自己在數據當中自己去認定多少筆形成一條迴歸線，那數據會怎麼選？數據自己選擇時，是否會比人為預設更好，並且有效客觀揭露誤差情況？

沒錯！如果用人工智慧替代這些分析人員，由人工智慧來代表數據，判斷該認定多少筆形成一條迴歸線，那麼分析人員導入的數據就很可能不是一條迴歸線，而可能是多條回歸線。因為人工智慧會根據迴歸分析方法的前提去判斷：迴歸線有沒有最準(誤差最小)。

培訓方向

「數學AI建模」軟體本身就是專門為數字解析數學模式的人工智慧教學輔助工具。在引進課程當中，可在課堂上運用數據與運算結果，了解企業數據的規律或特徵，以求解決企業面對時間序列的數字型數據所乘載之時間因素，此外還能提供較統計學之迴歸分析更多的有效結果。

目標

對數據分析、大數據分析、人工智慧有基本的認識
了解數字型的數據可運用統計學迴歸分析幫助找到時間為自變數下的迴歸線(又可稱為趨勢線)

整體的課程教學當中，符合「做中學」的技職培訓精神。同時在實務操作過程中，讓原本只能課本、板書與紙本考試(或報告)的教學方式轉為更加有助於學生在職場上的職能培訓。

透過課程每週更新數據，獲得新的趨勢圖，建構長期追蹤的學習。集結起過去所做的趨勢圖，觀察與歸納出趨勢變化，從做中學當中獲得大數據建模、趨勢分析、視覺化表現等的技能與知識。

培訓過程

為達到產生數據的短期趨勢圖，將圖片分享到社群平台與共同協作建構出課程成果(長期追蹤)的網站，同學們在學習過程中不只學會軟體操作、學習在股價的走勢上看到趨勢線，輔助了解股價趨勢變化。

更新數據：隨著每週新增尚未加入的股價，產生最新的趨勢圖。累積得以長期追蹤所需的成果外，了解數據庫更新數據的步驟。

格式轉換：了解在人工智慧自動化流程中，數據需要經過格式轉換的動作。

軟體操作：了解在人工智慧流程中，軟體內崁在人工智慧中是如何運算數據。在教學軟體中可以看到每個運算步驟與出圖。

保存結果：軟體運算的每個過程都會有數據結果，這些數據結果會被保存下來。所以同學們會了解如何保存結果在資料庫內的動作。

展現成果：在網站上，每檔股票就能看到長期追蹤下的趨勢變化。

Page updated

Google Sites

Report abuse