🔥 歡迎加入 清華大學教育大數據微學程 FB社團!了解第一手資訊
▸講題:資料科學在產業人才研究領域的發展(1)以數據分析與爬蟲工具應用為例、
▸講者:歐宗霖 工研院產業學院研究經理
▸時間:10/27(五)9:30~11:00
▸地點:Googlemeet
▸演講大綱:
資料科學牽涉跨領域學科知識,包括資料工程、資訊管理、統計學、社會科學研究方法及各應用領域等廣泛議題。說明資料科學的基本概念與實務上的程序方法,並以數據分析與爬蟲工具應用為例,將相關的知識加以整合,讓同學在未來相關的專題研討與工作應用上,建立良好的基礎。
撰文/廖冠智 博士 日期/112年10月27日
#清華大學教育大數據微學程
#產業人才研究的數據科學
資料科學數據探勘,並不是一鍵式從資料集中進行自動判讀,而是繁複的過程,別被生成AI所騙了。😆
今天謝謝工研院產業學院研究經理歐宗霖博士Tonny來分享教育大數據產業問題,為我們學生進行業界出題與學界解題。本次演講涵蓋了資料科學的基本概念與實務應用,特別在產業部分,讓我們學生對跨領域的數據科學,有了更深入的瞭解。
Tonny真的是跨領域人才,大學背景是心理計量的背景,研究所轉戰數據科學、科技整合與企業人才培訓策略的探究上。Tonny首先說明了人才變動的時代脈絡,從農業時代到工業時代,再到現在的數位與智能時代,所需的人才與技能也在持續變遷。特別是在web2時代注重使用者生成內容,web3時代則是去中心化區塊鏈技術的興起,web4時代將會是語意網的全面應用,技術變遷對人才需求有重大影響,而資料科學正是應對當代需求的重要能力。
當然一般學生對資料科學都帶有很多幻想,不管是學生或在職者,資料科學都與我們的興趣、職涯、課業及工作緊密相連,透過學習資料科學,我們可以更了解自己、做更好的選擇,Tonny也提出自己進入職場時的心路歷程。
接著進入了資料科學的學習地圖,概述機器學習的三大概念,如監督式學習、無監督學習、強化學習等,以及神經網絡運算的原理。特別說到類神經網絡的運作像人腦一樣,是由許多神經元連結構成,透過前饋與反饋(forward/back propagation)來訓練參數,使網路學會辨識模式。這也是資料科學的重要基礎。另外,實務應用部分,Tonny分享了以Wikipedia資料進行資料探勘的例子,說明了資料科學在業界專案中的工作流程,從定義目標、資料收集、探勘、模型建置到決策支援的過程,也提及資料科學可廣泛應用在產業的商業智能,如利用資料科學分析技術,讓就業市場的人才供需情形,以及學習者的偏好,提供未來培訓的建議,可知資料科學在拓展研究與決策應用上的可能性。
在此,我們可以進一步思考,資料科學與數據探勘,對企業人才的研究有重要的幫助呢?例如企業可以利用資料科學技術,對員工的資料進行收集和分析後,針對工作表現資料、員工流失率、員工滿意度調查,以人才狀況,當然這是期望企業能進一步制定更加科學和針對性的人才戰略。而數據探勘可以深入發掘員工資料之間的關聯規則和隱藏模式,從員工的數據特徵將導致員工更容易離職的原因,哪類員工的工作效率和滿意度更高等,可以進而指導企業如何改善員工政策,留住和激勵人才。
企業有了數據模型,也可對員工進行精準畫像和預測,當然這一切科學化的作為,為企業提供更標準化與績效管理的工具和視角,以突顯出企業內部的人才現狀及問題。
當然,資料科學與數據探勘可以應用在分析學生的學習狀況,收集學生的學習資料,如考試成績、學習參與度、課外表現等,透過資料科學技術進行整合分析,藉此全面瞭解學生的學習情形。雖然今天沒有時間在這部分多加說明,但從產業的實質作法,能我們認識找出學生學習模式之間的關聯,進而建立學生學習模型,預測學生的學業表現,或為學生提供個人化學習建議,這些皆可提升教學品質,以管理決策角度引導學生更有效率的學習。
謝謝Tonny的分享,期待12/15進一步認識實質作法。👍