開課學期:2023 學年度第二學期
中文課名:資料科學導論
英文課名:Introduction to Data Science
授課教師:林欣名
電郵地址:hmlin(本校電子信箱)
修課類別:選修,為必選之一。
開課年級:本學程一年級
修業學分:3
學生人數:3
課堂時段:星期六第 2–4 節(09:00–11:50)
經費補助:本課程獲教育部人文社會與產業實務創新鏈結計畫補助執行中
資料科學廣泛應用在許多領域,並逐漸影響生活中的各個層面。以影音多媒體為例,除了利用分類與推薦技術,將產品準確投放給目標客群之外,更可於上市之前先行預測新作品的銷售量;另一方面,提供自動生成內容服務的公司,在國內外如雨後春筍般出現。然而,目前仍普遍缺乏能與資料科學家和資訊工程師有效溝通的藝術管理人才。本課程首先將說明資料科學中的巨量資料(大數據)、機器學習、人工智慧、資料探勘、知識發現、資訊檢索等原理,並且操作跨平臺且開放原始碼的 Orange 探索性數據分析和交互式數據可視化自由軟體,以驗證書本中的理論。接著介紹自然語言處理、影音辨識、輔助創作、數位人文,最後再延伸至資訊安全、隱私保護、版權爭議等主題。學生平時須於課前閱讀指定文獻,並於課堂中參與研討,亦須自行尋找開放式資料集,來源包含但不限於政府機關、學術機構、民營企業、非營利組織,深入瞭解數據的收集來源與處理過程,並結合課程中所學的內容,大膽推測資料中可能隱含的知識與價值,搭配軟體工具進行實驗。
理解資料科學運作原理
建立數據分析思維模式
探索開放式數據資料集
運用自由軟體探勘資料
課堂參與=20%:限時口頭答詢或繳交問卷。
隨堂測驗=20%:限時口頭測驗或繳交試卷。
實作演練=20%:課內或課外完成軟體操作。
期中報告=20%:口頭報告並上傳書面檔案。
期末報告=20%:口頭報告並上傳書面檔案。
課程簡介(研討01:basics in a nutshell)
巨量資料(研討02:k-means clustering)
機器學習(研討03:principal component analysis (PCA))
知識發現(研討04:association rules)
資訊檢索(研討05:social network analysis)
語音辨識(研討06:regression analysis)
清明連假
影像辨識(研討07:k-nearest neighbors (k-NN))
自動生成(研討08:support vector machine (SVM) )
輔助創作(研討09:decision tree)
數位典藏(研討10:random forests)
校友講座(研討11:time series)
數位人文(研討12:neural networks)
端午連假
資安隱私(研討13:text mining)
沈佩誼(2018)譯,《文科生也看得懂的資料科學》,臺北市:碁峰資訊。
徐瑞珠(2017)譯,《認識資料科學的第一本書》,臺北市:碁峰資訊。
衛宮紘(2020)譯,《圖解AI:機器學習和深度學習的技術與原理》,臺北市:碁峰資訊。
陳子安(2018)譯,《圖解AI人工智慧大未來:關於人工智慧一定要懂得96件事》,臺北市:旗標。
臺大科學教育發展中心(2021),《智慧新世界:圖靈所沒有預料到的人工智慧》,臺北市:三民。
張原禎(2021),《用Google玩人工智慧實驗:Google AI Experiments探索》,新北市:台科大圖書。
沈佩誼(2018)譯,《文科生也看得懂的資料科學》,臺北市:碁峰資訊。
徐瑞珠(2017)譯,《認識資料科學的第一本書》,臺北市:碁峰資訊。
王維嘉(2020),《AI背後的暗知識:機器如何學習、認知與改造我們的未來世界》,臺北市:大寫。
韓翔中(2020)譯,《數位時代的人權思辨:回溯歷史關鍵,探尋人類與未來科技發展之道》,新北市:臺灣商務。
溫澤元、林怡婷、陳思穎(2020)譯,《監控資本主義時代》,臺北市:時報出版。
陳柔含、謝維玲(2022)譯,《獲利至上:你的一舉一動,都是他們的賺錢工具!Meta集團稱霸全球的經營黑幕》,新北市:野人文化。
林曉欽(2020)譯,《人類的明日之戰:當臉書、谷歌和亞馬遜無所不在,科技和大數據如何支配我們的生活、殺害民主》,新北市:大牌出版。
許瑞宋(2017)譯,《大數據的傲慢與偏見:一個「圈內數學家」對演算法霸權的警告與揭發》,臺北市:大寫。
林志懋(2019)譯,《打開演算法黑箱:反噬的AI、走鐘的運算,當演算法出了錯,人類還能控制它嗎?》,臺北市:臉譜。
李芳齡(2015)譯,《開放資料大商機:當大數據全部免費!創新、創業、投資、行銷關鍵新趨勢》,臺北市:時報出版。
廖建容(2014)譯,《大賣場裡的人類學家:用人文科學搞懂消費者,解決最棘手的商業問題》,臺北市:天下文化。
C. O’Neil and R. Schutt, Doing Data Science: Straight Talk from the Frontline. Sebastopol, CA: O’Reilly Media, 2013.
AI For Everyone, Coursera.
和AI做朋友,教育部AI人才培育計畫:中小學推廣教育計畫。
大數據在餐旅臉書粉絲團的分析應用,中華大學餐旅管理學系。
大數據下的智慧財產權法,國立交通大學科技法律研究所。
數位策展,國立臺南藝術大學博物館學與古物維護研究所。
音樂資料科學,國立臺南藝術大學應用音樂學系。
請攜帶電量充足的智慧型手機,預先設定好在教室內的網路連線,並將所有鈴聲轉為靜音,以備課堂活動使用。
請攜帶筆記型電腦與電源線,以便練習實作,Windows、macOS、Linux 作業系統皆可。
口頭報告採用單盲制同儕審查,並將公告審查結果之平均值與去識別化之評語,以促進互相觀摩和意見交流。報告者須於書面檔案中回覆,並於參考建議後修改內容。
學期結束後,將公告全班成績合併計算之統計值和級距分布。
本校宣導加註警語:「遵守智慧財產權觀念」、「不得不法影印」。
歡迎同學於課堂上向老師提問與建議,若有其它顧慮,可填寫此回饋單。由於開放匿名填報,因此未必能夠直接回覆,但是會將提問的答案整合至授課內容當中,並參考多方建議調整教學方式。
請事先預約,每次一節課以內。