【資料科學入門 Introduction to Data Science】,科目代號 DAT101x
成績計算方式 (Pass 70%):Lab 100%(一次機會)
► 課程內容
內容分為四部份:
參考教材:林素菁(2017),統計學,全華圖書出版
Module 1 Introduction to Data 資料簡介
Exploring Data 探索資料(EXCEL在資料處理上的基本功能(附錄 A))
Lab 7 題 (25%)
Module 2 Data Analysis Fundamentals 資料分析基礎
Analyzing and Visualizing Data 分析與可視化資料(EXCEL 樞紐分析及繪圖工具 (實作題 2-5))
Lab 5 題 (25%)
Module 3 Getting Started with Statistics 統計起手式
An Introduction to Statistics 統計簡介(利用 EXCEL 計算常用的統計量數,包括平均數、中位數、眾數、變異數、標準差(實作題 4-1)、相關係數(實作題 4-3)等,資料分佈上常用的直方圖(實作題 2-4)與盒鬚圖(課堂補充),以及抽樣分配的基本概念 (CH7-1~7-2 假設檢定基本概念))
Lab 9 題 (25%)
Module 4 Machine Learning Basics
Introduction to Machine Learning 機器學習簡介
(機器學習基本概念(課堂補充)、Azure Machine Learning 軟體(CH7-5 迴歸分析)【Azure 入門範例】)
Lab 7 題 (25%)
機器學習跟統計學差在哪?哈佛博士:機器學習重視預測結果,統計學在乎因果推理(2019/05/02 科技橘報)
► 課前準備
選課後,按下「課程」,進入學習頁面 Before You Start,填寫問卷 Pre-Course Survey
將檔案存在 USB 中帶到課堂使用
微軟提供 Lab 1~4.pdf 講義,內含老師的筆記說明
微軟練習檔案 DAT101x.rar,請自行解壓縮,解壓縮後包括以下檔案:
Input.txt
Lemonade.csv
Lemonade.xlsx
Output.txt
Python.txt
R.txt
Lemonade.xlsx
紀錄一年來檸檬水的每日銷售資料,包括日期(Date)、星期(Day)、溫度(Temperature)、降雨量(Rainfall)、發放傳單數(Flyers)、價格(Price)、銷售量(Sales)。