- 請同學使用資料框架 (data.frame) 模擬 10 位同學, 5 種科目成績, 並計算以下數字
- 每位同學的平均分數 (可假設學分相同, 或不同學分)
- 各項科目成績的最小值, 最大值, 平均值, 中位數, 變異數, 標準差
- 請繳交 R Script 與一份說明文件, 文件敘述 R 程式碼如何實現上述功能
- 作業繳交期限: 23:59, 11/27/2018
- 作業繳交方法: 請將作業寄至 chkao@gm.nttu.edu.tw
- 郵件命名: 資料科學第一次作業-學號-姓名
- 作業格式: .R (rscript) 與 docx, doc, odt, pdf 等
- 作業命名: 學號.R 與 學號-姓名.docx
- 選項 1: 資料處理與分析專案 (如資料科學競賽案例, 或開放資料應用案例) 分享
- 選項 2: 依照同學當前工作環境與內容, 識別可進行資料處理與分析的問題
- 報告內容 (供同學參考, 亦可自行調整)
- 資料處理與分析的動機與問題
- 資料來源, 資料格式, 資料量, 資料產生速度
- 資料蒐集方法
- 資料清理方法
- 資料儲存與管理方法
- 資料分析與呈現方法
- 資料分析結果與發現
- 請製作投影片並上台報告
- 請於報告後將投影片寄到老師信箱
- 團隊組成: 每組 1 至 2 位同學
- 報告日期: 12/12/2018
- 報告時間: 每組 7 分鐘 + 3 分鐘提問與討論
- 請針對 CSV, XML 與 JSON 格式, 各找一筆開放資料, 並進行介紹 (資料基本敘述, 資料欄位, 筆數, 更新頻率, 資料範例與說明等等), 並描述你/妳想透過這些開放資料作些什麼 (分析, 應用皆可)
- 作業繳交期限: 23:59, 12/25/2018
- 作業繳交方法: 請將作業寄至 chkao@gm.nttu.edu.tw
- 郵件命名: 資料科學第二次作業-學號-姓名
- 作業格式: docx, doc, odt, pdf 等
- 作業命名: 學號-姓名.docx
- 由同學有興趣的問題或研究想法出發, 進行資料的蒐集 (如開放資料, 社群資料, 或自行蒐集的資料等), 依據資料處理與分析流程, 透過 R 與相關套件完成以下工作, 並做報告
- 確立問題或研究主題
- 蒐集關於問題或研究主題的資料
- 透過 R 程式語言與相關套件進行資料處理 (蒐集, 清理, 儲存, 特徵化等) (可搭配其他工具)
- 基於特定資料分析方法, 透過 R 語言與相關套件進行資料分析 (敘述, 預測, 視覺化等) (可搭配其他工具)
- 呈現資料處理與分析結果 (可搭配其他工具)
- 對於問題或研究的結論與建議
- 團隊分工與心得分享
- 請製作投影片, 上台報告, 並實際執行程式, 展示資料處理與分析結果
- 報告日期: 1/9/2019
- 團隊組成: 每組 1 至 4 位同學
- 報告時間: 每組 10 分鐘
- 請於報告後, 將投影片與相關程式碼, 文件等寄到老師信箱 (chkao@gm.nttu.edu.tw)