- 請在同學自己的電腦上安裝 Anaconda, 並開啟任一 python 程式編輯畫面, 撰寫一簡單的 python 程式並確認執行結果 (請將畫面截圖)
- 請在人力銀行網頁搜尋 “資料科學” “資料分析” “資料工程” 等職缺共 3 個 (不同公司), 並嘗試以下分析工作
- 請介紹公司與職缺
- 請思考你/妳所找到的公司, 為什麼需要 “資料科學” 專業人才
- 請將職缺所有要求 / 條件列出, 並逐項分析你/妳目前具備的條件
- 請試圖搜尋該職缺的可能薪水或職缺面試心得分享
- 繳交期限: 23:59, 3/14/2018
- 繳交方法: 請寄到老師信箱 chkao@gm.nttu.edu.tw
- 郵件命名: 資料處理與分析第一次作業-學號-姓名
- 作業格式: pdf
- 作業檔案命名: 學號-姓名.pdf
- 請同學設計一資料集 (如 10 位同學的 3 門科目成績, 10 個觀測站的 3 種觀測數據資料), 撰寫 Python 程式, 將資料以字典 (Dictionary) 資料結構儲存 (字典資料定義於程式即可), 有興趣的同學亦可交換資料集進行後續處理與分析工作
- 請同學基於此字典, 撰寫 Python 程式, 列出所有觀察值與關連資料
- 請同學基於此字典, 撰寫 Python 程式, 計算統計課程中所認識的統計量 (如平均, 最大值, 最小值, 中位數, 標準差, 變異數等, 同學可以自行增加), 並在螢幕上輸出
- 請同學撰寫文件, 說明以下項目
- 字典結構設計與資料實例
- 觀察值走訪與呈現方法
- 統計量計算與呈現方法
- 繳交期限: 23:59, 4/11/2018
- 繳交方法: 請寄到老師信箱 chkao@gm.nttu.edu.tw
- 郵件命名: 資料處理與分析第二次作業-學號-姓名
- 作業格式: Python 原始碼 (py) 與說明文件 (pdf)
- 請同學搜尋一有興趣的開放資料 (格式不限), 透過 Python 程式進行讀取, 整理與分析工作
- 請同學撰寫文件, 說明以下項目
- 開放資料介紹 (資料內容, 資料格式, 更新頻率等等)
- 開放資料讀取, 整理方法
- 開放資料分析結果說明
- 繳交期限: 23:59, 5/9/2018
- 繳交方法: 請寄到老師信箱 chkao@gm.nttu.edu.tw
- 郵件命名: 資料處理與分析第三次作業-學號-姓名
- 作業格式: Python 原始碼 (py), 開放資料 (若為讀取本地端資料), 與說明文件 (pdf)
- 期中專案報告時間: 5/17 (請將主題寄給老師, 先搶先贏)
- 請挑選一資料處理與分析主題, 進行報告與分享, 亦可嘗試重複其資料處理與分析工作, 並確認發現 (以下主題擇一)
- 學術論文分享 (可至 "臺灣博碩士論文知識加值系統" 搜尋論文, 推薦關鍵字: 資料探勘, 統計, 資料分析)
- 基於數學主題 (如圖論, 統計等), 透過資訊方法進行資料處理與分析
- 資料處理與分析專案 (如資料科學競賽案例, 或開放資料應用案例) 分享
- 基於開放資料並使用手邊工具進行處理與分析工作
- 請製作投影片並上台報告 (若有撰寫程式碼, 亦可進行展示)
- 請於報告後一個星期內, 將投影片與相關程式碼, 文件等寄到老師信箱 (chkao@gm.nttu.edu.tw)
- 團隊組成: 每組 1 至 4 位同學
- 報告時間: 每組 7 分鐘
- 請同學搜尋一有興趣的開放資料 (格式不限, 可基於第三次作業), 透過 Python 程式進行讀取, 清理, 特徵化, 分析與視覺化工作
- 請同學依據開放資料, 至少繪製兩種視覺化圖型
- 請同學撰寫文件, 說明以下項目
- 開放資料介紹 (資料內容, 資料格式, 更新頻率等等)
- 開放資料讀取, 清理, 特徵化, 分析與視覺化方法 (可基於課堂上所介紹的資料分析流程)
- 開放資料分析結果說明, 應用想法
- 繳交期限: 23:59, 6/6/2018
- 繳交方法: 請寄到老師信箱 chkao@gm.nttu.edu.tw
- 郵件命名: 資料處理與分析第四次作業-學號-姓名
- 作業格式: Python 原始碼 (py), 開放資料 (若為讀取本地端資料), 與說明文件 (pdf)
- 請同學搜尋一有興趣的社群平台 (PTT, Twitter, Plurk, Facebook, 部落格等), 透過 Python 程式進行讀取, 清理, 特徵化, 分析與視覺化工作
- 舉例: 擷取分析社群文章, 透過中文斷詞斷句方法, 統計字詞使用 (統計圖表), 並分析文章核心概念
- 舉例: 擷取分析社群文章, 找出具有影響力的作者 (如 PTT 發文有許多讚), 並繪製作者與按讚者的網路關係圖
- 舉例: 擷取分析社群文章, 找出逐月的文章記錄, 統計文章數量 (統計圖表)
- 請同學撰寫文件, 說明以下項目
- 社群資料分析想法 / 動機
- 社群平台介紹
- 社群資料讀取, 清理, 特徵化, 分析與視覺化方法
- 社群資料分析結果說明, 應用想法
- 繳交期限: 23:59, 6/20/2018
- 繳交方法: 請寄到老師信箱 chkao@gm.nttu.edu.tw
- 郵件命名: 資料處理與分析第五次作業-學號-姓名
- 作業格式: Python 原始碼 (py), 與說明文件 (pdf)
- 由同學有興趣的問題或研究想法出發, 進行資料的蒐集 (如開放資料, 社群 資料, 或自行蒐集的資料等), 依據資料處理與分析流程, 透過 Python 與相關套件完成以下工作, 並做報告
- 確立問題或研究主題
- 確立問題或研究主題的資料
- 透過 Python 程式語言與相關套件進行資料處理 (蒐集, 清理, 儲存, 特徵化等) (可搭配其他工具)
- 基於特定資料分析方法, 透過 Python 語言與相關套件進行資料分析 (敘述, 預測, 視覺化等) (可搭配其他工具)
- 呈現資料處理與分析結果 (可搭配其他工具)
- 對於問題或研究的結論與建議
- 團隊分工與心得分享
- 請製作投影片, 上台報告, 並實際執行程式, 展示資料處理與分析結果
- 報告日期: 6/28/2018
- 團隊組成: 每組 1 至 4 位同學
- 報告時間: 每組 7 分鐘
- 請於報告後一天內, 將投影片與相關程式碼, 文件等寄到老師信箱 (chkao@gm.nttu.edu.tw)