研究結果

壹、模型結果

區間() : 0~59、60~69、70~79、80~89、90~100                           共十組

區間() : 0~2021~4041~6061~8081~100                        共五組


注:紅字為準確率最高

藍字為準確率最低

貳、結論

利用十種不同的機器學習模型對資料做預測,將數學成績以不同的區間劃分做比較,在區間2中們以低於60分的作為一類,超過60分以每10分劃分,在這個區間中我們得知Logistic Regression可以表現的最好,而SVM-Linear不管是訓練集及測試集皆表現得最差,另外我們使用另一個分類區間是數學成績以每20分劃分,在SVM-polynomial 模型中得到測試集準確率最高,同時訓練集與測試集準確率皆超過80%。 因此我們可以總結出以20分為區間的拆分方法會優於以60分以下為一類,超過60分每10分為一類的方法。