自然語言處理毒文分析
指導老師:余瑞琳老師
專題成員:謝宜娠、段雁庭、林庭均、吳晉慧、陳宜妤、游惠晴、葉素鳳
指導老師:余瑞琳老師
專題成員:謝宜娠、段雁庭、林庭均、吳晉慧、陳宜妤、游惠晴、葉素鳳
社交媒體上的有毒文章問題日益嚴重,機器學習和人工智能技術被用來有效監控和處理有害內容。毒性文章檢測技術可以訓練模型來識別具有攻擊性、歧視性或不尊重性質的言論。這些模型可以從先前的數據中學習,辨識關鍵詞、語境和模式,進而標記和分類潛在的有害內容。在專題中,我們利用TF-IDF結合隨機森林(Random Forest)、TF-IDF結合支援向量機(SVM)、TF-IDF結合K近鄰(KNN)、Word2Vec結合長短期記憶模型(LSTM),以及Bert模型,對毒性文章進行評估。結果顯示Bert模型在此任務中表現較為優越。