資料集從Kaggle下載,網址如下,下載BBC News Summary資料夾壓縮檔。
https://www.kaggle.com/pariza/bbc-news-summary
匯入文字檔到DataFrame
使用Spacy找出標題的向量
計算關鍵字與每個新聞標題的相識程度,找出最接近的五個