讀取BBCNews文字檔找出近似的五個標題

資料集從Kaggle下載,網址如下,下載BBC News Summary資料夾壓縮檔。

https://www.kaggle.com/pariza/bbc-news-summary

匯入文字檔到DataFrame

使用Spacy找出標題的向量

計算關鍵字與每個新聞標題的相識程度,找出最接近的五個