Controversy and Sentiment in Online News

書名(以學術體例詳填資料,網路來源提供超連結及檢索日):網路新聞中的爭議與情緒

(Mejova, Zhang, Diakopoulos, & Castillo, 2014)

Mejova, Y., Zhang, A. X., Diakopoulos, N., & Castillo, C. (2014). Controversy and Sentiment in Online News. arXiv preprint arXiv:1409.8152.

導讀者:李欣穎

原作摘要:

新聞記者如何報導爭議議題?在本文中,我們採取一個「語料庫數據驅動」的方法,以了解爭議新聞中的情感表達和偏見語文字。我們利用群眾外包的方式收集了爭議和非爭議方面的新聞資料集。然後,專注於15家美國的主要新聞媒體,比較數百萬篇的新聞、超過7個月的時間跨度。

我們發現,在一般情況下,當涉及到有爭議的議題時,新聞使用消極情緒和偏見文字是普遍的,強烈情緒文字較不明顯(tempered,適中的)。我們也觀察到新聞來源有很多不同之處。透過比較議題與議題之間在不同媒體中是如何被描繪的,我們可以指出什麼議題具有爭議性。

重點整理:

新聞文章:

數據是由NewsCred提供(這聚集了數以千計的新聞來源的新聞內容),並透過API取得。我們從NewsCred中選擇了15個大型的新聞媒體,自2013年9月起取出三個月的新聞。

媒體包括CNN、路透社、今日美國、洛杉磯時報、華盛頓郵報、芝加哥論壇報、新聞日、明尼阿波利斯明星論壇報、休斯頓紀事報、費城問詢報、檀香山星廣告、赫芬頓郵報、紐約時報、ProPublica等。總體蒐集了超過21萬篇文章。

如何找出有爭議的詞: 

一個詞是否有爭議是非常主觀的、且涉及上下文。既然爭議是社會所建構的,我們進行了群眾協力的方式,判斷哪些詞彙代表爭議議題。我們採用眾包平台CrowdFlower聘請網友,每100字支付了$ 0.80(美元)。

最初的詞彙清單是在文章中隨機抽樣組成的。我們使用詞性的標註器過濾這個詞彙列表,只保留名詞單字。接下來,我們刪除了通用的英文停用詞,以及頻繁的新聞報導停用詞(美聯社、廣播、新聞、出版、改寫、版權、保留)。

1:眾包任務過程中發現的單詞列表

強烈爭議:濫用、管理、阿富汗、援助、美國、美國、軍隊、攻擊、攻擊、部門、機關、禁令、銀行、福利、票據、賬單、邊界、預算、活動、候選人、候選人、天主教、中國、中國、教堂、關注、會議、保守、控制、國家、法院、犯罪、刑事、危機、裁員、爭論、債務、國防、赤字、民主人士、疾病、美元、藥物、毒品、經濟、埃杜陽離子、埃及、選、選舉、執法、打架、金融、財政、力量、資金、煤氣、政府、槍、衛生、移民、不準確、印度、保險、調查、偵查、伊朗、以色列、工作、工作、法官、司法、殺戮、韓國、勞動力、土地、法律、立法者、法律、訴訟、領導、法律、婚姻、媒體、墨西哥、軍事、金錢、謀殺、民族、國家、新聞、奧巴馬、攻擊、官員、油、派對、和平、警察、政策、政策、政治、民意調查顯示、電力、總裁、價格、初級、監獄、進步、種族、改革、共和、共和、限制、規則、規律、執政、俄羅斯、俄語、學校、安全、參議院、性別、射擊、社會、消費、戰略、罷工、支持部門、敘利亞、敘利亞、稅收、稅收、威脅、審判、失業、歐盟、美國、被害人、被害人、暴力、投票、選民、戰爭、華盛頓、武器、世界

群眾外包的條件: 

你需要熟悉美國的新聞媒體。請說明該詞彙是:

(C3)強烈爭議:人們往往不同意,大部分有反對意見。

(C2)有點爭議:人們有時不同意或有爭論。

(C1)爭議較小:很少人不同意或有爭論。

(C0)無爭議:人們幾乎從來沒有反對。

有一個初步的任務來判斷群眾的「可信度」,我們要求眾包工作者為一些指定的詞彙判斷它是否有爭議。我們選擇了94個字,其中平均分配無爭議與有爭議的術語。群眾沒有通過此任務代表他不被認為是「值得信賴的」。

討論:

與爭議議題有關的新聞經常使用負面情緒詞彙。許多被認為是有爭議的議題,常涉及到社會問題或是暴力事件,如槍、戰鬥、犯罪、被害人被射擊;或是抗爭與戰爭,如罷工、武器和軍隊。

此外,爭議話題涉及較少的強烈情感詞彙。這可能指向一個努力的成果:部分新聞機構嚴格地控制記者,在討論有爭議的議題時所使用的語言。

基於上述發現,我們建立了一個模型來估計爭議。我們發現一些能代表爭議的條件。在某些情況​​下,根據上下文的不同可能導致不正確的判斷。例如「石油」此字在金融文章中引用時可以客觀地看待這個問題,而不會使用偏見或情感的語言。進一步的工作是需要更清晰地模擬這些術語所代表的主題,以便更好地了解他們的報導脈絡。

這篇論文所描述的方法,還允許我們使用詞彙來檢查不同新聞機構,在報導爭議議題時所使用的語言。例如,對於這個詞「民主派別」(democrats),我們比較了不同媒體機構的前30個偏見詞庫。

我們看到,隨著更多的議題詞彙(topical terms)如obama and democratic,赫芬頓郵報還包括更廣泛的和主觀的詞彙如very and good, unlike, say, CNN and Reuters(路透社)。

這個詞典還讓我們得以比較地方媒體與國家新聞機構,在相同議題上的新聞框架差異。例如,在報導謀殺事件時,路透社和CNN經常提到government and other groups等比較大的報導框架。費城問詢、檀香山、以及休斯敦紀事報(Philadelphia Inquirer, Honolulu Star-Advertiser, and Houston Chronicle),會提及特定的人(女性,受害者woman, victim)和地方(大學,西部university, west)。

運用詞彙資源進行新聞報導情緒以外更深入的了解和進一步的分析,是本研究的一個令人興奮的未來發展方向。我們可以揭露不同的新聞機構的框架或語言使用上隱含的偏見。也可以做為新聞報導的「風格檢查器」,作為有志於保持新聞客觀性的基準,或者說讀者可藉此監視與報導與他們相關議題的新聞記者。

與本研究問題意識相關的概念與延伸對話:

情緒新聞學的不同研究面向,結合新聞機構、報導議題、框架、情緒與偏見用詞等不同變數

台灣墜機災難新聞中已經發現不同媒體有情緒的差異,有行銷、點閱率、編審制度上的考量。本篇文章支持不同新聞來源有情緒上的差異。但提供進一步深化的研究方向。如墜機議題中的偏見用詞與爭議議題。

再者,研究方法上有群眾外包的嘗試流程。

延伸閱讀:(請用學術體例將參考文獻中值得延伸閱讀之文章、書籍或網址列於此處)


資料狀況:

■電子檔(摘要/全文):           

□ 紙本(摘要/全文):           

□ 其他狀況:           

如有重要相關圖表及附件請附在本頁後面,並在「其他狀況」項目內註明,如:附圖二張。

(導讀)網路新聞中的爭議與情緒.docx