Clarifying Journalism’s Quantitative Turn
書名(以學術體例詳填資料,網路來源提供超連結及檢索日):
Coddington, M. (2015). Clarifying Journalism’s Quantitative Turn, Digital Journalism, 3(3), pp. 331-348
導讀者:蔡依桃 thoo Chuah
原作摘要:
量化新聞,在新聞界享有愈來愈顯著的趨勢,因此有必要檢討之在記者實踐所扮演的角色, 甚至也有定義之的必要性。藉由比較三種“量化模式”新聞學:電腦輔助報導(computerassisted reporting),資料新聞(data journalism),以及演算式新聞(computational journalism),探討當中的異同,並以系譜學的角度檢視在開放源碼的主催者,以及記者 之認識層面及專業層面,分辨出 3 種模式:透明或不透明、大數據或有目標性的樣本、期 待的是主動的或低被動的公眾。
重點整理:
資料驅動新聞,早已存在於新聞實踐,只是當代許多資訊都已藉由(1 及 0)傳遞的情況 下,愈來愈多新聞也趨向蒐集分析及計算這些資訊,循此,Petre(2013)就提出新聞量 化轉向(quantitative turn)的概念。
電腦輔助報導(computer-assisted reporting,CAR)
1950 年代記者就已開始使用電腦(計算),而 CAR 此概念由 Philip Meyer 所提出的精準 新聞學(precision journalism)開啟,指涉記者藉由問卷調查、內容分析、統計分析等, 回答新聞所欲解答的問題。直到 1990 年代,精準新聞學成為電腦輔助報導並正式成為新 聞室重要的實踐,是因為幾位著名的普利茲得獎者促動了“專業查證”professional validation 的重要性(Houston,1996),自此 CAR 就成為長期公共議題報導的重要工具之 一。只是,邁入科技資訊普及的 2000 年代,CAR 已融入記者實踐當中,並失去了需要被提 及的重要性,也因此 CAR 此定義就沒有被溢散。
資料新聞 Stray(2011)定義:
取得相關資料並經由策展後刊出的數據,多為公共議題。 Gynnild(2014):要與開放數據及開放源碼工具相結合。 Parasie & Dagiral (2013):並不需要一定有開放數據。 資料新聞與 CAR 最大的差距就是結合了調查式的新聞實踐為主軸,而非強調電腦為工具性 輔助的新聞實踐(Gray, Bounegru, and Chambers 2012; Marshall 2011; Minkoff 2010), 另外也有學者認為資料新聞搭配許多視覺化呈現(Gordon 2013;Weber and Rall 2013)。
演算式新聞(computational journalism)
作者依循 Diakopoulos (2011) 提出演算式新聞的定義:演算式新聞著重於演算的應用、 並由演算實踐進行資訊蒐集,再藉由記者詮釋與展示資訊,這是一種由科技為主導的新聞 建檔日期:2015/10/24 建檔人:thoo Chuah 2 實踐,而非透過記者使用數據或透過社會科學方法取得資料並報導的做法。 Stavelin (2014):透過強調演算式工具與方法的使用,藉以定義演算式新聞。
抽取功能與自動化(abstraction & automation)技術:
由於運算(algorithms)是抽取功能的步驟,因此扮演了把指令輸入並輸出資料的角色, 並且運算還可以排序優先、分類、過濾資訊,甚至也可涵括在新聞之發佈,例如相關新聞 被搜尋、閱覽的統計、發佈新聞的最佳時段分析等,以便取決新聞的露出議題、時間與目 標讀者。
例子:
The Wall Street Journal 使用一個假的 user profile 測試線上貿易裡面的價錢運算, 是否存在偏倚;Narrative Science(https://www.narrativescience.com/)甚至推出了機 器人學新聞的自動化財經與體育新聞;還有由 ProPublica 與 New York Times 推出的 DocumentCloud 也邀請公眾提供手寫的資料,並提供類似光學辨識手寫字的程式,來處理 這些資料。
小結:
CAR 奠基於社會科學模式,資料新聞在開放的參與以及資料混合式呈現讓之與 CAR 不同,而演算式新聞則著重於抽取功能與自動化應用。
研究方法:
Typology 透過 90 份來自學術及業界相關文本,例如 Columbia Journalism Review、Nieman Journalism Lab、教科書、部落格、個人蒐集多年相關資料作為分析。透過初步分析,勾勒初步系譜圖,再經由與學術指正後,不斷修改的結果如下:
Professional Expertise Versus Networked Information(專業性與資訊網絡性)
從資料所顯示,眾人對 CAR 的認知是處於:記者是專業的,CAR 只是輔助工具而已, 就如 Philip Meyer 所說“the same old journalism but with better tools” (Miller 1988, 36).
資料新聞,仍然保有記者的專業性,但是,在新聞的呈現就不必進行人的訪問,而 是透過網絡的開放資料說故事。
演算式新聞,趨向產出一個可視的產品或平台,較少注重新聞敘述的部分。而這種 新聞模式深信人類的專長是處於群眾(human expertise is located in the crowd),而非一個記者獨有的。(thoo:IoT 亦是從大數據取出產品)
Transparency Versus Opacity 透明與不透明
CAR 處理資料透明度方面,採取的是不奪走新聞當中人類為主角的呈現方式,因此 會把部分資料透明化,以輔助新聞的報導更為深入。
資料新聞,一直秉持着開放的精神,除了鼓勵人們使用政府開放資料,也會把資料 公開。
Diakopoulos(2014b)認為要執行運算透明(algorithmic transparency)比資料 透明要困難得多,因為要把這部分變成公眾可閱讀的模式,還需更多資源才有辦法。
Targeted Sampling Versus Big Data
CAR 所取得的資料,是有目標性的樣本。直到資訊暴增之後,CAR 也被用在一些被 資訊遺棄的資料(thoo:無法從大數據取得的資料,例如網路調查) 從學者所觀察的資料新聞記者得知,過往的社會科學方法,並沒有在這些記者處理 資料新聞的時候出現,他們只論及數據的大或小。這可能因為資料新聞產製的時間 愈來愈快,讓記者不得不放棄傳統的方法。
演算式新聞與資料新聞同樣被認為是處於大數據時代而誕生的,不過速度的重要性 則比資料新聞較低,但是,這種模式所取得的數據是已經被處理好的(不像大數據 有許多未過濾的資訊),也因此這些資料都是可被使用的。
Vision of the Public: Active Versus Passive
公共對 CAR 是重要的,因為這些新聞最終還是得回到社會,但是在新聞的產製面, 公眾的參與是被動的。
資料新聞同樣秉持着揭開公共議題的使命,但資料新聞允許公眾參與及分析相關數 據,而記者就扮演了說故事人的角色。但是在現階段,所謂的公共參與,仍然處於 audience metric 的階段,也就是透過閱讀量的觀察與分析。
演算式新聞,同樣視公眾為有意識的參與者,具備理解與生產資料能力。但是演算式新聞所想像的公眾,是一群懂得與資料互動,透過所提供的工具進行自身的過錄 及抽取,並且這些公眾是自主的,有創意的,可以透過演算工具自己搜尋資料並呈 現之。看起來演算式新聞所定義的公眾與資料新聞雷同,但是,其中相異的就是: 公眾更具有賦權能力,具有透過資料演算思考的能力。
結論
以系譜學方法,協助此研究初步理解資料驅動新聞實踐,所分類的面向在未來幾年也可預 見更多,不過透過這樣的認識論,可清楚勾勒三種量化新聞的異同,供未來研究參考。研 究者認為資料新聞結合了記者專業、開放源碼與演算式過程,並且提醒人們也不可忘卻新聞最重要的敘述、說故事的主軸,以產製更好的資料新聞。而演算式新聞,是奠基於資料 新聞的基礎,但與電腦程式、演算等有更密切互動的新聞模式,也更加地趨近開放源碼文 化。最後研究者認為未來的研究可專注各種外來因素如何影響這類新聞的產製,例如探討 當中的自主性,政經因素等,甚至,應該留意閱聽眾與這些新聞的關係,將對新聞實踐很 有幫助。
與本研究問題意識相關的概念與延伸對話:
延伸閱讀:(請用學術體例將參考文獻中值得延伸閱讀之文章、書籍或網址列於此處)
相關之關鍵字及其概念內涵:
資料狀況: □ 電子檔(摘要/全文): □ 紙本(摘要/全文): □ 其他狀況:
如有重要相關圖表及附件請附在本頁後面,並在「其他狀況」項目內註明,如:附圖二 張。
![](https://www.google.com/images/icons/product/drive-32.png)