The Value of Big Data in Digital Media Research
書名(以學術體例詳填資料,網路來源提供超連結及檢索日):
Mahrt, Merja & Scharkow, Michael.(2013). The Value of Big Data in Digital Media Research. Journal of Broadcasting & Electronic Media 57(1), 2013, pp. 20–33.
導讀者:黃淑琳
原作摘要:
這篇文章主要討論big data分析對於網路媒體研究的適用性與實用性。作者認為Big data出現以後,學術界也出現了Data rush,也就是對Big data研究非常熱衷且樂觀的研究。不過,大數量的分析研究方式受限於其效力與範圍,因此研究者需要評估自己的研究是否真的要採用big data分析。畢竟只要做好適當抽樣、測量和分析步驟,傳播內容或使用者行為等的小規模研究同樣能提供有意義的推論。
重點整理:
Big data特性
泛指數量訊息龐大到無法以一般儲存空間或處理設備處理的大規模資料。
Big data的出現,形成新的數位落差:有能力處理分析資料的人vs只能撈取表面資料的人。
而且新型態的資料與分析工具,也會形塑研究者的思考和處理資訊的方式。甚至研究者的興趣會受到data本身的引導或是限制。從theory-driven 轉變為data-driven的研究題材。
Big data的機會與好處
Big data是使用者每天使用行為的副產品,由電腦自動記錄的方式不僅具備某種程度的效度,也為研究者節省觀察與記錄人類行為的麻煩。
網路上的數據已經被記錄或儲存成特定格式,因此可以利用已經發展成熟的內容分析方式進行研究。(像是傳播或其他領域研究)
Big data分析可以作為研究的起步。如果要研究族群非常稀少或是散佈於世界各處,可以從Big data研究開始先行研究,省去大型普查的成本、提升研究效率。
Big data研究的挑戰
1. 抽樣與收集資料方面的問題
非隨機抽樣:大部分的Big data研究都採取非隨機抽樣方法,像是滾雪球或收集可以合法取得的資料而已,不具有代表性。
樣本規模太小:作者認為即使撈到的使用者數量很多,但是從平台的觀點來看,大部分研究都鎖定一兩個平台研究,很難將線上研究結果水平延伸到眾多平台。
道德與隱私:永遠的老問題。
2. 測量問題
相對淺層的測量:只採用available的資料、available的測量方式,但未必是最有效的方法。不過這可能是因為有能力取得Big data的人都是資訊科學背景的人,他們對社會科學的研究方法概念一無所知。
availability bias:雖然Big data看似給了很好的研究前景,不過事實上現在正面臨一個大問題─取得偏誤(?),研究者不在收集理論定義的分析單位和測量方法,反而傾項選擇任何可以取得的資料數據,正當化數據後再使用它們(theory-driven→data- driven)。如此一來,造成許多結果效度的問題。
缺乏對脈絡/內容的認識:數量結果很有可能只是「類似」實際現象,未必能推論現狀。像是兩個人通話紀錄頻繁、通話時間又長,不代表這兩人感情好。如果要進一步推論,需要更多的資訊才行。
自動化分析方法的主導研究(尤指機器coding):一般人認為電腦的自動分析方法比較可靠,不易發生偏誤。不過這論點僅只在訊息量相當龐大(數以千計)的情況下有效。否則,自動coding的可靠度其實少於人工coding的20%。
3. 資料分析問題
採用big data與否,應該要看研究問題的核心:關注的是集體還是個人?因果解釋還是預測?
如果是透過big data研究一部分的網路使用者,就很難將研究結果推論至整體網路使用者,因為其中個人差異(或者說是人際間變異)的訊息太少了。另一方面,如果是以big data研究群體,也未必能將研究結果套用在個人層次上。
4. 詮釋與推論問題
最關鍵的問題在於,研究是否具有理論效度和數據的意義?
如何適當詮釋數量:被RT很多次,僅能代表被很多人關注討論。除非有進一步的探究,否則無法詮釋成其他意義。
樣本過小:無論社交媒體的資訊有多容易取得,仍沒有大到可以推論至群體的規模。像是如果只能撈取小於5%的德國twitter使用者資料,就無法將研究結果推論至「德國twitter使用者」。
結論
研究方法的訓練可以改善big data研究的問題,這些訓練內容包含如何處理data、更包含懂得運用big data的資料回答有意義的問題。因此,未來的研究方法不只要著重運算議題、資料管理,更要繼續重視嚴謹的研究方法與研究設計。
研究者應該要懂得「big data的誘惑」,避免讓資料型態或方法決定自己的研究方向。Big data的研究固然重要,但採用適當的研究方法回應問題更為關鍵。研究者不應該讓自己原有的研究興趣和可收集到的資料妥協,透徹的小規模研究分析一樣可以提供具有意義的研究結果。
![](https://www.google.com/images/icons/product/drive-32.png)