Social media and the social sciences: How researchers employ big data analytics

書名(以學術體例詳填資料,網路來源提供超連結及檢索日):

Felt, M. (2016/April). Social media and the social sciences: How researchers employ big data analytics, Big Data & Society, 3 (1) 1-15.

導讀者:                 

    蔡佳璇

原作摘要:

社群媒體貼文具備運用於數據挖掘和分析的潛力。因此,社群媒體平台提供者開始限制免費取得社群媒體數據的管道,為想要分析公共貼文的社會科學家及其他非營利研究者帶來新的挑戰。

這篇文章試圖列出幾個社群媒體數據分析最近的變遷。研究方式是使用推特追蹤The Sisters in Spirit Candlelight Vigil (加拿大一個關懷原住民女性的倡議團體)24小時,用三種免費的推特程式介面來擷取貼文、進行分析,並加以比較。

雖然獲取推特貼文的管道被限制,社會科學家還是有很多不同的選擇,本文呼籲使用社群媒體數據分析結合傳統質性方法,來處理現正發展中的「資訊淘金熱」。

重點整理:

1.回顧先前的推特研究

    2011年推特修改了API架構,使得推特研究受到較多限制。在此之前,研究者可以查詢推特上的公開時間線(public timeline)來獲取大量數據。根據Bruns與其他研究者的研究,Twapperkeeper是2011之前常被用來抓 #hashtag或關鍵字推文的工具。推特增加限制後,許多研究者改為使用YourTwapperkeeper這個工具。(p.2)

    多位研究者指出,研究若仰賴推特API相關工具會遇到幾個挑戰。研究者不清楚API的演算法邏輯,因此增加研究過程的複雜度及資料的不確定性;研究者無法使用API工具完整複製取得的數據,因此無法個別檢驗數據。雖然API工具有可靠度和可檢驗性的問題,但已經是相對有效且免費的管道。(p.3)

以2012年來說,有三分之二的推特研究都使用推特API來蒐集數據。(Zimmer and Proferes)

    推特受到研究者青睞的原因有許多,其一是推特為第三大的社群媒體平台,全球有五億用戶。此外推特貼文內容也是寶貴的資訊,可用以分析人們生活。Zimmer and Proferes認為推特能夠表現網路的時代精神(zeitgeist)。Murthy將推特研究分為四大類:新聞、災難、倡議、健康。推特貼文預設為公開,對研究者來說,推特資訊相較其他社群媒體更容易取得。


2.了解API(應用程式介面)最近的變化

    取得所有推特數據是可能的,但非常昂貴。目前研究者可以透過推特旗下的公司Gnip來購買推特數據。推特也將全數數據捐贈給美國國會圖書館,未來研究者可能可以透過此管道使用推特數據。缺乏經費的研究者通常會使用仰賴推特API的工具。(p.4)


3.大數據社群媒體研究整合分析(Meta-analysis)

    作者針對EBSCO資料庫中的大數據社群媒體研究進行整合分析,採用幾個限制條件,最終得到285筆資料。其中249項研究有研究社群媒體平台數據,83%使用了傳統方法蒐集資料(最大宗為問卷),34項研究採用數據分析(如平台API工具),只有8項研究同時採取兩種方式。

   

    針對此現象其中一個解釋是,69%的研究對象都是Facebook,而獲取Facebook數據比Twitter更加困難。而使用數據分析的研究幾乎都是以Twitter為研究對象,並且多使用免費API工具。(以YourTwapperKeeper和NodeXL最常見)

 

4.關鍵數據研究(critical data studies)之定位

     Kitchin and Lauriault指出,”data”一詞過去被視為「知識與資訊建立的原料」,但他們認為數據(data)其實已經是「煮好的材料」,因此呼籲將關鍵社會學理論應用於數據,進行關鍵數據研究。

    Dalton and Thatcher提出七點關於大數據分析的建議,也提出數據分析的黑暗面,呼籲應結合數據分析和質性研究方法。

多位研究者提出應同時關注社群媒體平台背後的演算法,Kitchin認為「演算法不只處理數據,也創造數據。」(p.5) 研究者也發現,社群媒體展現了「強者更強」的權力定律。(Meraz and Papacharissi) 這些都是研究者進行研究時必須考慮的面向。


5.呼籲社會科學家運用數據分析

6.比較三種免費的社群媒體分析工具


Social media and the social sciences摘要.docx