The Arab spring and social media audiences: English and Arabic twitter users and their networks.

水火計畫讀書會書目摘要單

書名（以學術體例詳填資料，網路來源提供超連結及檢索日）：

Bruns, A., Highfield, T., & Burgess, J. (2013). The Arab spring and social media audiences: English and Arabic twitter users and their networks. American behavioral scientist, 57(7), 871-898.

導讀者：區國強

原作摘要：

雖然Facebook和Twitter在2011年阿拉伯之春中扮演的角色似乎被過份強調，但是從突尼西亞至敘利亞等國各種抗議與動盪事件中，卻不能否認的出現大量的社交媒體活動。在Twitter上，直到2011年為止，就有數百萬筆由當地人或外地人發出以libya或egypt為hashtag的貼文。但有關這些不同使用群體之互動卻仍未被弄清楚，特別是語言障礙在其中扮演的角色。本文蒐集2011年1月到9月相關hashtag的貼文，比較埃及革命與利比亞內戰兩事件中Twitter使用者的使用模式。我們透過既有用以處理大數據的工具，檢視在事件發展過程中，英語使用者、阿拉伯使用者，以及混合語言使用者在網絡中的互動情形（包括透過reply和retweet，或同時包括兩者）。透過觀察@reply和retweet的使用，我們找出了Twitter中英語與阿拉伯語使用者的一般資訊流通方式，並提出某些連接不同語言團體之使用者的重要角色。

重點整理：

前言

2011年北非多個國家出現大規模反政府示威，社交媒體在其中被抗議人士用作組織和宣傳之工具。而且，除了本地使用者外，也有大量外地使用者透過hashtag參與到Twitter之相關討論中。有學者稱這種受hashtag中介的政治參為一種國際性的「包圍式新聞學」（ambient journalism）環境中，遠端觀察（distanced observation）與資訊分享活動。但本文想問：這些hashtag之使用真有把不同地區或文化的使用者連結一起嗎？以下，本文以埃及與利比亞為研究對象，針對阿拉伯語、英語，和混合語言之Twitter使用者上具有#egypt和#libya的hashtag之貼文，探討不同語言群體之間的互動情形。

情境、背景、取徑

Twitter經常被用作組織和報導公眾抗議事件，但Twitter在其中所扮演的角色卻仍是處於爭辯之中。有學者提出「Twitter革命」之字詞，但Twitter本身在各種抗議事件之角色卻仍需要進一步分析。在阿拉伯之春的系列反政府事件中，Twitter也同樣被大量使用，甚至包括新聞機構與記者也採用這項工具。大量的影片也上傳youtube，透過社群媒體被大量散播。#egypt和#libya的hashtag也吸引了本土和外國使用者之注意，但在這些事件中，Twitter到底是一種連結抗議活動的穩定工具，或國際觀察者用以討論抗議事件之管道，這問題仍未有清楚解答。

Bruns和Burgess（2011）等人提出，hashtag在多種抗議和災難事件中扮演集中資訊之角色，讓特定議題能快速地被回應。在Twitter中，hashtag之浮現並不受到特定人或組織所主導，各式各樣的使用者都有權使用或忽視特定的hashtag。在埃及革命中出現了一個現象，就是在事件發生時，阿拉伯使用者被逼使用拉丁字母的hashtag ；儘管Twitter支援在貼文中非拉丁字母，但在2012年1月以前從右至左的hashtag寫法仍在測試中。不過，從左到右的hasthag表標籤也使得貼文能連結到更多Twitter搜尋中，產生更多的討論。所以，在當時的貼文中，除了英文之貼文外，也有許多是以英文製成hashtag，但以阿拉伯文為貼文內容的Tweet。

除了之外，由Google和Twitter合作發展的Speak2Tweet工具，也影響了這種英語hashtag阿拉伯文內容推文之數量。Speak2Tweet讓人可以透過國際電話方式留言，再玩為以#eygpt為hashtag的文字內容之推文。

總而言之，在埃及事件中，Twitter出現了雙語或多語推文之傳播方式。但本文好奇，這些以雙語或多語寫作的推文使用者扮演了什麼樣的橋梁角色？與阿拉伯文之推文相比，又有何特色？有研究者以其他地區的案例提出，不同語言之推文往往有不同的關注重點，就以敘利亞地區為例，阿拉伯貼文主要關注日常議題，而外語貼文多用作評論或與抗議者議題相關。有人也指出，英語推文經常是為了引起更全球性的注意。Twitter上的活躍使用者，更會透過使用不同語言，並剪裁不同的內容來以連結諸如阿拉伯、英語，和法語twitter使用者。本文認為，雖然我們難以透過貼文之語言來判定使用者之所在地理位置，但比較同一時期不同語言使用者之推文模式仍是值得研究。因此，本文研究問題如下：

使用拉丁語言與非拉丁語言之推文，在回應阿拉伯之春事件中是否有類似的模式？

以#egypt和libya為hashtag之推文作為觀察對象，這些推文之數量起伏是否與事件之發展相符合？

拉丁語使用者與非拉丁語使用者之間是否交互連結？這種連結是否能解釋為某些連結twitter上不同使用者群體之使用者社群？

研究方法

搜尋工具：yourTwapperkeeper

關鍵字：#egypt, #libya

時間：(#egypt ) 2011.1.23~2011.11.30 (#libya) 2011.2.16~2011.11.30

技術難題：（1）難以確定yourTwapperkeeper撈取資料是否全面（2）難以知道到底是否有漏掉的資料（3）某些日期竟沒有任何推文

語言辨識方式：

使用者帳號中的語言設定並不等於推文上使用語言（e.g.明明是埃及人用阿拉伯文推文，但帳號上可能是英語使用者），因此本研究以推文內容屬於拉丁語／非拉丁語作為語言辨識判凖（以此作為標準的拉丁語推文，含有中文、韓文和日文推文，但數量不多，並不影響研究；另，亦可以從這些推文的對話網絡（conversational networks）來辨認是否不屬於英語使用者）。

以ASCII字母編碼來判斷，超過128字元為非拉丁文，少於128字元則為拉丁文語言。

本研究經過測試，拉丁語言推文中可能會含有少量非拉丁語符號，例如äöüß, áéíóú, etc等。

（Through a trial and tuning process,2 we determined that a threshold of 10 non-Latin characters results in a reliable distinction between Latin and non-Latin tweets. This threshold value is preferable to a strict zero as it allows for the presence of several accented characters as they are common in various European languages (äöüß, áéíóú, etc.) as well as for "fancy" punctuation marks (" instead of ", etc.), all of which have also been assigned character codes above 127.）

本研究以Gawk工具來處理CSV/TSV格式的資料，除了為每則推文編碼外，也計算非拉丁語推文的總量。我們也以每日或每小時來分析非拉丁語使用者（主要為阿拉伯語）、拉丁語使用者（主要為英語），以及混合語言使用者之推文。

本研究以從Twitter資料中擷取諸如特定時間活躍使用者之數量等資料，也包括把推文分類為@replies、retweets和含URLs等。

（Beyond this coding of language, we also extracted a range of other metrics from the Twitter data sets (for an extended discussion of these metrics and the methods used to obtain them, see Bruns, 2012a, 2012b, 2012c, 2012d): We track the number of tweets made (also broken down into tweet categories including original tweets, @replies, retweets, and tweets containing URLs) as well as the number of active users per time frame; furthermore, for each user we determine the number of hashtagged tweets sent and received (again also broken down into the different tweet categories).

最後，依據1/9/90法則，我們將使用者分為三種：1%活躍使用者、9%高度參與者，和90%比較不活躍的使用者。本研究以特定hashtag上之排名作為判準，找出分別屬於1%、9%和90%之使用者。

另外，本研究亦將@replies和retweet中被提及的使用者作為第四種分類，這些人雖沒有以#egypt和#libya之hashtag貼文。

整體模型

本研究共蒐集到的資料有：

#egypt 推文量：748萬、45萬使用者

#libya 推文量：527萬、48萬使用者

＃egypt

在埃及案例中，有大量的推文是在事件發生初期（不幸地，在此階段中有部分資料遺失之情形）。Mubarak在2/11辭職當天引起最多迴響。有超過8萬使用者20多萬篇#egypt之貼文。在整個二月，除了2/26 當天外，拉丁語文推文一直比較多；在3/1後，非拉丁語推文量逐漸升高，並佔了超過75％的平均推文量。本文認為，這樣的情形展現了阿拉伯語使用者從關心革命事件到埃國長期的政治系統重整。在這期間，每日有平均超過7000人發表約24000則推文，而這些貼文者中大多是埃及當地人以及外地埃及人。

另外，1/25的#egypt只有不到9500篇貼文，本文認為可能與當時更多人埃及當地人用的#jan25這個hashtag有關（1/25指「革命之日」）。

透過分析不同使用者之資料，本文發現在事件初期，活躍使用者貢獻了36%之貼文，但這個比例在後面攀升到每日約60%。本文認為，在事件初期，吸引了大量的使用者貼文，包括比較不活躍的使用者，而當大部份使用者貼文數減低後，活要使用者仍有因為其長期對埃及政治局勢之關注，因此主導了後來的討論。但在7月後，活躍使用者貼文數一度降低，本文認為可能與當時局勢相關；軍事政府轉交權力過程緩慢，讓活躍使用者挫折。但在11月後，大眾預期未來即將舉行大選後。

另外，我們也可以從統計圖表看出，事件初期拉丁語使用者（主要是英語）與活躍使用者之數量相近，本文認為這可能是非阿拉伯使用者相對容易被吸引使用#egypt這個hashtag有關。這些外語使用者主要是關注革命事件之新聞發展，而對長期政治局勢較無興趣。

分析不同推文者的推文方式。1%的活躍使用者貢獻了約56%之推文，並且大部份是原創貼文。相對而言，比較不活躍者之推文中，有65%是retweet。活躍使用者之推文中，也有56%含有URL，比起其他兩組使用者之URL量（少於40%）多。

除此之外，不同使用者群體之語言使用也有很大差異。活躍使用者中，75%使用非拉丁語言，次要的活躍使用者為63%，比較不活躍者為43%。這可看出阿拉伯語使用者佔最活躍使用者之最大數量。

#libya

在#libya方面，呈現了與#eygpt稍有不同的現象。最多推文為2011/2/21當日（32萬推文），正好是利比亞事件被國際媒體報導之初期階段，在之後#libya之推文數就下降，每天大約只有10000多則推文。如同#egypt一樣，特定使用者貢獻了主要數量的推文。但是，與#egypt不同，#libya中只有少量的非拉丁語言推文，大約從18%到29%。另外，在#libya的非拉丁推文中，前1%的活躍使用者貢獻23％推文，次要活躍使用者為27％，其數量差異並沒有#eygpt中來得大。本文推估，這種不同可能是來由於埃及事件主要發生在都市，而相對來說，Libya事件則遍及全國。此外，Libya內戰中，格達費一度嘗試中斷Libya與外界之間的網絡連結，也可能造成#libya資料中阿拉伯語推文之數量低的原因。在2011/10/20後，阿拉伯語推文數上升，也可能與格達費下台，網路通訊鬆綁有關。

比較不同使用者群體之推文，本文發現前1%推文者仍扮演最重要角色，貢獻了約57%之推文，次要活躍推文群體為16%。

與#egypt相比，#libya不同使用者之推文方式相對沒有大明顯的趨勢。如同預期，主要推文者的retweet數比次要推文者少（56%vs.66%），原創推文量也比較多（36%vs.27%）。拉丁語與非拉丁語推文者間並沒有太大的使用方式差異。不同群體之間的差異也不大。

此外，#egypt的主要推文者之原創推文量（65%）也比#libya高（在#eygpt中，75%的主要推文者原創推文為阿拉伯語），這現象可能代表在Libya裡，在地精英並不常用twitter來報導事件發展，外地的利比亞人使用量也不高。在#libya中，反映了以Twitter來記錄和討論libya內戰事件的傳播活動中，外國Twitter使用者數量比利比亞本地多。

不同語言團體之互動

本文除了好奇#egypt和#libya不同語言使用者之推文現象外，更關注不同語言使用者之間的互動。本文以@replies、retweet和@mentions來進行觀察，在#egypt和#libya中有大量的retweet推文，而只以不到10%的是真正的@reply。本文認為，這是因為Twitter主要是用作傳播訊息給網絡中其他使用者。其中，我們也發現阿拉伯語和英語使用者之間的連結，我們堆估這是不同語言場域間的資訊散播。

為了檢視不同語言使用者之互動，本研究將 #egypt和#libya的推文分為四個時期，再分類出活躍程度不同的使用者，之後再透過使用拉丁字母的數量（少於10個非拉丁字母者計算為拉丁語使用者），將推文者分為「拉丁語為主要語言之推文」（使用非拉丁文比例少於33%）、「非拉丁語為主要語言之推文」（超過66%為非拉丁語），以及「混合語言推文」（使用非拉丁語比例為33%-66%之間）。不過，必須注意，這樣的分類只對有發出推文者有效，因為許多被動的使用者根本沒有推文內容來可以進行判斷。

#egypt

在2/1-28這段期間中，拉丁文使用者主導了討論。但在前1%最活躍的推文者之推文中，拉丁文推文與非拉丁文推文之比例相對其他使用者群體來說比較接近。而在最活躍使用者的推文中，混合語言推文有13%，比其他使用者群體高。這顯示出在埃及事件之初期，除了有大量英語使用者對以阿拉伯語寫作的在地推文有興趣，阿拉伯語使用者也準備就緒更深入地參與到事件之中。

在6月後，保持著類似的比例，但非拉丁語言之推文數量比例逐漸變大。在最活躍使用者之推文中，有85%為非拉丁語。在混合語言方面，6月的最活躍者中，混合語推文比例比2月下降，只有6%。本文推估這現象之原因為大部份混合語使用者事實上是以阿拉伯文為母語，因此當整體推文往阿拉伯語傾斜時，許多混合語使用者也開始加入到阿拉伯語之推文討論中。

另外，以@replies和retweet來觀察不同語言使用者狀況，本文比較2月與6月後之資料，發現在2月中，有68%拉丁語使用者使用@replies和retweet，非拉丁語為22%，混合語為10%。但在6月時，情形改變，@replies和retweet使用者中，拉丁語使用者只有18%，非拉丁語為77%，而混合語為9%。

若我們以@replay和retweet的流動來看，在2月，拉丁語使用者之@reply和retweet中，有80%是關於同樣拉丁語群體；非拉丁語之@mentions中，有65%是關於非拉丁語使用者。值得注意的是，在拉丁語的使用者中，第二重要的資訊來源為「被動」帳號（10%；多為媒體機構），很多都是在原retweet的推文中加上 #egypt之hashtag。相對於拉丁語使用者，非拉丁語使用者關注語混合語（14%）和拉丁語（16%）之推文數目比較平均，被動帳號為5%。在混合語帳號方面，只有15%的@replies和retweets是指向其他混合語使用者，42％與拉丁語帳號連結，36％與非拉丁語連結。本研究認為，儘管混合語帳號在 #egypt中整體推文量不高，但其卻扮演了連接不同語言使用者之角色。

在6月以後，情形反轉，拉丁語者扮演角色縮小，非拉丁語推文比例雖佔大部份，但其主要連接對象為非拉丁語使用者本身（82%）。在此階段，#egypt在Twitter上可以說已經是屬於非拉丁語使用者推文的hashtag，拉丁語使用者若要取得更多資訊，則必須連接到非拉丁語使用者。如果把90%次要使用者排除掉，會發現從拉丁語使用者連接到非拉丁語使用者之比例會從14%增加到19%（連接到混合語言為11%增加到12%）；最活躍的拉丁語使用者會從非拉丁語推文中尋求資訊，亦不斷將被動帳號的資訊以retweet再加上#egypt之方式帶到 #egypt之討論中。

#libya

#libya之推文為拉丁語使用者主導，因此與 #egypt展現很不一樣的狀況。在事件初期，82%推文者為拉丁語使用者，而在8月至9月期間，非拉丁語使用者比例略微增加（29%），但拉丁語使用者仍為大多數。但就以最活躍的使用者群來看，非拉丁語使用者之比例不止沒有增加，反而減少，只佔8%。混合語使用者之比例也同樣變少。

另外，檢視@replies和retweets之途徑，會發現前後時期出現蠻大的差異。在8和9月首都戰役後，拉丁語與非拉丁語使用者之間的互動關係在事件後期變弱，呈現兩極化；儘管拉丁語使用者仍扮演主導角色，但是混合語使用者群掉至4%，非拉丁語使用者增加到17%。但若只觀察前10%的主動使用者，85%mentions為拉丁語帳號，非拉丁語只有10%。

以資訊流量之累積來看，拉丁語使用者的mention中，有85%是連接到同樣的拉丁語使用者。而連接到其他使用者中，則以被動帳號之數量最多。值得注意，資料顯示有一群數量不多但卻活躍於非拉丁語群體之非拉丁語使用者。不管在前期或後期，都有分別66%和76%的非拉丁語使用者會在非拉丁語群體中進行互動。在活動前期，非拉丁語使用者中，以拉丁語推文為資訊來源的為16%，來源為混合語言和被動賬號的分別為11%和6%。但在八月後，被動帳號比例增加（9%），來源自拉丁語的掉到8%，混合語也掉至6%。

最後，在#libya中，混合語言使用者活動量雖然不大，但在兩個時期中，其透過@mentions指向的使用者有50%為拉丁語使用者，30%為非拉丁語使用者。透過資料，我們發現混合語言者在不同語言的群體中，仍扮演重要的連接角色。

結論

本文分析埃及和利比亞兩事件中Twitter所展現出的傳播活動，發現#egypt的阿拉伯使用者討論量多於#libya，展現了埃及人使用Twitter的人口相對比利比亞多，造成許多在Twitter關注利比亞事件的人主要為外地人。

在#egypt中，我們也發現不同語言使用者之比例之改變情形。但從埃及事件一開始時，前1%的最活躍使用者一直都是 #egypt中最重要的推文貢獻者，特別在當地使用者從 #Jan25轉到 #egypt這個hashtag後，阿拉伯語言使用者逐漸主導了討論空間。

本研究檢視了混合使用者在Twitter中扮演了不同語言使用者之間的橋梁角色，但在未來，URL或新聞媒體資訊之角色也值得進一步探討，其中包括這些媒體訊息是如何穿梭在不同語言群體之推文中。這可幫助我們更深入理解Twitter如何同時散播主流媒體以及在場群眾對革命事件之見證。

最後，雖然Twitter在埃及政變中扮演了傳播、整理、報導反對者活動之資訊的角色，但本文認為，我們尚不能說這是一種「社群媒體革命」。在利比亞，Twitter則主要是外地人的討論場域。本文建議，在未來，我們可以對Twitter和其他社群媒體在埃及與利比亞兩國的政治傳播中所扮演的長期角色進行更進一步的探討。

與本研究問題意識相關的概念與延伸對話：

1. 以英文hashtag找馬英九推文？估算國外討論量？

2. hashtag = FB粉絲團？如何建立跨媒體的比較指標？

延伸閱讀：(請用學術體例將參考文獻中值得延伸閱讀之文章、書籍或網址列於此處)

Hermida,A. (2010)Twittering the news: The emergence of ambient journalism. Journalism Practice, 4(3), 297-308.

與危機傳播相關之關鍵字及其概念內涵：

□ __________：

資料狀況：

■ 電子檔（摘要／全文）:

□ 紙本（摘要／全文）:

□ 其他狀況：

如有重要相關圖表及附件請附在本頁後面，並在「其他狀況」項目內註明，如：附圖二張。

書摘The Arab spring and social media audiences- English and Arabic twitter users and their networks.docx