How the Chinese Government Fabricates Social Media Posts for Strategic Distraction, not Engaged Argument

書名(以學術體例詳填資料,網路來源提供超連結及檢索日):

King, G., Pan, J., & Roberts, M. E. (2017). How the Chinese Government Fabricates Social Media Posts for Strategic Distraction, not Engaged Argument. American Political Science Review.

中國政府編造社群網絡貼文是為了策略性地分散注意力,而非參與辯論

 

導讀者:黃幀昕

原作摘要:

中國政府被懷疑僱傭超過 200 萬人暗中在社群網路上發佈貼文,并把這些貼文偽裝成普通人的觀點。很多的學者、記者和活動家認為這些五毛黨(50c party)發佈貼文是站在政府一邊,為政府的政策進行辯論。就像這個研究中所指出的那樣,社群網絡中確實存在著大量由五毛黨發佈的貼文。但是沒有系統性的經驗性證據表明中國政府正在進行這項行為。通過大規模的經驗性研究,本研究展示了如何確認這些秘密作者的身份以及他們所發佈的貼文,研究估計中國政府每年在社交媒體上編造出超過4.48億評論。和之前的研究不同,该研究發現中國政府避免和那些懷疑黨和政府的人進行爭論,也避免討論爭議性的話題。研究發現政府僱傭五毛黨發佈貼文的目的是為了分散公眾的注意力,並且改變討論的主題。五毛黨發佈的大多數貼文都是在讚美中國和中國共產黨的革命歷史,或者是讚美政權的其他方面。研究将討論這些發現是如何與中國政府的網絡審查政策相契合的。研究認為,這些發現會改變我們對於「共有知識」(common knowledge)的理解,也會改變我們對威權政體信息控制的理解。

一、介紹

 中國政府對於整個網路系統有著嚴密的審查。以往的研究發現,中國的審查系統一方面能夠允許網民對於政權、政策和領導人的批評,但是禁止那些有可能會引發群體性事件的網路討論。

 根據學者、記者和活動家的觀察,中國政府把所謂的草根營銷(astroturfing)也當成一種審查手段,我們將其稱為反向審查(reverse censorship),也就是秘密地匿名地在社交網絡上發佈大量的貼文和評論,就好像這些評論是普通中國網民的觀點。被僱傭來做這些事情的人被稱為“網絡評論員”(Internet commentators),也被稱為“五毛黨”(50s party),之所以會有這樣的稱呼是因為傳言他們每發佈一則貼文就能夠獲得五毛錢。雖然這個研究顯示這樣的傳言並不正確,我們仍然接受這樣的稱呼,因為他們確實直接接收來自政府的指令,偽裝成普通人在網絡上發言。 

記者、學者和人權活動家們一直認為五毛黨在網絡上發帖是針對那些批評政府的言論,并為政府的行為、政策和領導人辯護。但是到目前為止,仍然沒有方法能夠直接探測到五毛黨和他們發出的貼文,我們不知道他們的規模,他們那為什麼要發出這樣的貼文。我們能夠做到的只是通過直覺、邏輯、傳言和洩露的政府指示來做出一些宣稱。

在這篇文章當,首次對五毛黨、五毛黨發佈的貼文內容和政府的策略提出系統性的經驗證據,研究分析了從章貢互聯網宣傳辦公室洩露出來的郵件檔案,這個地方是江西省贛州市的一個下轄區。這些郵件揭露了這個地區五毛黨工作的賬號和內容。這樣洩露的檔案由於數量龐大、內容複雜,難以用傳統的定性方法進行分析,非結構化的內容也難以進行自動化處理,因此它們還未被系統性地分析過。本研究在這裡發展出了一種方法來分析這些數據集,并從中抓取出了超過43000則五毛黨的貼文。

我們首先通過這些數據的網絡和時間序列結構來分析出它們的結構模式(pattern)。然後,在Section4中,本研究系統性的分析了這些五毛黨貼文的內容,然後從這些內容中推測這種行為的目的,并揭露政府的策略意圖。在 Secton5中,研究使用一種新的抽樣方法來確認五毛黨的身份,同時也發展出幾條標準來評估它的有效性。在 Section6中,我們估計了中國政府每年僱傭五毛黨在社群媒體上發佈大約4.48億條貼文。在 Section7 中,我們討論了我們的猜測、解釋和我們的推論中可能會產生的錯誤。

在每一個步驟當中,我們的結果都顯示,此前對於五毛黨的普遍認知是錯誤的,研究發現這些五毛黨發佈的貼文中幾乎沒有參與任何形式的爭論,他們不會為政府、領導人和政府政策進行辯護,事實上,他們看上去是避免任何形式的爭論。大多數五毛黨發佈的貼文都是在稱讚政府,發佈積極的言論。我們也探測到這些提問在時間和內容上有高度的合作。一個對於這些行為模式的理論解釋是,中國政府的目的是為了分散公眾對於任何有可能導致集體行動的事件和討論的注意力。

在 Section8中,我們討論了我們這些研究發現的理論影響。我們會對中國政府的內部信息控制做一個總結,學術界或應該重新思考威權政治或更廣泛領域內的“共有知識”觀念。在Section9中,我們會對我們的疏失和這項研究今後可以往哪個方向發展做一個總結。

 

二、我們所認為自己自己知道的

研究從記者、學者和社交媒體參與者三個方面總結了對於五毛黨觀點。對於五毛黨的最主流觀點是認為五毛黨會反駁對於政府、領導人、政策的批評言論。

1、記者

 Keating(2011)把五毛黨稱為“秘密的親政府的網絡評論員”,會在網絡論壇上發佈親共產黨的言論。O.lam(2012)五毛黨通過把批評者標籤為國家叛徒來塑造民意。著名的異議份子艾未未說,“如果你反對美國或者日本,你就是五毛黨的一員”。聚記者的估計,五毛黨的規模在50萬到200萬之間。(Philipp,2015)

2、學術界

學術界估計接受薪酬的五毛黨人數在25萬到30萬之間,他們接受在網絡上匿名發帖是經過中國政府的直接領導。因為缺乏系統性的研究,學者們認為五毛的發帖內容有非常多的可能性。可是,在大多數情況下,他們的觀點和記者是相似的,就是五毛黨生產親政府的言論,在網絡論壇上發表支持政府的觀點,並且批評異議者(Greitens,2013)。

3、社群媒體的參與者

社群媒體上的用戶經常公開指責別人是五毛黨。為了了解他們的觀點,該研究進行隨機抽樣,在社群媒體上獲得了9911則包含“五毛黨”關鍵詞的貼文。在這些貼文中,研究員又抽取了128則內容為指責他人是五毛黨的貼文。我們把這些指責的提問分成六類。之後隨機選擇200則貼文,讓兩個中文編碼員進行編碼,測得相互同意度為93%。

- 嘲諷外國(批評外國特別是西方)29%

- 對爭議性話題的讚美或者批評(通常是針對他人貼文提出的反駁,支持政府,批評異議份子)36%

- 對非爭議性事件的讚美或者建議(讚美或者建議具體的事情,例如政府、政策、官員,沒有反對任何觀點)22%

- 事實報告(對於政府項目、事件或者計劃的描述) 8%

- 讚頌(國家、英雄、民族、中國文化、愛國主義)5%

- 其他

 

從這些結果中可以看出,社群媒體的參與者所認為的五毛黨和記者、學者所認為的五毛黨大致相同——和批評政府、領導人、政策的人進行爭論。

我們的最後一步是想要確認那些被指責為五毛黨的成員的身份,但是這非常困難,因為網絡上的發帖是匿名的。但是,通過對多個平台的簡介(profile)信息的交叉引用,我們能夠發現其中一部分人具體的個人信息。他們的來源非常廣泛,但是在大多數例子里,他們看上去都不太可能是真實的五毛黨成員。例如,他們之中有周小平,一個知名的反西方的民族主義者;何家維,一個以批評中國政府知名的博客作者。其他的著名人物包括林毅夫,北京大學的教授,前世界銀行副行長。沒有任何證據表明他們有可能成為五毛黨。與此同時,這些被譴責為五毛黨的人也包含了與政治無關的人物,比如喜劇演員、律師和市場營銷主管。

從這些結果上來看,社群媒體參與者所認為的五毛黨和記者、學者所認為的五毛黨大體上是一致的。但是即便如此,目前仍然沒有證據支持這種看法。

 三、洩露的互聯網宣傳辦公室資料

1、數據和方法

以往的文獻認為研究五毛黨之所以困難是因為「很難探測到五毛黨,因為沒有關於他們的真實的信息」。我們很幸運,能夠改變這樣的情況。在2014年12月,匿名的博主xiaolan 發佈了一個文檔,文檔中的內容主要來自2013年和2014年間章貢地區網宣辦賬號收發的郵件。章貢區是江西省贛州市的一個轄區,2013年擁有人口46萬多人。

 這些郵件透露了網絡評論員的活動,包括的大量五毛言論,這些言論由各地的網絡評論員發送給網宣辦,是為了說明他們自己完成了指派的任務。

 這些文檔數量龐大、結構複雜,包括了大量的附檔,附檔格式非常多樣(截圖、word、excel、ppt、raw text等),郵件的儲存格式也非常多樣,還包含了大量指向外部的鏈接。這樣的資料結構使其難以被人工編碼,也使其難以被完全自動化進行文本分析。記者們用其中的一些例子來作報道,但是并沒有對這些資料的系統性的分析。

 為了系統性地分析這些數據,我們發展出了一種方法和流程,從大量的人工編碼,到自動化的文本分析和抓取。通過細緻地考慮和資源的支持,我們使得這些資料變得結構化和易於讀取。

 通過這些前期工作,研究確認了從2013年2月11日到2014年11月28日的2341封郵件。這些郵件當中,1208封郵件里包含了一條或者一條以上的五毛貼文。我們從中這些郵件以及它們的附檔中共獲得43757條五毛貼文。

 

2、資料結構

我們通過網絡分析圖來描述這些郵件信息的整體結構。

每一個點都是一個特殊的郵件賬號,每條線表示發送和接受郵件的關係。網絡評論員把郵件發送給章貢區網宣辦,報告自己完成了分配下來的任務。章貢區網宣辦再把這些信息報告給其它的官方部門,例如江西省贛州市章貢區人民法院新聞發言人和區委辦信息科。


3、確認五毛黨的身份

大多數學術文獻把五毛黨描述為被低薪僱傭的普通公民,我們的研究發現我們樣本中的五毛黨大多數都是政府僱員。在43757則貼文中,只有281則是我們無法確認的。剩下的99.3%的貼文都由章貢區的政府部門或者由章貢區下屬部門提供,這些部門超過200個。其中,20.9%的貼文來自章貢區互聯網宣傳辦公室,5.4%的貼文來自章貢區商務局,1672則來自水西鎮,還有來自章貢區的體育局、人保局、地稅局和法院等等。

 

這些貼文當中,有29.98%沒有包含 URL 或者沒有描述這些內容被發佈在哪些網站上。剩下的內容,有53.38%被發佈在政府網站上,有46.62%被發佈在商業網站上。發佈在商業網站的貼文中,有53.98%被發佈在新浪微博上,有32.1%被發佈在騰訊微博上,10.75%在百度貼吧上,還有2.69%在 QQ 空間上。

 研究發現沒有證據表明五毛黨每發佈一條評論就會獲得五毛錢的工資。事實上,也沒有證據表明這些五毛黨發帖會獲得額外的工作收入。我們猜測,發佈這些貼文是他們現有的工作的一個組成部分。

 

4、合作和內容

我們對43757則貼文做了一個時序分佈,統計該時間段內每天的發帖數量。(見下圖)。

其中最重要的發現是,這些貼文的發佈時間並非隨機分佈,而是集中在幾個重要的時間節點。這表明政府部門之間有著高度的合作。爆發的時間點更有可能體現網評員為了完成某項特殊的任務。

雖然我們在之後的部分對貼文做了嚴格的定量分析,但是我們在這裡仍然要選擇幾個重要的爆發期,并給他們貼上一些標籤。這些標籤是對爆發期內的言論的一個簡要的總結。這些標籤顯示這些貼文聚焦在「讚頌」,有可能是為了更好的分散民眾的注意力,而非參與相關的爭論。

(1)清明節:超過18000則貼文,內容是關於老兵、烈士、他們的光榮歷史以及為國家做出的犧牲

(2)中國夢:超過1800則貼文,關於習近平的「中國夢」,有可能是針對2013年4月人民日報系列宣傳文章的反應

(3)鄯善恐怖襲擊:超過1100則貼文,緊隨著鄯善恐怖襲擊發生之後。在晚上五點半,章貢區網宣辦發送郵件,強調了三條關於新疆的流行貼文,并把事件定性為恐怖襲擊。當天晚上八點,章貢區網宣辦寄送郵件給贛州市,報告發出了百餘條的貼文,主要是關於中國夢和當地的經濟發展,看上去是為了轉移新疆恐怖襲擊的注意力。

(4)十八大三中全會:超過3400則貼文是關於該次會議的,該次會議討論深化中國的結構性改革

(5)兩會:超過1200則提問關於贛州市人大和政協會議,兩會上討論了相關政策,包括環境議題、獨生子女政策、農村議題和經濟發展等

(6)烏魯木齊鐵路爆炸:爆炸發生后出現了一個爆發,3500則相關貼文,貼文相關總類較多,包括兩會、民生、政府治理等

(7)超過2600則貼文,關於慶祝第二次中央蘇區發展政策若干意見,該項意見是中央政府為了鼓勵中央蘇區的發展而出台的

(8)烈士紀念日:3500則貼文,關於新設立的國家烈士紀念日

 

雖然我們不能準確知道每次發帖量爆發的準確原因和動機,但是圖2符合轉移注意力的策略。例如,一些爆發的時間點是緊接在「潛在的群體性事件」(有可能會引起真實世界的人群聚集行為和活動)之後的,這些事件包括鄯善恐怖襲擊和烏魯木齊鐵路爆炸。其他的爆發時間發生國家節日,這些節假日人們沒有在工作,更有可能把時間用於政治事件。特別是,在清明節或者光榮日,在歷史上都是中國反抗運動的重要日期,由於這樣的原因,這些節慶日在毛時代是被禁止的。近些年來,清明節也和諸多敏感事件有關,例如,在清明節祭奠1989年天安門事件中的死難者。中央政府和江西省政府都強調,地方政府應該警惕清明節可能會發生的反抗運動。同樣的,政府相信政治會議召開的期間,也是反抗運動容易爆發的時期,政府會特別關注這個時期的活動。如果在這個時期成功地組織反抗,也更有可能引起關注。在這些會議之前,搶先佈置或者搶先壓制會減少群體性事件發生的可能性。

 

5、五毛貼文的目的

雖然我們從洩露的文檔中歸納出了五毛的發帖具有特定的導向,但是洩露的文檔並不能反映這些導向(direction)是否來自于章貢區或者更高層級的政府部門的授意。但是,我們關於分散注意力策略的推論與章貢宣傳部門向下傳達的郵件內容相符。章貢區的宣傳部門要求五毛黨要「堅持團結穩定,以鼓勵、正面宣傳為主」,要「積極做好突發時間輿論引導」。在這個語境之下,「突發事件」就是有可能引發群體性聚集的事件。

 

四、五毛黨的貼文內容

我們現在用 Section2的分類方法給這些五毛黨貼文做一個分類,然後估計它們在全中國範圍的分佈。該研究用五個相互獨立的步驟來進行分析,從章貢區開始,再一步步擴大到整個中國。

 事先,我們不知道章貢區的五毛黨活動和全國其他地區會有什麼不同。作為江西省的一部分,章貢最早是江西蘇維埃地區的一部分,在1931年由毛澤東和朱德建立和領導,因此擁有豐富的革命歷史。這些因素可能使得它有所不同。另一方面,來自中央部門的指示,以及章貢和其它區縣之間的共同利益,也會使得不同地域之間五毛黨的發帖活動變得趨向一致。

 我們使用五個相互獨立的分析步驟,以及下一部分的調查驗證, 我們得到了非常相似的結果,五毛黨的貼文主要由讚美和分散注意力的貼文構成,而非主動參與爭論。換句話說,這個模式可以從章貢區推斷到更大的區域。

 

(1)洩露的五毛貼文

我們首先分析了43757則從章貢區網信辦洩露的五毛貼文。這些貼文由大量作者撰寫,來自多個不同的社群網站,包括由私人公司運營的全國性的平台,例如新浪微博、百度貼吧,以及政府運營的網站,包括全國性的、省級和區縣級的網站。為了研究這些數據,我們隨機選取了200則貼文進行手動編碼。

一個非常明顯的結果是:關於「嘲諷外國」和「對爭議性話題的讚美或者批評」這兩項類目幾乎等於0。這是一個重要的發現,因為這與記者、學者和社交媒體參與者們的觀點完全不同。這樣的結果也很不可能是因為抽樣誤差導致的。為了得到更清楚的結論,我們做了更多的搜索,閱讀了剩下的貼文,最後發現只有很少有貼文符合上述兩個分類,它們在總體之中佔的比重非常非常少。

 因此我們推論,洩露的貼文中幾乎不含有「嘲諷外國」和「爭論性的讚美、批評」這兩個分類。該研究通過估計所有貼文分類的比例來進行驗證。我們使用一個知名的開源文本分析方法 README,我們直接估計每個分類的比例,而不需要給每一條貼文進行分類。README 方法被證明適用於分類比例的估計,它的另一個優點是在本研究的研究情境下,樣本滿足它的統計假設。

 在表3當中,是對五毛貼文分類比例的估計,我們第一類數據集(章貢區洩露的資料)在表中用實心表示,實心點表示點估計,線段表示信心區間。結果顯示,有80%的貼文是「讚頌」的分類,14%是「非爭論性的批評或者建議」。「嘲諷外國」和「爭論性的批評、讚美」幾乎等於零。

 


2、來自洩露的五毛微博賬戶的貼文

我們設想五毛是否是自己發佈了各個類型的貼文,但是只向宣傳部門報告其中屬於「讚頌」類型的貼文。為了研究這個問題,我們從洩露的文件中確認了一些五毛黨的新浪微博賬戶,并以此建構了第二個資料集。我們在新浪微博上找到了這些賬號,共計498個。最後,我們下載了這些賬號發佈的所有貼文,發現了這些賬號共計發佈了167977則貼文,其中不含之前洩露郵件中的貼文。

我們從中隨機選取了500則貼文進行手動編碼,并把它們作為訓練樣本。通過這些隨機抽樣得到的樣本,我們發現其中沒有「嘲諷外國」的案例,雖然我們發現了一些「爭論性的讚美或者批評」,但是只有3%。就像之前一樣,我們用 README 的方法來估計每個類別所占的比例,所得到的結果和之前類似。其中51%的貼文是屬於「讚頌」,20%屬於「事實性報告」,23%屬於「非爭論性的讚美或批評」,只有6%屬於「爭論性的讚美或批評」。

 

3、區分洩露賬號進行進一步推論

我們設計了第三個分析方法對洩露的資料進行進一步探索,以便進行更好的推論。區分的核心是把洩露的微博賬號分成兩類,一類是易於確認身份的,一類是不易於確認身份的。第一類我們稱為「普通賬戶」,這些賬戶是由中國的普通人發佈的,內容是關於他們的孩子、有趣的視頻、商業廣告、體育隊伍、流行明星、個人觀點等等。與此同時,這些貼文中還有接受宣佈部門指導的五毛貼文。第二類用戶我們稱為「特殊賬戶」,他們發佈的幾乎全部都是五毛貼文。

我們通過額外的外部資源的交叉驗證,「普通賬戶」會用真實姓名進行等級,賬戶的擁有者通常都是政府僱員;但是「特殊賬戶」多是匿名的。在這兩類賬戶中,這些五毛貼文都是接受政府指導而產生的,而不是反映中國普通民眾的觀點。

在洩露的資料中區分出「普通賬戶」和「特殊賬戶」很容易,但是我們的目標是為了推論到其他的區縣,那裡有我們未知的五毛貼文。因此,我們需要一個正式的分類算法來對這些賬戶進行區分,而不需運用到洩露的資料。更進一步,因為我們的目標是要決定五毛貼文的內容,我們必須能夠在不分析文字貼文的情況下了解一個賬號是否由五毛黨所寫。

為了發展出這樣一種算法,我們使用了一種「Bayesian falling rule list」 的方法論,這種方法很精確並且具有很高的解釋度。這種解釋性也能夠讓我們把定性知識和機器學習結合起來,也能夠讓我們更加容易地應用到章貢之外的地區。通過這種方法,我們發現只要兩步工作,就能夠讓我們充分地從49850則貼文中區分出「普通賬戶」和「特殊賬戶」:第一,我們從章貢區政府微博賬號收集到所有對這個賬號發出的貼文進行轉發和評論的賬號,把他們當做候選賬號;第二,我們縮小範圍,選擇其中粉絲數小於10的賬號。我們把篩選出來的賬號成為「特殊賬號」。

现在我們假設,那些「普通賬號」的贴文和「特殊賬號」的贴文有着相同的類型的內容,這樣的話我們就能夠證明兩者。為了證明它,我們把498個已經的五毛賬號利用這個算法進行分類,結果發現202(41%)個被分成了「特殊賬號」,296個被分成了「普通賬號」。這樣的劃分結果既不正確也不錯誤,但是卻很有用,因為這種劃分方法能夠避免偏誤。因此,我們比較普通賬號和特殊賬號不同貼文的比例分佈,我們同樣適用 REANDME 來進行比較。幸運的是,這些結果彼此之間非常相似,這表明偏誤不太可能。

 

4、章貢地區未洩露的五毛貼文

我們現在使用 Analysis3中區分出來的普通賬號和特殊賬號拓展我們的推論,這超出了Analysis1和Analysis2的範圍。這個推論的關鍵是前面的三種分析都對於不同類型貼文的分佈比例有著相近的估計。因此我們把範圍縮小到微博平台的特殊賬號上,這些內容比較容易找到。

在這個部分,我們把關注點聚焦在先前未確認身份的章貢區五毛貼文上。我們選擇特殊賬號(用之前的兩步規則),最終我們發現了1031個賬號,其中有829個在洩露資料中未被提到。然後我們從這些賬號中抓取到了22702則貼文,我們用 README 對上述貼文進行分析。

分析結果再一次和之前的相似。結果顯示,57%的貼文是「讚頌」,16%的貼文是「事實性報告」,22%「非爭論性讚美或批評,」4%是「嘲諷外國」,還有幾乎為0的「爭論性的讚美或批評」。

 

5、其它政府微博平台上未洩露的五毛貼文

我們現在要從章貢區推論到整個中國。我們從2826個區縣開始。我們首先把推論的目標定在1228個和章貢區結構類似的區縣,這些區縣的宣傳部門都有一個公開的網站。然後我們隨機選擇其中的100個,確認他們特殊賬號中的社交媒體貼文。

為了更加具體,對於每個區縣政府的微博賬號,我們隨機抽取最多200則貼,然後找到轉發和評論這些貼文的賬號,從中篩選出粉絲數量在10個以下的賬號,然後下載這些微博賬號首頁的貼文內容(最多45條)。我們總共收集了151110則貼文。

之後我們對這些貼文進行分析,發現與此前的結果非常相似。64%是「讚頌」,18%是「實施性報告」,9%是「非爭論性的讚美或批評」,4%是「爭論性的讚美或批評」。

 

6、自上而下的指導與合作

這些分析結果顯示,五毛黨的活動無論在時間還是內容方面都有高度的合作。這裡,我們提供來自證券高層的直接證據。

在2014年2月,習近平領導召開了中央網絡安全和信息化領導小組的第一次會議。國務院總理李克強和中宣部部長劉雲山也參加了此次會議。在這次會議期間,習近平要求政府官員要「把握好網上輿論引導的時、度、效,使網絡空間清朗起來」。習近平使用的「輿論引導」是中共進行設計、控制、影響民意的官方表述(這包括了傳統的引導,例如出版審查,以及新型的引導,例如五毛黨、網絡審查和長城防火墻等等)。

這樣的引導和我們觀察到的數據相符合,我們能夠從中找出證據來證明它的影響。我們基於洩露的資料計算在章貢地區,五毛黨每個月平均創建7.7個社交媒體賬號。但是,這些賬號中有156個是在會議召開當月或者之後創建的。同樣的,在我們預測的數據中,平均每個月會創建19個賬號。但是,他們創造的41個賬號是在會議召開當月,174個是在會議召開之後。我們把這些作為地方政府直接響應習近平號召的證據。


五、通過直接調查進行驗證

我們現在試著通過額外的步驟來驗證我們在 Section4中推論到全中國的準確性。在這裡,我們準備對那些我們預測是五毛黨的成員進行一個抽樣調查。

 

1、設計

我們一開始創建了大量的匿名的社交媒體賬號,這需要很多的研究助理和志願者,他們要裝作分佈在中國的各個地區。我們在微博上以「直接寄信」的方式來進行調查,這樣一對一的調查能夠確保隱私。我們在調查之前沒有聲明自己是研究人員,而聲稱自己是普通公民。因為我們的資料顯示,政府會監控五毛黨的活動,因此我們的調查問題和反饋將保持匿名,也避免向受訪者詢問敏感問題。

我們在 Section4中預測了一些五毛賬號,我們從中隨機抽取出一些賬號,詢問他們是否是五毛黨。當然,解釋這些回答是有困難的。因為問卷的受訪者代表政府在執行一些詭秘的行動,這個行動要求他們偽裝成普通人的樣子。研究者詢問他們這樣的問題會有一定困難。在大多數情況下,政府同時也是他們的僱主,所以他們有充足的動機不回應我們的問題,或者不認真的對待。

因為這樣的不確定性,我們額外增加了兩個設計來對結果進行內部驗證,同時也對我們問卷的遣詞造句非常注意。在大多數調查當中,研究者在進行前測過後,會對答案保持信任。在我們的研究中,我們處於一種非常正的位置。因此,我們對那些洩露資料中已知的五毛賬號進行隨機抽樣,對他們也發放同樣的調查問卷。 

在第二個補充設計上,我們對那些不是五毛黨的成員也發送了問卷。我們從新浪微博上抽取了那些沒有和政府微博進行互動且粉絲數量大於10的賬號。我們想要看這些賬戶中有多少人會承認他們自己是五毛黨。

我們減少不確定性的最後一步是對我們的研究問題進行了設計。我們盡可能在問卷中迴避敏感問題,使用正向和積極的語言,使問題更加符合文化語境,我們還進行了前測。為了要對受訪者進行保密,我們不能把問題公佈出來,因此我們選擇了一個類似的版本:我觀察到您的評論,它非常的振奮人心,我想問,您是否接受過輿論引導方面的培訓,或者有著網絡評論的相關經驗?

為了避免干涉或者影響我們的研究對象,我們避免使他們處於一個不舒服的位置,而用相對積極的詞彙來形容網絡上的宣傳活動。我們使用「輿論引導」和「網上評論」,是因為政府使用的官方詞彙。我們避免使用五毛這類消極的詞彙。

 

2、結果

有3.5%的回復率就能夠稱為高質量的網絡調查(Pew)。我們研究的回復率高達6.5%。此外,不同于一般的網絡問卷,我們可以對受訪者的身份進行核查。就像我們所預期的那樣,五毛黨比非五毛黨更不願意回應我們的問題。

我們的三組調查結果如表所示。我們發現我們預測的五毛黨中有59%承認他們自己是五毛黨。如果我們的預測是正確的,就有41%的人沒有認真回答。而那些在洩露的資料中已經被認定是五毛黨的人中,有57%承認他們是五毛黨。把兩組比例進行統計檢定,發現沒有顯著差異。而對於那些我們隨機抽取的不是五毛黨成員的樣本中,有19%承認自己是五毛黨。把這組數據和我們預測是五毛黨的數據進行比較,兩組數據有顯著差異。調查顯示,結果明顯地支持了 Section4中對於五毛黨身份的預測。


六、五毛黨的規模

我們發現中國政府每年會在全國範圍內編造4.48億則貼文,其中有52.7%的貼文會出現在政府網站上。剩下的2.12億貼文則分佈在商業網站上。如果這個估計是正確的,政府網站上的評論中有很大一部分都是由政府編造的,商業網站上每178則貼文中,就有一條是政府編造的。貼文並不是隨機分佈的,就像我們在表2中所看到的那樣,這些貼文按時爆發,按照特定的目的和內容。接下來我們要解釋如何估計這些數字。

 

1、社群媒體貼文的數量

為了了解五毛貼文的脈絡,我們首先估計全中國社交媒體貼文的總數。在2012年12月,民眾每天在新浪微博平台上大約發佈1億則貼文,也就是一年365億則貼文。新浪微博是已經的1382個社群網站之一。在我們的數據中,所有貼文比新浪微博貼文的比例是1.85,因此我們估計全平台上的貼文數量是365億*1.85=675億。可是,這要假設兩者有著完全相同的比例。權衡之下,我們採用了一個研究機構(iiMedia Research Group) 把比例設定在2.10。因此估計全年產生貼文數量為365*2.1=804億。但這仍然低估了貼文的總量,因為部落格被忽視了。

 

2、章貢區貼文的數量

在43757則被確認的五毛貼文中,有30215則是在2013年2月11日到2014年2月10日之間的。我們有證據顯示章貢區至少有1031個「特殊賬號」在新浪微博上,包括202個洩露的賬號,和829個我們在洩露資料之外確認的。

我們假設洩露資料之外的賬號發文比例和洩露賬號的發文比例一致,那麼章貢區2013年一共發帖30215*(1031/202)=154216條

 

3、江西省貼文的數量

根據中國互聯網信息中心的統計資料,2013年中國互聯網在城市居民的滲透率為62%,在農村為27.5%。根據中國官方的人口統計資料,江西省總人口4522萬人,有2210萬人生活在城市,2312萬人生活在農村。

 

基於上述數據,我們可以計算章貢區每個互聯網用戶平均產生多少則五毛貼文,計算方法為: 章貢區一年產生的五毛貼文/章貢區的人口數 * 城鎮互聯網滲透率 = 154216 / 468461 * 0.62 = 0.531

 

我們再把這個比例推廣到江西省,江西省共有互聯網用戶人數 = 0.62*22.1M + 0.275*23.1M,再把互聯網用戶人數*0.531 = 1065萬

 

4、全中國貼文的數量

使用同樣的方法推廣到全中國。江西省平均每個互聯網產生的五毛貼文數 = 1065萬 / 1468萬 = 0.7255

再用0.7255乘以中國的互聯網用戶數量6.17億,最終得到全中國一年發出的五毛貼文數,約為4.48億

 

七、可能存在的錯誤

這篇論文的推論是建立在洩露的資料的基礎之上的,資料的數量以及複雜性使其很難能夠被偽造,也不太可能是有人為了誤導我們。我們通過多種方法來驗證這些資料,包括特定的個體、郵件、電話、社交媒體賬號、政府部門等等。

 

中國政府的草根營銷行為也有可能並不遵行上述模式(例如就我們遇到的證據來說,中國共青團組織也涉及編造社交媒體內容)。可能會有其他的組織者在不同的地方會遵行不同的規則和實踐,產生不同的五毛內容的五毛貼文。但是這必須要等到更多的證據被挖掘出來。這篇論文的貢獻是揭露中國政府的秘密項目,幫助研究者了解中國的不同層面,以及了解相關的威權政體。

 

我們觀察到中國的五毛貼文很大一部分與「讚頌」有關,還有少部分的「非爭論性讚美與建議」和「事實性報告」。因為在數字時代中,人們接受的信息增長速度非常快,但是人們的注意力又相當有限,因此大規模的讚頌類的貼文在某種程度上可能會轉移和分散人們的注意力。我們無法證明人們在多大程度上被這些貼文轉移了注意力,以及這些貼文的效果到底為何。

 

我們推論五毛黨活動的目的是為了停止爭論(分散注意力比加入爭論更加有效)和分散公眾對於可能誘發群體性事件的事情的注意力。作為推論,它們難以被直接觀察,我們提出五個替代性的解釋作為我們的證據。

 

第一,五毛黨是傳統的宣傳系統功能的一個簡單延伸,他們並不總是關注群體性事件。這種觀點是非常有可能的,宣傳部門的工作者參與到「讚頌」中來是因為他們沒有超出的動機,他們被一種「持續的國家宣傳邏輯」所引導。但是另一方面,「讚頌」與和我們所認為的傳統的中共宣傳部門的引導媒體和塑造民意的行為和很大區別。此外,我們的研究還顯示五毛發帖存在著合作和爆發點,它們都出現在可能會引發群體性事件的時間點上。

 

第二,讚頌的行為(討論和事件不相關的議題)可能創造一個積極的共識,使得人們對於政權的態度發生積極的轉變。這可能是真的,但是效果可能並不顯著。這個假設需要通過進一步的實驗來驗證。

 

第三,五毛貼文是否改變了民眾對於某些事件的消極態度?事實上,這不太可能發生。因為和事件不相關的五毛貼文沒有改變消極評論和積極評論的平衡。五毛貼文確實改變了消極評論在總體評論中存在的比例,但是研究顯示這樣的行為不能改變民眾的認知和信念。

 

第四,五毛貼文的行為可能是人們正在遭受監視的信號。這樣的監視行為可能會使得民眾在發帖或者進行其它活動時進行自我審查。但是如果中國人無法分辨出哪些貼文是五毛貼文的話,這樣的假設就可能並不正確。

 

第五,五毛試想了一種可能,那些較少出現的貼文(非爭論性的讚揚或批評、事實性報告)是否有可能是諷刺?這是有可能的,但是我們的方法是由人工編碼和計算機輔助進行的,這樣複雜的情況可能會使得人工編碼員感到困惑,也會誤導社交媒體用戶。事實上,對於這些貼文進行分類不可能是完全正確沒有錯誤的,但是大量的讚頌型貼文可以讓我們的結論保持不變。

 

八、理論意義

這些結果如上所述已經非常清晰了,但是他們對於研究中國政府的整體策略,對研究威權整體有什麼普遍意義呢?我們首先歸納先前中共宣傳部門對於人工審查和機器自動過濾的行為研究,然後再把這個研究放到整個威權研究的文獻脈絡下。


1、中國

對於本文的研究現象,我們歸納出兩種規則可以用來解釋中國政府進行信息控制的行為。一種是消極的,一種是積極的。消極的規則是中國政府「不參與爭議性的話題」,五毛貼文不會為政府、領導人和政策而辯護。而積極的規則是,政府「中止一切可能引發群體性事件的討論」。

這兩種策略都來自同一個事實:中國政府意識到,在數字時代中國政權的威脅不來自外部的軍隊,而來自內部的人民。對於政府來說,平衡社交媒體上的支持性言論和批評性言論是非常有效的。中央政府可以通過批評性言論了解到地方官員和地方治理的情況。

分散注意力是一種有效且聰明的信息控制策略。使得一個爭論消亡或者改變它的主題比直接參與爭論來得更加高效。這種策略的的另一個優點是,它更加不會引起人們生氣的情緒。第三個有點是能夠讓政府不需要使用其他額外的審查手段就能夠控制民意。

 

2、威權政治

這個研究能夠幫助理清現有理論中信息的角色,特別是是在革命動員理論中,什麼樣的知識能夠被稱為「共有知識」。比較政治領域的許多理論都假設,獨裁者為了阻止抱怨型的共有知識的發展,會降低批評性信息的流動速度,以降低反政府動員的可能性。這種觀點認為,在革命動員中,合作是重要的,而合作又要求成員之間擁有抱怨型的共有知識。

比較之下,本研究的研究顯示,中國政府的行為模式不同於上述觀點。一方面,中國政府允許具體的抱怨存在,另一方面,他們避免任何有可能會引起群體性事件的抱怨。

事實上,關於獨裁政權的抱怨是顯而易見和無所不在的。民眾了解和學習這些抱怨,並不會造成革命的可能性或者引起反抗。

基於這樣的邏輯,抱怨型的共有知識已經變得十分平常,允許它們的存在對於政權來說沒有什麼特別的風險。真正對於政權有風險的事情是大規模集體性行動的貼文,但是政府可以通過審查和編造貼文的方式來管控它。


九、總結與評論

學術界和政策制定者長久以來把關注的焦點聚焦在物理空間上(例如中國南海問題),我們認為應該在互聯網上的虛擬對抗空間多下工夫。我們認為更多的資源和研究應該被投入到這個領域里來。

其次,長久以來無論是記者、學術界還是社群媒體用戶,都認為五毛黨會在網路上維護政府、領導人和政策,但是我們的研究發現這種看法是錯誤的。五毛黨在網路上主要是讚頌政府,而不參與討論。我們認為這是中國政府為了分散和轉移民眾的注意力。

最後,所謂的五毛黨大多數都是由政府僱員組成。在網絡上發帖是他們的兼職工作。我們估計五毛黨每年在網絡上發佈4.48億則貼文。

與本研究問題意識相關的概念與延伸對話:

延伸閱讀:(請用學術體例將參考文獻中值得延伸閱讀之文章、書籍或網址列於此處)

King, G., Pan, J., & Roberts, M. (2013). How Censorship in China Allows Government Criticism but Silences Collective Expression. American Political Science Review, 107(2 (May)), 1–18.

King, G., Pan, J., & Roberts, M. E. (2014). Reverse-engineering censorship in China: Randomized experimentation and participant observation. Science, 345(6199), 1–10.

關鍵字:

Social media; Weibo; censorship; 50c party;

Online discussion networks; Connectedness; Responsiveness

資料狀況:

■ 電子檔(摘要/全文):           

□ 紙本(摘要/全文):           

□ 其他狀況:           

如有重要相關圖表及附件請附在本頁後面,並在「其他狀況」項目內註明,如:附圖二張。

How the Chinese Government Fabricates Social Media Posts for Strategic Distraction, not Engaged Argument.docx