what trends in china social media
書名(以學術體例詳填資料,網路來源提供超連結及檢索日):
Yu, L., Asur, S., & Huberman, B. A. (2011). What trends in Chinese social media. arXiv preprint arXiv:1107.3522.
導讀者: 朱蘊兒
原作摘要:
隨著全球社交網絡的使用量不斷攀升,與Twitter和Facebook相關的研究已經達到了一定規模,但聚焦于新浪微博的研究卻不多。本研究探討新浪微博的熱門話題,並與Twitter比較。我們發現,這二者之間有很大差異。新浪微博上的熱門話題主要是笑話、圖片與視頻,而Twitter上的熱門話題則更集中于新聞事件。
重點整理:
研究目的:分析新浪微博上內容的熱門程度與影響力的決定因素、熱門話題的形成過程以及資源的分配,并將其與Twitter進行橫向對比。
文獻回顧:
1. 出入度分佈:社群媒體(包括Orkut, YouTube, Flickr, Yahoo!360)中的用戶節點的出度與入度的分佈符合冪次定律(power-law)。
2. 社交影響(Social influence):社交影響指的是人們爲了更增進自己與朋友的關係,而改變自己的行為。比如Xu等人對中國幼稚園兒童攻擊性行為的研究,發現教師會將有攻擊傾向的兒童與沒有攻擊傾向的兒童分配到同一組內,這個方法可以有效地減少兒童的攻擊行為。另外,文章也援引了幾篇研究來反對將粉絲數、發文量作為用戶影響力的評判指標。
3. Twitter熱點:像紐時等傳統媒體在製造Twitter熱點話題上有著顯著的優勢。
4. 中國網絡:2008年7月中國網民數達到2億5千萬,超過美國成為世界第一大網絡市場,但中國部份地區的網絡普及率仍然很低。中國政府在促進網絡發展的過程中扮演著至關重要的角色,按照技術與政府政策的變遷,可以劃分成以下四個階段:
a) 1986-1992:網絡僅作為收發郵件的工具,被用於少數擁有電腦的研究室。
b) 1992-1995:中國政府開始大力發展網絡,并建設了信息基礎設施。
c) 1995-1997:中國政府持續發展網絡,以期促進國家經濟發展,同時也推出相關政策控制網絡信息。
d) 1998至今:網絡成為中國社會中中重要的媒介。
5. 中國線上社群:中國公民借由網絡社群進行自我組織、觀點交換和訊息分享。
研究方法:
實驗一(熱門關鍵字):持續30天觀察新浪微博1小時話題榜(每小時更新一次),并對榜上的關鍵字進行檢索,共得到4411個關鍵字,并撈取該關鍵字下轉發量最高微博。同時,研究利用Twitter搜索API撈取到3361個熱門話題關鍵字,以及1.632千萬條相關推文。
實驗二(用戶隨機抽樣):在新浪微博上隨機抽取1732個用戶,并抽取他們100條貼文,計算其中包含有圖片、視頻、鏈接的貼文所占的比例,以及轉發自他人的微博的比例。
研究結果:
1. 用戶發文數與相對的用戶數的分佈符合冪次定律,用戶發佈包含熱門關鍵字的微博數與相對的用戶數的分佈也符合冪次定律。
2. 按照熱門關鍵字檢索出的轉發量最多的微博并撈取它的作者的訊息(ID、自我介紹、是否認證、包含熱門關鍵字的微博數、包含熱門關鍵字的微博的被轉發量、總話題數、被轉發率,注:被轉發率=被轉發總量/包含熱門關鍵字的微博數),并將這些作者按被轉發率降序排列,發現:
a) 作者:新浪微博影響力排名前20的用戶大多與娛樂有關,其中只有4位是經過認證,且只有1個是媒體組織,這些帳號也會作為討論與分享的平臺存在;而Twitter排名前20的用戶中主要是新聞媒體,說明新浪微博用戶更傾向於傳佈瑣碎、不重要的內容。
b) 轉發數:新浪微博的轉發數相較于Twitter要高好幾個等級,且主要集中在少數幾個帳號。
c) 發文形式:大多數微博都包含有圖像,部份微博包含有視頻或鏈接。
d) 粉絲:熱門用戶的粉絲數均高於關注數,並不主動搜尋他們想關注的人,相反他們發佈內容以吸引人來關注他們,這是新浪微博與Twitter的共同之處。
3. 用戶隨機抽樣:
a) 原創/轉發情況:平均轉發比率為50.24%,不同轉發比率的用戶數分佈差異不大。
b) 發文形式:56.43%的貼文包含有圖像,而僅有5.57%的貼文包含有視頻、8.03%的貼文含有超鏈接。而在Twitter中所有形式的媒介都以超鏈接的形式被分享,而僅有6.6%的貼文含有超鏈接,比起新浪微博來說,這一比率非常低。
Junior’s opinion:
1. 缺少具體的研究方法介紹,比如新浪微博的檢索方式和檢索結果;
2. 且根據已知的研究方法來看也有很大的問題,一是它直接將新浪微博公佈的熱門話題榜作為檢索的切入點,有囿於新浪微博所設置的議程的危險,二是將熱門關鍵字搜索出的轉發量最高的微博發文者視為關鍵用戶進行研究,其產生偏頗結果的可能性不下于被它批判的「直接以粉絲數作為用戶影響力考評指標」的方法。總之,這篇文章使用的只是部份的、不完全的big data分析方式,以半人工半自動化的方式來完成,但在人工方面研究方法的設計上又不夠縝密,此之為一大缺陷。
3. 新浪微博和Twitter上獲得的資料並不具有絕對的可比性,因此推論不太嚴謹,比如在比較發文形式時,新浪微博上的數據是熱門用戶包含有熱門關鍵字的貼文中,有圖片、視頻和鏈接的百分比,總體是那些轉發量最高的貼文,而Twitter上的數據指的卻是所有包含了熱門關鍵字的貼文中,有圖片、視頻和鏈接的百分比,總體是所有的貼文。
與本研究問題意識相關的概念與延伸對話:
延伸閱讀:(請用學術體例將參考文獻中值得延伸閱讀之文章、書籍或網址列於此處)
與危機傳播相關之關鍵字及其概念內涵:
□ __________:
□ __________:
□ __________:
□ __________:
資料狀況:
□ 電子檔(摘要/全文): 電子檔全文
□ 紙本(摘要/全文):
□ 其他狀況:
如有重要相關圖表及附件請附在本頁後面,並在「其他狀況」項目內註明,如:附圖二張。