Towards a typology of hashtag publics: a large-scale comparative study of user engagement across trending topics

書名(以學術體例詳填資料,網路來源提供超連結及檢索日):

Bruns, Axel, et al. "Towards a typology of hashtag publics: a large-scale comparative study of user engagement across trending topics." Communication Research and Practice (2016).

http://www.tandfonline.com/eprint/pT4Cb5xWnmiv5QSEqNNn/full

導讀者:林聖翔

原作摘要:

Hashtag被推特使用者廣泛的應用在各類事件中,但對於它的用途讓位有一個全面性的瞭解,例如hashtag在災難事件、媒體事件上的用法有何不同?他們拿近五年所收集到各種大小的資料集來分析,而如果未來可以分類新出現的hashtag,希望進一步可以辨別各種事件的主題趨勢,去自動偵測災難或者新聞等。

重點整理:

1.        Introduction

Hashtag近幾年來成為推特上明顯且持續出現的一個特徵,連占據社群網路龍頭的臉書前陣子也加入了hashtag這個功能。而目前hashtag在推特上會自動顯示超連結在推文內文中,並且導向到目前推特上還有哪些推文也使用到該hashtag,這個頁面即使是沒有註冊推特的人也可以瀏覽。

Hashtag所形成的趨勢可代表推特上的主流意見。推特官方API的限制,使用hashtag(或者廣義來說keyword)來抓取資料,相對於其他的方式較為容易,使他們有了豐富的資料集可以研究與比較。

他們先在網路上搜尋了hashtag的相關研究,發現大都是探討新聞或者政治類的議題。以2016年為例,google scholar上關於”hashtag”與”news”的有16300篇;”entertainment”和”sport”的僅有4000篇;和”meme(網路爆紅)”有關的更只有2000篇。而新聞政治類的推文,通常會把hahstag當作要彰顯某個關鍵議題用;運動娛樂類的則通常只把推特當作直播平台使用。而同樣的字詞,當作hashtag用會比單純一個字彙來的更加強烈。

這篇研究,他們想比較不同種類的事件,hashtag使用上的異同。之前有相關研究是探討選舉活動與天然災難,但資料集不夠大與廣,他們需要更大更廣的資料來深入研究。Hashtag很可能只代表某特定子集合的交談情形,如果要探討資訊的傳播流動途徑,也需要觀察follower/followee的關係。

近期,推特為了留住user,新加入了”當你離開時”的功能,此功能會在app頂端顯示使用者上次退出後錯過的重要推文。以及在推特首頁左邊顯示的近期熱門趨勢關鍵詞等功能,進而可能影響使用者在發表推文時hashtag的使用。

Bruns and Stieglitz(2012)的研究中,他們拿更大更新的資料集來比較分析hashtag資料在不同事件的現象。透過圖1我們可以觀察到,acute(災難、政局動盪等)事件所含轉推與URL的比例都較高,而media(運動、娛樂節目、選前造勢晚會等)事件則都較低。

2.        Data sources and methodology

他們參考了Bruns and Stieglitz(2012)相同的指標來觀察資料集,分別是資料集的推文數、轉推(retweet)比例(包含手動轉推也算)、含url的比例等。主要使用下列三種工具抓取資料:

yourTwapperkeeper(2012),使用推特官方的search和streaming API。

TCAT(Borra & Rieder, 2014)則只有使用streaming API抓取資料。

TrISMA - Tracking Infrastructure for Social Media Analysis (Bruns et al., 2015)則是抓取280萬澳洲推特使用者的公開推文,由Bruns, Burgess, and Highfield (2014)等人識別的。總共所有的事件資料集時間橫跨六年,這段期間推特官方的API也有更動,為了讓各方收集的資料盡量不要影響分析後的結果,所以才只看以上三種單純的指標。

3.        Analysis

圖2的散點圖共有192個資料集,點的顏色是該資料集開始抓取的時間,點的大小是資料集大小,xy軸分別是url及rt的比例。他們除了想證明圖1的理論還是否一樣外,也想觀察有沒有其他種類的事件。

他們發現,很多近年來(2015)的事件都在散點圖的右上角(高rt, url比例),但這個現象仍然要進一步觀察,看這是趨勢使然還是只是因為推特抓取資料的技術日漸成熟。接下來他們先觀察acute和media event這兩種類別,這是Bruns and Stieglitz(2012)已經定義過的。

4.        Acute events

從圖3可以看到,大部分的緊急事件RT的比例約集中在35~75%、含URL的比例約在40~80%,特別是近年來(2014, 2015)這兩年的資料,主要都分布在URL60%以上。他們發現,在危機類別的事件中,推特被新聞媒體記者當成一個做現場報導的重要媒介,所發佈的推文就容易讓大家轉推及分享URL。一些緊急管理的組織所發佈的推文,內含URL的連結也逐年上升,例如2011年的#qldfloods只有36%的url,而最近的#tcita, #tcdylan, #marcia等澳洲熱帶氣旋的事件url所含比例約在61~68%之間。

2014~2015年的資料集中發現,透過keyword抓取的資料集比透過hashtag抓取的資料集,所含url比例要多,例如敘利亞、森林大火、地震等資料集。他們發現推文在分享新聞報導時,內文通常會包含新聞標題,也可能是因為這樣的原因,導致keyword的資料集含有較多的url推文。

而keyword的資料集大部分比起hashtag的資料集,轉推比例則較低,幾乎全小於50%。例如2014年致力的地震與海嘯,keyword資料集”Chile”, “terremoto”皆只有含43%, 49%的轉推比例。但#tsunami的資料集卻有74%的比例。這代表在緊急事件中,hashtag能增加推文的能見度,也表示使用者較有可能發現與轉推含有hashtag的推文。

而#volcano這個事件比較特別,高達97%的url以及89%的rt,這個離群值他們發現反而不是發佈緊急的火山活動之類的訊息,而是分享最新最美的火山爆發攝影照片。概觀來看,觀察資料集包含了使用hashtag和無hashtag的,結果類似圖1的歸納。但和Bruns and Stieglitz(2012)的研究相比,近年來acute event中的url比例有上升的趨勢。

5.        Media events

關於媒體,近年來大家有將推特當作second-screen channel的趨勢,意思是除了看電視節目外,會利用推特參與節目的活動或者發表評論等等。由圖4可以發現,就算是近年來的事件,url的比例也幾乎不高於30%,其中的#theprojecttv的結果很像acute event,判斷是因為該澳洲節目是一個針對時事做出評論的脫口秀引起的迴響。而#oscars這個hashtag在2011年僅有8%url、25%的rt,到了2013年提升到了28%url、44%rt,雖然14, 15年沒能拿來比較,但2014年的全明星自拍那張照片成了有史以來最多轉推數的推特照片(Smith 2014),他們預期未來可以看見越來越多頒獎典禮的資料集會趨向acute event的url及rt的比例分佈。

#hottest100這個資料集是年度流行百大單曲,會有高達58%的rt可能只是因為官方帳號拿推特做倒數的live tweeting。總而言之,主要的國際傳媒活動他們認為越來越類似acute event。

6.        Political events

在Bruns and Stieglitz (2012)的研究中,選舉等政治類別的事件是歸類在media event的,但如圖5可以發現到,幾乎已經類似於acute event的模式了,但以他們的分析目的來看,還是分開來看比較好。而政治相關的使用者也越來越重視推特平台,近年事件url上升的原因,他們分析是政治相關的推文幾乎都會附上重大新聞的連結,甚至是相關議題的圖片。比起acute event,政治事件的資料集rt比例較高,約落在60~70%。他們也發現,一個長期議題所形成的hashtag,會引來大量的轉推數,因為是一個主題。其中#agchatoz是澳洲農業的政策議題,可是是較專門的議題討論,所以轉推數較低。而taiwan election只有32%的轉推,可能是因為下的關鍵字是三大黨名稱及候選人姓名,導致有hashtag的推文沒那麼多,進而影響到轉推比例。而台灣318太陽花學運以及香港佔中事件,他們認為議題牽扯甚廣,既屬於acute也屬於政治類的事件。

7.        Sport events

在Bruns and Stieglitz (2012)的研究中,運動類的事件原本也是含在media event的,url和rt的比例都偏低,但時常推文的總量卻很多。其中也含有一整賽季的資料集,現象也和一般的media event有所不同。在2011年早期的資料集中,大部分都在散點圖中的左下,不過相同的事件在之後都有往右上方移動的趨勢。例如AFL總決賽、F1賽事都有這樣的現象。和這些特定的關鍵賽事相比,長期賽季的資料集大約有40%~70%的URL、但RT比例只有30%,可能是因為整個賽期中發佈具有轉推吸引力內容(retweet material)的使用者較少。

另外也可以發現到像倫敦奧運這種世界級的活動,因為社群媒體使用的興起,使得轉推及url比例與acute event相同。

8.        Keyword hashtags

下面介紹以hashtag為關鍵字去收集的資料集,如圖七為例發現到都擁有極高的url比例(僅2015年有資料),他們發現到很多用法是直接把特定想強調的詞當作hashtag使用,並穿插在句子中,例如:” New #job in #datascience available in #brisbane”。也發現特定議題的hashtag可以吸引較多的轉推,例如#climatechange、#bigdata,大概40%以上;反之#job、#地名等較通用的hashtag的rt比例較低。

9.        Meme hashtags

Meme是指某人或某事一夕間在網際網路上被大量宣傳及轉播,一舉成為備受注目的現象,稱為網路爆紅,其中#illridewithyou、#jeNeSuisPasCharlie分別是雪梨挾持事件後支持澳洲穆斯林的運動、我不是查理,來抗議查理週刊的新漫畫(2016年1月,法國諷刺報紙查理周刊作品試圖將淹死的三歲敘利亞難民兒童Aylan Kurdi與德國新年性侵案犯聯繫起來,引發激烈爭論。Kurdi在與家人一道逃亡的路上不幸死亡,他的屍體的照片引發了歐洲公眾對難民的最大同情。查理周刊作品暗示如果Kurdi到達了歐洲,他可能也成為性侵案案犯中的一員。)。這兩個事件的脈絡比較類似acute event。

而#distractinglysexy是指2015年諾貝爾生物或醫學獎得主添亨特(Tim Hunt),最近因為一番歧視女性科學家的言論,被逼辭去他在大學的所有職位。他指出女性有著「令人感到騷擾的性感」(distractingly sexy),男性和女性一起工作,不是男愛上女,就是女愛上男,再加上女性面對批評就會哭,所以他認為,男女做科學研究是應該分開。此事件因為話題性以及部分女科學家踴躍地在推特發布照片諷刺地示範他們如何在工作中表現性感,所以轉推數極高。相對來說,像#fail這類通用性的hashtag,rt及url比例就較低。

10.     Conclusion

透過2010~2015的眾多資料集,他們證實了一些Bruns and Stieglitz (2012)的研究中提到的現象,也識別了一些使用hashtag新的類別。在acute、政治及運動事件中,分享url及轉推的行為都有顯著的提升。而過去一些事件被歸類在media的,他們覺得需要重新定位在acute事件中,因為rt和url的比例都有上升,也是因為社會各界開始廣泛地使用推特,自拍,網路紅人,vine短片的興起亦是原因之一。

在以hashtag為關鍵字去收集的資料集中,他們發現一個不太一樣的現象,很大部分只是要強調某個字詞,而不是一個完整的公開議題。他們發現,最後影響url及rt比例的因素,有很大一部分是資料集的大小,以及其中使用的hashtag會不會引發國際性的討論,或者只有地區性的使用者參與。在未來,他們也會持續地擴大資料集來研究,而hashtag確實是推特中一個很重要的元素,但推特仍有一些特性可能是無hashtag的推文可發掘到的,有待未來進一步的探討。

與本研究問題意識相關的概念與延伸對話:

延伸閱讀:(請用學術體例將參考文獻中值得延伸閱讀之文章、書籍或網址列於此處)

http://3c.technews.tw/2015/01/04/twitter-rolling-out-while-you-were-away-feature/ (幫你回顧錯過的有價值推文訊息,Twitter 在想方設法留住使用者 | 3C 新報)

https://en.wikipedia.org/wiki/Second_screen 

https://zh.wikipedia.org/wiki/%E7%B6%B2%E8%B7%AF%E7%88%86%E7%B4%85 (網路爆紅 - 維基百科,自由的百科全書)

與危機傳播相關之關鍵字及其概念內涵:

□ __________: 

□ __________:

□ __________:

□ __________:

hashtag comparative study-聖翔160607.docx