Developing Metric to Characterize Flickr Groups

書名(以學術體例詳填資料,網路來源提供超連結及檢索日):

Developing Metric to Characterize Flickr Groups

發展塑造Flickr群組的標準

JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY, 62(3):493–506, 2011

導讀者: 鍾穎

原作摘要:

    Flickr是大規模線上照片分享網站,被認為是典型的web2.0的範例,研究者通過Flickr來觀察線上社群的社會行為。Flickr的一個主要的特征是群組,其提供一個有共同的興趣的群組來組織、分享、討論照片。本文探索了大量在Flickr的群組,提出了一個新的標準來看Flickr的關係、傳播活動和傳播結構。收集了1000個群組的資料來確立這套標準和更深層次地看Flickr的群組信息,如群組的大小。本文的貢獻的有以下幾點:一套塑造和拓展了現有的線上群組的標準;一個評估群組人數的方法;通過分析1000個隨機的群組來深層觀察Flickr的群組;和自動收集Flickr上的群組資料來觀察我們在公共社群上的經驗。


重點整理:

一、  相關研究

研究發現用戶不會對一特定的群組分享大量的照片,對社群的忠誠度較低。同樣,同一張照片也不會被分享到很多群組,平均每張照片會被分享到3.1個群組,沒有太多的照片循環。

下表為群組參與者、交流活動和參與者結構的標準。

 

下表是關於yahoo社群的標準


Herring在2004年總結了以下六點線上社群的關鍵特征:

 

二、 提出的標準:

本文根據之前研究所提出的標準,提出了Flickr數據、解釋和拓展,以及是否能抓取。Flickr也被成為觀察世界的眼睛,如不同時區地點的交流可以看出世界的聯繫,還有性別也很重要。不過很多資料沒有直接抓取。


三、 研究方法

研究會分為兩階段。第一階段是初步的根據經驗的研究Flickr group做Flickr社群的統計分析。第二階段是清晰的分析1000個隨機選出的群組去驗證所提出的標準。

資料從2008年9月收集到12月,包含API所提供的資料了自己爬去的資料,樣本的資料主要集中于2008年12月。通過搜索<space>來抓取當天所有的公開群組共461272個。不過現在此方法已不可行。通過Flickr API來抓取20個最熱門的tag翻譯成各種語言來抓取。用以上兩種方法共收集到299688個群組資料。再從中選出1000個群組,這1000個群組的平均成員數為1054,標準差為2497。比較所有群組和樣本群組的前200多的tag,有84%是一樣的。

群組所收集的資料有:a.成員數 b.描述長度 c.第一頁的討論歷史 d.上傳照片數e.討論數 f.第一張和最後一張上傳的照片 g.200個最熱門的tag h. 5000張最近上傳的照片。對於每張照片,收集了照片的標題、擁有者、tags、上傳日期。對於用戶,收集了地理位置、主頁的狀態、其他的社會連接屬性(如聯繫方式、愛好、成員關係)


四、 結論和分析

1.Flickr社群的統計概況

  下圖是Flickr一周內群組數的增長圖。(一周內沒10秒搜索一次<space>)


  以停用詞、所有群組的前20tag和篩選的前20tag(tag沒有出現在其他語言中)看各語言的比例。如下圖,英語和西班牙語最多,其他以歐洲的語言為主。


2.樣本Flickr社群的特征(根據之前所提出的表格)

A 成員

a 存在時間

  以第一張照片的上傳時間為起始時間,約有50%的社群在去年創造,說明很多社群使用後會被刪除

b 成員數

  在群組樣本中有20%的社群只有1個成員,50%的少於10,80%少於100。成員數較少。與yahoo成員數平均164,最多2245相比少很多。

B 傳播活動

a 總照片數

  20%的群組沒有照片,表示沒有使用過,50%的群組少於100張,有少數的非常大,有一個社群有超過1億張,另外有3個超過100000張。(照片平均數2983,中位數79,最多1315519)

b 每日平均照片上傳數

  41個社群存在少於1天,20%的群組沒有照片,44%的平均數為1,10%的平均數為2。平均只有1.635條消息每天,低於Butler的活躍的標準。

c 每位成員的平均上傳數

  超過50%的群組,成員上傳少於5找張照片,大約80%的群組,成員上傳照片數少於10.(平均數21.09,中位數4.41,最多8876)符合前面所提到的低忠誠度。人數多的大群並沒有吸引比較多的人上傳照片。

d 總討論數

  50%的群組沒有討論,40%的群組只有一條討論。只有9個群組有超過100則討論。

C 傳播結構

a 核心用戶掌控度

  在20%的群組中,最活躍的用戶上傳10%左右的照片,20%的群組中,最活躍的用戶上傳超過10%,少於20%的照片。有17%的群組,一個人上傳了90%~100%的照片,有100個群組一個上傳了100%的照片。少於10人的小群組,有一半是一人貢獻所有照片。Bluster(1999)曾指出兩個活躍用戶會貢獻超過30%的照片,對於小群組不適用。

D 形式化

a 群組規則的單字數

  66個群組沒有描述,30%少於100個字母,如沒超過一句話。超過100個群組超過1000個字母,有兩個超過10000(平均數484,中位數158,最多23581)

b 群組管理員

  有274個群組沒有管理員可能是被隱藏了,90%的群組只有一個管理員,這是Flickr的預設,創造者即為管理員,有10個群組有超過10個管理員。(平均數1.57,中位數1,最多121)

E 群組大小的特征

  樣本中有很多小社群,只有20%的群組超過100個成員大約30個群組超過1000個成員。這些群組活躍度高,平均成員數855,平均照片數13721。10%的大群組在6個月內創立,約有4分之1創建少於1個月。總照片的3%在這些大群組裡出現,90%的大群組,活躍的用戶貢獻少於20%,沒有群組的主導者。

  194個群組約40%的群組少於10人,且沒照片。149個群組只有一個成員,而55個群組多于100照片,有一個群組有8876張照片。

10%的小群組沒有描述,37%少於100個字母的描述。4分之3的群組都不活躍。

下表最小和最大的5個群組的各項參數。


五、 結論與未來研究

本文建立和拓展了一套方法去探討線上群組。可以進一步做質化研究,看不同規模的群組的不同特性。也可以研究以個體為中心的互動行為。

Developing Metrics to Characterize Flickr Groups.pdf
Developing Metrics to Characterize Flickr Groups_鍾穎.docx