Usability of small crisis data sets in the absence of big data

水火計畫讀書會書目摘要單

書名(以學術體例詳填資料,網路來源提供超連結及檢索日):

Paul, Avijit & Bruns, Axel (2013) Usability of small crisis data sets in the absence of big data. International Conference on Information, Business and Education Technology (ICIBIT 2013)

導讀者:黃淑琳                              

原作摘要:

災難傳播喜歡研究Big Data。但如何以收集data、用什麼適當工具仍是許多人無法掌握的。這篇研究從small data著手,觀察small data比起big data是否能突破資訊收集與分析工具的限制,更適用於災難傳播&後續行動上。

重點整理:

Big data vs small data

Ÿ  比例關係:如果big data有上百萬組資訊,small data就是上千則。

研究方法

Ÿ  目的:觀察tweets中地理資訊的變化,確認twitter上的討論是否能讓救災組織及時處理。

Ÿ  收集2011年,紐西蘭地震時含有#enqz的tweets,共164,390筆。

Ÿ  以災難發生後的黃金24小時做為資料撈取的時間框架。

整體資料呈現的情況(24小時內,每六小時的關鍵字變化量)

Ÿ  前6小時,媒體報導與使用者傳散,twitter上最常被提到的是國家名(NZ)和區域較廣的地名(Christchurch)。

Ÿ  災害後第12小時開始,大家談論的地名會越來越詳細、精準討論到確切災情地區、地點 (CTV大樓)

Ÿ  從tweets來看使用者對紐西蘭地震的地理認知:大地名→小地方。

特定地區討論量的趨勢觀察(救災需要),依序為

Ÿ  Cathedral:最早被影響的地區

Ÿ  Hospital

1.  有人在找醫院

2.  或是有醫院受地震影響

Ÿ  Airport:曾一度傳聞受影響,後證實無礙

Ÿ  CTV or Canterbury Television Building:超過半數的傷亡名單來自於此

討論

Ÿ   從small data中特定地區被提到的次數,確實可在災難發生時幫助做出立即判斷。(至少先判斷廣泛地區,再繼續關注到特定區域)

Ÿ   但有些地區名稱太像,會產生混淆(有很多地區景點以cathedral命名),需要進一步過濾。

結論

Ÿ   研究結果顯示,小資料的蒐集與分析對於災難發生時辨識急需幫助的地區相當有用。

Ÿ   註:雖然撈取資料的時間點是在#eqnz變得較為熱門之後開始,所以錯失相當數量的資料,但仍不影響地理區位的辨識。

 

摘要_Usability of small crisis data sets in the absence of big data.docx