Usability of small crisis data sets in the absence of big data
水火計畫讀書會書目摘要單
書名(以學術體例詳填資料,網路來源提供超連結及檢索日):
Paul, Avijit & Bruns, Axel (2013) Usability of small crisis data sets in the absence of big data. International Conference on Information, Business and Education Technology (ICIBIT 2013)
導讀者:黃淑琳
原作摘要:
災難傳播喜歡研究Big Data。但如何以收集data、用什麼適當工具仍是許多人無法掌握的。這篇研究從small data著手,觀察small data比起big data是否能突破資訊收集與分析工具的限制,更適用於災難傳播&後續行動上。
重點整理:
Big data vs small data
比例關係:如果big data有上百萬組資訊,small data就是上千則。
研究方法
目的:觀察tweets中地理資訊的變化,確認twitter上的討論是否能讓救災組織及時處理。
收集2011年,紐西蘭地震時含有#enqz的tweets,共164,390筆。
以災難發生後的黃金24小時做為資料撈取的時間框架。
整體資料呈現的情況(24小時內,每六小時的關鍵字變化量)
前6小時,媒體報導與使用者傳散,twitter上最常被提到的是國家名(NZ)和區域較廣的地名(Christchurch)。
災害後第12小時開始,大家談論的地名會越來越詳細、精準討論到確切災情地區、地點 (CTV大樓)
從tweets來看使用者對紐西蘭地震的地理認知:大地名→小地方。
特定地區討論量的趨勢觀察(救災需要),依序為
Cathedral:最早被影響的地區
Hospital
1. 有人在找醫院
2. 或是有醫院受地震影響
Airport:曾一度傳聞受影響,後證實無礙
CTV or Canterbury Television Building:超過半數的傷亡名單來自於此
討論
從small data中特定地區被提到的次數,確實可在災難發生時幫助做出立即判斷。(至少先判斷廣泛地區,再繼續關注到特定區域)
但有些地區名稱太像,會產生混淆(有很多地區景點以cathedral命名),需要進一步過濾。
結論
研究結果顯示,小資料的蒐集與分析對於災難發生時辨識急需幫助的地區相當有用。
註:雖然撈取資料的時間點是在#eqnz變得較為熱門之後開始,所以錯失相當數量的資料,但仍不影響地理區位的辨識。
![](https://www.google.com/images/icons/product/drive-32.png)