A geographic approach for combining social media and authoritative data towards identifying useful information for disaster management 

水火計畫讀書會書目摘要單

書名(以學術體例詳填資料,網路來源提供超連結及檢索日):

De Albuquerque, J. P., Herfort, B., Brenning, A., & Zipf, A. (2015). A geographic approach for combining social media and authoritative data towards identifying useful information for disaster management. International Journal of Geographical Information Science, 29(4), 667-689.

導讀者:卓菁莪                              

原作摘要:

近年來,社群媒體被視為災害危機管理的潛在資源,並且有大量的研究開始分析災害期間的社群媒體使用;過去的研究多將社群媒體視為獨立的消息來源,而較少與其他消息來源做結合。本文以2013年6月在德國易北河洪水事件的Twitter訊息為例,欲透過社群媒體上的自願性地理資訊與當局資料所導出洪水現象的地理特徵之間的關係,來加強對社群媒體上的相關資訊的辨識。

研究結果顯示,在洪水嚴重地區附近(至10km內)的訊息與洪水相關性較高,並且指出本文所用的地理方法提供了一個有效的量化指標,有助於災害管理上的危機應對和預防性監測。

重點整理:

一、研究背景

(一)社群媒體提供災區居民大量且即時的災害相關資訊(例如2007年加州大火、2010年海地地震、2013年海燕颱風)。

(二)災害通常具有高度資訊需求和低度資訊有效性,若將社群媒體視為危機的消息來源太過直觀。

(三)社交媒體的平台上具有自願性地理資訊(Volunteered Geographic Information, VGI)。

(四)本文認為,社群媒體上的災害分析的研究已相當多,且多關乎資料提取的部分,然而在自然災害所發生的危機下,地理數據可能提供一個更有效的分析方式。

(五)洪水災害事件與地理空間有高度的相關性。

(六)本研究欲透過地理方法,並利用與自然災害相關的地理知識來分析社群媒體資訊。

 

二、研究方法

本研究藉由探索相關外部數據,以建立洪水現象和社群媒體消息之間的地理關係,提出的研究假設為:更接近淹沒地區的社群媒體消息,更可能與該事件具高度相關性,更有助於改善狀態意識。同時提出以下步驟:

(一)蒐集有關洪水現象的資訊,如辨別受洪水影響的區域。

(二)從社群媒體上蒐集資訊,如提及地理資訊的Twitter訊息。

(三)分析洪水現象資訊與社群媒體資訊之間的地理關係,評估社群媒體資訊的有效性。

 

三、個案描述-易北河洪水

(一)發生時間:2013.05.30-2013.06.03。

(二)主要影響區域:德國南部和東部、捷克西部。

(三)社群網站資料來源:透過Twitter API收集德國國界內的相關推文,排除德國境外的推文。共蒐集60,524則相關的tweets,包含內文、時間、標籤、URL、用戶ID,蒐集時間區段2013.06.08-2013.06.10。

(四)當局數據來源:德國聯邦水道水運管理局和德國聯邦水文研究所提供的德國聯邦水道185個監測站的水位數據。

 

四、研究操作與結果

(一)數據準備

1.定義集水區

於ArcGIS上進行操作,以網格資料呈現,透過下列步驟獲得了779個獨立的集水區。

2.計算受洪水影響集水區

計算每日最高水位,與185個水位測量站2000年11月1日至2010年10月31日期間平均洪水水位之間的差異。負值表示監測站的水位低於平均洪水水位,可以視為不受洪水影響;反之,正值表示監測站會受洪水影響。而後將相對水位值與相應的集水區結合,如果發現多個水位測量站位於同一集水區內,便其算術平均值。

 

3.關鍵字過濾

以關鍵字過濾抓取到的60,524則Twitter訊息,關鍵字包含英文與德文的「洪水」、「堤」以及「沙包」。

 

4.內容分析(評估內容以及超連結)

沒有包含上述關鍵字的推文將直接被標註為「偏離主題」,而不進行進一步的內容分析;剩下的推文經由三人分類成:

(0)偏離主題(無關主題即使包含關鍵字)

(1)切合主題但不相關

(2)切合主題並且相關

若該推文中沒有文字,但具圖片資訊以及時間邊際和地理坐標等資訊,也被分類為「切合主題並且相關」

 

5.主題編碼

經由三人各自分類該推文的編碼,進行比較與合併後歸類出以下類別:

(1)志願行動

(2)媒體報導

(3)交通條件

(4)第一手觀察

(5)官方行動

(6)基礎設施損害

(0)其他

依據上述分類60,524條推文,只有370推特可以被標記為切合主題(相關與不相關約各半),超過99%被分類為偏離主題。志願行動加上第一手觀察約4成,其他類約1/3。

 

將上述資料以地圖呈現,發現切和主題的推文集中於馬德堡、柏林、哈雷等地。

 

(二)數據分析

分析目的為:(1)識別推文與洪水事件之間的空間模式;(2)進一步探討分類推文中空間模式的差異。

本文利用R語言中的mgcv進行GAM空間分析,GAM方法是用來探索點空間或小區域範圍內所有的資料內容,檢視是否有任何地理群集現象(localised eographical clustering),也就是說用來搜尋點資料在空間分佈的群聚現象。 

 

相對風險(relative risks):在此「相對」是指「比較」二事件發生之機率

勝算比(odds ratios):指一件事情發生的機率與一件事情沒發生機率的比值

本文以(1)≤10公里vs.30公里;(2)相對水位為+ 0.75米與-0.75米分析切合主題的推文出現狀況,並計算相互作用情況下的勝算比: 

(1)相對水位較高的情況下,切和主題的貼文於≤10公里出現是30公里的11倍,其他水位下較無顯著差異。

(2)在≤10公里的距離中,切和主題的貼文出現於相對水位為+ 0.75米情況是-0.75米的54.4倍,其他距離下較無顯著差異。

下圖為切合主題推文出現頻率的空間分佈:

 

 

比較後發現,切合主題的推文更接近受洪水影響的集水區,特別是相對水位較高的集水區。由下圖可知,第一手觀察、官方行動和基礎設施損害有關的切和主題貼文,在較短的距離和較高的相對水位中較為頻繁。

 

五、結論

(一)藉由地理關係接近度和洪水嚴重度的計算,來確定社群媒體消息的優先性,能提高辨識相關資訊的機率,有助於提升災害管理中的狀態意識。

(二)本文增加了社群媒體的空間分析,認為透過地理資訊,可以對資訊進行更進一步的評估與劃分。

(三)本文蒐集到可使用的推文量很低,推測可能是德國使用推特的用戶比率較低,可能會導致主題分類與地理關係上的連結性較低。但本文認為由下至上的分類是好的;因為人工手動分類,所以認為沒有錯誤分類於切和主題的推文上,但無法保證漏分類於偏離主題的貼文。

(四)蒐集到的推文若非文字而是圖片,可能因為更有效地描述狀況,更有助於災害危機處理。未來可嘗試透過以圖片為主的社交軟體(Instagram、Flickr)上進行分析。

 

摘要_A geographic approach for combining social media and authoritative data towards identifying useful information for disaster management.doc