網路情資蒐集與分析規劃

情資蒐集與分析

當前國家安全維護首重情資蒐集 (Intelligence Gathering),情資包括總體政經社會發展走向與特定事件發生始末,經過科學分析推論政策取向或鑑別特定事件發生之可能性,藉以評估其對國家安全之影響程度。情資來源具有多樣性包括各種潛在影響國家安全對象,情資具備有形靜態文字、圖片、影音等多媒體資料,與需經過分析而得之無形隱性資料,如資料散布者之背景意向、接收者受資料影響強度等。有價值之情資具有延伸性,多半為隱性且動態演化,其分析是主觀獨特性,而推論則是具備策略指導性,以上屬性均與「知識」類似,故情資蒐集與分析本質上可視為知識管理 (Knowledge Management) 之應用,因此需要一套服務機制與有效分類 (Taxonomy),不僅是資訊系統,尚須透過分工協作,方能轉化資料為有價值情資,值得注意的是許多網站資訊散布有其隱含意義,未必能將資料轉化為情資,甚至在反情報工作考量上,包括情資蒐集分析、中和及探索其影響程度等,均要加以排除蒐集之列,倘若將此類網站資料與其他混用,將可能導致錯誤情資,影響至鉅 (Cleave, 2007)。

自網際網路與 Web 2.0 蓬勃發展後,加上蒐尋引擎技術大幅改進,許多組織包括政府、企業與個人,透過網際網路傳遞理念、資訊,自我行銷,近來社群網站如雨後春筍般風行,更拉近虛擬群體 (Virtual Group) 間關係,然而也成為可能危害國家安全溫床。欲有效蒐集與分析社群網站情資,必須先將其分類,再依其類型給予不同對策,包括:(1) 個人取向類 (Profile-based Social Networks)—如臉書;(2) 內容取向類 (Content-based Social Networks) —如 Flickr;(3) 目的取向類 (White-label Social Networks) —如維基百科;(4) 虛擬角色取向類 (Multi-User Virtual Environments) —如線上遊戲軟體;(5) 微誌或打卡取向類 (Micro-blogging/Presence Updates) —如 Twitter;(6) 社交搜尋取向類 (Social Search) —如 linkedIn;(7) 在地論壇取向類 (Local Forums) —如「批踢踢」;及 (8) 服務取向類 (Thematic Websites) —如「揪團購」等 (Abdulhamid, Ahmad, Waziri, & Jibril, 2011)。

某些社群網站提供程式界面 (API, Application Programming Interface) 供外部系統存取網站內容,而無須透過網站爬蟲程式 (Web Crawler) 費時抓取解譯,其限制是外部系統仍需以帳號登入,無法抓取全站資料,因此必須有針對性隱身情蒐對象社交網路之中,方能取用其動態資料,再由其社交網路加以拓展。值得注意的是願意現身在網站表達意見者多為顯性主動者,多半對於特定議題敏感,特別是政治議題,而多數未表達意見者之議題取向則不易得知,因此貿然統計顯性意見當作社會全體取向,將會危及後續政策制定與作為 (Shirky, 2011)。

自美國 911 恐怖攻擊事件後,反恐成為情資蒐集重要課題之一,政府通常因為資訊不對稱 (Information Asymmetry) 而無從判定恐怖攻擊事件主導者為政治訴求或是軍事行為,透過事件主導者與政府間賽局分析 (Gaming Analysis),從某種連續交互情資信號 (Signals) 間是否達成平衡 (Equilibrium) 做為判斷觸發後續恐怖攻擊可能性之依據 (Arce & Sandler, 2007)。然而在恐怖攻擊事件前,若無先行蒐集可能人事地物情資,而海蒐無針對性資料,將無從改善資訊不對稱情況,因此對於事前反恐助益有限。類似資訊不對稱造成國安疑慮之社會運動亦然,欲正確解讀社會運動成因與影響,尚需透過總體經濟社會其它構面分析,社會運動者常透過外部組織給被抵制者壓力,強迫被抵制者讓步,其讓步強度受媒體關切程度影響頗大 (King, 2008),故能掌握媒體對議題操作取向,將有助於弭平社會因對力所產生之隔閡。而通常事件主導者在其社會網路中,未必是顯性意見表達者,然而其基於歷史觀或是受特定媒體長期影響,卻有其脈絡可循。因此情資分析研判手段多樣化,也並非固定統計程序或是類神經模型所能萬解,事實上任何一種分析方法均對於問題有針對性,以台灣特殊國情而言,情資蒐集分析必然會發展出一套自有特色模式,不易從移植他國經驗,或是藉助一般商用固定分析模式,所能滿足國家安全需求。

情資蒐集對象往往具有針對性作為分析起源,推至蒐集關係人活動上,將人際行為與人際關係數量化,進而對群體結構與功能分析,及對群體的管理與診斷等,運用圖形理論 (Graph Theory),呈現人與人之間互動之方向性與關聯強度等數值成,並且以點或線等圖示方示表達。此種分析方法屬於社會網絡研究範疇,各節點是事件行動者 (Actor),而相連結之節點間蘊藏某種關係,其關係之定義則視情資蒐集目的而訂,點點相連形成社會網絡。網絡分析衡量指標包括:(1) 度數 (Degree)—與該節點相連之連結數;(2) 中心性 (Centrality)—說明該節點在網絡與度數最多之行動者間具有某種進階關係,如具有高度數中心性 (Degree Centrality) 之行動者,在網絡中和所有其他行動者間距離亦短;節點間需透過中介節點群方能相互聯繫之強度為居間中心性 (Betweenness Centrality);而凝聚中心性則表示節點間之獨立性或緊密程度;及 (3) 凝聚性 (Cohesion)—說明該節點在網絡子結構中之間具有相對較強經常直接緊密或層級關係。在許多反情報應用中,情資資料字詞出現之順序可能蘊藏暗語藉以傳遞行動指令,欲分析此類情資須要先將情資資料字詞產生鄰近矩陣 (Adjacent Matrix),再透過分析程式產生網路圖作進一步觀察及分析。

本規劃點出有效之國家安全層級之情資蒐集與分析,是針對議題與事件網絡探索可能發展或是提出假說加以驗證,再進行多元手段分析推論,同時還須注意對手反情報灌以虛假或是誤導之情資,致使產生偏頗解讀與後續作為。新議題與突發事件瞬息萬變與隨時湧出,因此海蒐網路資料透過字詞頻度為主單調式分析處理,僅能揭露資料概貌,對於國家安全所關切欲掌握對手總體經濟社會走向之目的尚有一段距離。另外,自後冷戰時期以降,世界多數國家對內以經濟發展為核心,並以營造和諧社會為目的;對外以外交及區域合作代替軍事衝突與意識形態對抗,此一趨勢引導全新議題與事件關注方向,謹建議國安部門納入參考。近年來因經濟發展遲滯,社會貧富差距益大,媒體商業考量與政治立場凌駕於新聞倫理之上,造成新一輪社會階級對抗,政府公共政策受到曲解而難以推動,黨派競爭以犧牲全體利益不惜焦土對抗,社會族群因不同利益或意識形態訴求組合衍生複式族群,也就是說事件主體已非從單一文化背景分析所能解讀,倘若受國外有心政治團體或國家操弄特定事件,則可能發生槓桿效應引發國家安全疑慮,此一由刺激內政紛擾而取得國家較佳戰略地位之趨勢,國安部門不可不重視,因此如何從情資蒐集分析預判事件醞釀與發展,已是先進國家情報工作佈署重心之一,網路社群軟體成為此一模式發展之溫床,例如發生於2008年幾起國際重大事件:孟買恐怖分子事件、臉書對抗埃及政府,俄羅斯與喬治亞紛爭等,均套用此模式危及國家安全 (Drapeau & II, 2009)。

參考文獻

  1. Abdulhamid, S. M., Ahmad, S., Waziri, V. O., & Jibril, F. N. (2011). Privacy and National Security Issues in Social Networks: The Challenges. International Journal of the Computer, the Internet and Management, 19(3), pp. 14-20. 
  2. Arce, D. G., & Sandler, T. (2007). Terrorist Signalling and the Value of Intelligence. CREATE Research Archive, pp. 573-586. 
  3. Chawla, N. V., Bowyer, K. W., Hall, L. O., & Kegelmeyer, W. P. (2011). SMOTE: Synthetic Minority Over-Sampling Technique. Journal Of Artificial Intelligence Research, 16, pp. 321-357. 
  4. Cleave, M. K. (2007). Counterintelligence and National Strategy. DTIC Document. 
  5. King, B. G. (2008). A Political Mediation Model of Corporate Response to Social Movement Activism. Administrative Science Quarterly, 53, pp. 395-421. Shirky, C. (2011). The Political Power of Social Media-Technology, the Public Sphere Sphere, and Political Change. Foreign Affairs, 90(28), pp. 1-12. 李智. (2014). 字詞頻度表與網路圖. 擷取自 資訊科技與管理: https://sites.google.com/site/richchihlee/portal/python/tm-word-count/tm-word-count2 
  6. 李智. (2014). 探索不願表態者隱藏意向. 擷取自 資訊科技與管理: https://sites.google.com/site/gnurstat/home/gnustat-index/tacit-intention 
  7. 李智. (2014). 讀取臉書朋友名單. 擷取自 資訊科技與管理: https://sites.google.com/site/richchihlee/portal/python/fb-get-friends 

創新方案與加值規劃

當前總體政經社會發展走向,受事件獨特性 (Event Uniqueness) 與媒體取向 (Media Polarization) 傳播影響至鉅,尤其在網際網路蓬勃發展之後,及對全球化發展所造成之社會分配不均及政治上不滿情緒,透過社會網路軟體推波助瀾,星星之火即可燎原 (Aelst & Walgrave, 2002),因此蒐集網路情資已升級至國家安全戰略層級。蒐集網路情資與後續分析研判,需要跨領域綜合觀點及相關理論予以支持,方能事倍功半精確地呈報國家戰略部門預判事件發展趨勢,發揮「蝴蝶效應」 (Butterfly Effect) 消弭事件於無形 (Lorenz, 2000)。總體政經社會發展可包括四個面向:(1) 社會整體氛圍 (Social Atmosphere),(2) 科技發展與制度完備性 (Technology Innovation and Governance),(3) 經濟重心與發展方向 (Economic Focus and Development),及 (4) 政策方向與推動 (Policies Direction and Promotion) 等 (Recklies, 2006)。

然而總體政經社會事件起因有其歷史與文化認之因素,屬於「動態複雜」關係 (Dynamic Complexity)—彼此因果相依,受時間支配,而環環相扣 (Colville, Pye, & Carter, 2013),因此並非能透過長期片段情資蒐集所能一窺全貌,已發生事件本身是時間函數,而未發生事件則是機率函數,必須透過情資分析研判後,將隱性知識 (Tacit Knowledge) 轉為顯性自變數,做為下一輪分析研判之影響因子,也唯有如此種種後續資料探勘手段包括:人工智慧及統計方法,並以網路分析圖方式加以呈現事件因子彼此間權重與交互關係,得以完整呈現給國家戰略部門做因應預防發生與損害管理。而總體政經社會事件自有其脈絡,從事件利害關係人 (Stakeholders) 之社會網路出發蒐集情資,遠比無目的海蒐再事後分析推敲來的有效率,社會活動乃是由作用者 (Actor) 與接收者 (Actant) 交互運作,互惠彼此有形服務與無形精神理念價值 (Prell, 2012),因此從作用者或接收者切入,推算其網路關係,及蒐集雙方認知價值觀,方能真正掌握情資脈絡。

本規劃並不僅以提供新穎合當之資訊科技與文字探勘手法為主要破題立論依據,而是從國家戰略部門需求為觀點,提供與總體政經社會相結合之定期諮詢服務,以資訊科技機械性蒐集網路情資與相應文字探勘方法為手段,針對特殊議題包括:(1) 潛在威脅國家總體政經社會分析,(2) 我國潛在社會事件發展與預判分析,及 (3) 實施實地民情調查等,設計分析架構、推論事件成因,及未來事件 (Future Event) 影響力評估等。由於特殊議題有其獨特性,需要理論與實證做為依據,情資蒐集不僅在於資料收集與字詞頻度統計,而更需要假說模型探索與驗證 (Hypotheses Exploratory and Conformation),同時將特殊議題以策略性問題為核心,切分為二組不同觀點做為象限,(2)加以解構分析:(1) 事件時間軸觀點—包括事前資料蒐集規劃與改善措施事後評估,(2) 問題解決軸觀點—包括問題發現與解決方案建議,如下圖所示,方能切題給與有信效度之建議。也正因如此,對事件所採取之立場會影響問題解構觀點,而文字探勘只是手段而非目的,目的在於問題弭平策略作為及後續演進,透過策略作為預測推論及策略作為實踐監督評估,才能真正掌握蒐集輿情及總體政經社會情資之終極目的。

在情資蒐集分析平台資訊科技上, 本規劃考量此專案之特殊性與敏感性,委託單位有自主性,減低資訊產品依存度,故以開放式架構與開源軟體為主軸,同時情資蒐集與分析方法會依不同任務需求及時間範圍,逐步發展有特色之分析平台,軟體必須要有可程式化能力,架構必須要有自主擴充能力,故建議平台架構示意圖如下:

文字探勘方法是依事件獨特性而設計,並非以依單一統計方法或是人工智慧模型能解所有分析問題,在許多社會網路分析方法並不適合分散式運算 (Distributed Processing) 如:以Map/Reduce 演算為核心之 Hadoop 架構,特別是當待分析資料本身非離散時,反而需要多核CPU、多執行緒能力分析服務器,因此建議平台架構必須具備以下能力:(1) 邏輯架構清楚且相互依存度低,(2) 水平分散式運算擴充彈性佳,(3) 垂直集中式運算擴充能力佳,(4) 自主性高與品牌依存度低,及 (5) 有鑑於本專案具有國家安全特殊考量,近來迭有情資木馬程式隱身於作業系統更新程式之中,分析相關軟體兼顧世界文字探勘運用趨勢,避免日後售品牌商牽制而影響國安,因此所有軟體均以開源為主,包括服務器作業系統亦採用 Linux,打造具有特色情資蒐集自主分析平台為最高目標。文字探勘方法是依事件獨特性而設計,並非以依單一統計方法或是人工智慧模型能解所有分析問題,在許多社會網路分析方法並不適合分散式運算 (Distributed Processing) 如:以Map/Reduce 演算為核心之 Hadoop 架構,特別是當待分析資料本身非離散時,反而需要多核CPU、多執行緒能力分析服務器,因此建議平台架構必須具備以下能力:(1) 邏輯架構清楚且相互依存度低,(2) 水平分散式運算擴充彈性佳,(3) 垂直集中式運算擴充能力佳,(4) 自主性高與品牌依存度低,及 (5) 有鑑於本專案具有國家安全特殊考量,近來迭有情資木馬程式隱身於作業系統更新程式之中,分析相關軟體兼顧世界文字探勘運用趨勢,避免日後售品牌商牽制而影響國安,因此所有軟體均以開源為主,包括服務器作業系統亦採用 Linux,打造具有特色情資蒐集自主分析平台為最高目標。

參考文獻

  1. Aelst, P. V., & Walgrave, S. (2002). New Media, New Movements? The Role of the Internet in Shaping the 'Anti-Globalization' Movement. Information, Communication & Society, pp. 465-493.
  2. Allen, J., & Velden, R. v. (2001). Educational Mismatches Versus Skill Mismatches: Effects on Wages, Job Satisfaction, and On-the-Job Search. Oxford Economic Papers, 53(3), pp. 434-452.
  3. Colville, I., Pye, A., & Carter, M. (2013). Organizing to Counter Terrorism: Sensemaking amidst Dynamic Complexity. Human Relations, 66(9), pp. 1201-1223.
  4. Hellier, J., & Chusseau, N. (2010). Globalization and the Inequality—Unemployment Tradeoff. Review of International Economics, 18(5), pp. 1028-1043.
  5. Ho, S. S., Binder, A. R., Becker, A. B., Moy, P., Scheufele, D. A., Brossard, D., & Gunther, A. C. (2011). The Role of Perceptions of Media Bias in General and Issue-Specific Political Participation. Mass Communication and Society, pp. 343-374. doi:10.1080/15205436.2010.491933
  6. Knight, B. G., & Chiang, C.-F. (2011). Media Bias and Influence: Evidence from Newspaper Endorsements. The Review of Economic Studies, 78(3), pp. 795-820.
  7. Kölbel, M. (2009). The Evidence for Relativism. Synthese, 166(2), pp. 375-395.
  8. Lorenz, E. (2000). The Butterfly Effect. The Chaos Avant-Garde: Memories of The Early Days of Chaos Theory, 39, pp. 91-94.
  9. Prell, C. (2012). Social network analysis: History, theory and Methodology. Sage.
  10. Recklies, D. (2006). PEST-Analysis.
  11. Rodrik, D. (2012). The Globalization Paradox: Why Global Markets, States, and Democracy Can't Coexist. Oxford University Press.
  12. Stiglitz, J. E. (2014). On the Wrong Side of Globalization. New York Times.