Computational Grounded Theory: A Methodological Framework

水火計畫讀書會論文摘要單

書名(以學術體例詳填資料，網路來源提供超連結及檢索日)：

Laura K. Nelson. (2017) Computational Grounded Theory: A Methodological Framework, Sociological Methods & Research 2020, Vol. 49(1) 3-42

導讀者：程彥諄

原作摘要：

本文提出的電腦紮根理論(Comptutational Grounded Theory)為一種分為三步驟的框架，可協助社會科學家對大量文本進行紮根理論研究，萃取並歸納出與文獻自成脈絡的理論和解釋。本架構以質性研究者的紮根理論為基礎，結合使用電腦程式運算、圖形識別以及人文學者的詮釋能力，從而為內容分析提供一個方法更加嚴謹、更具解釋性的研究方法。

它的方法共分為以下三步驟，前二者為模式檢測與模式優化步驟，後者則可歸納、識別文本中的模式之有效性：

一、模式辨識階段：對文本的歸納性探索，應用諸如無監督式學習(Unsupervised learning)、詞分(word scores)等技術來幫助研究者了解數據庫中的新模式。

二、模式細化階段：透過質性深度閱讀(deep reading)、進一步研究數據等方式，以恢復對數據的解釋性參與。

三、模式確認階段：用電腦計算與自然語言處理技術，評估已歸納的模式，並識別之。

本研究框架能夠沿用在任何質性文本資料上，包含錄音、訪談、無限額的調查數據以及民族誌筆記等。

重點整理：

一、前言

紮根理論(Grounded theory) 要求研究者從大量的原始資料中歸納出經驗概括，並將之上升到理論。這其中需要迭代性地反覆比較、整理並耗去大量的時間。因此使用電腦技術分析文本中的具體元素並編碼，已經是社會學家，特別是文化社會學家所迫切需要的突破口，但電腦技術能否適應以解釋與意義為核心的問題，仍是一大哉問。許多社會科學家主張需要更正式、統一的方式去執行以電腦為輔助的質性研究。本研究對此提出「電腦紮根理論」，企圖以更嚴格、可靠且可重複的紮根理論方法，輔助研究者從龐大的原始資料中，自動整理出符合脈絡的理論經驗。

二、內容分析

當前社會科學家對內容分析的信效度已有以下三點要求：

1. 可靠性：每次分析都會產生相同結果

2. 跨越主觀性：兩名知情的分析師以相同的方式解釋結果

3. 完全可重現：透過提供數據處理步驟、分析策略以及對是數據本身的詳細說明，任何研究人員都能獨立重現完整的分析結果。

作者認為計算機輔助內容分析可讓結構化方法與人本主義方法互相結合，既保留人類解釋文本的能力、不至於將文本簡化成數據單位，又能融合電腦輔助的嚴謹性、可靠性與可重複性。

三、電腦輔助文本分析技術：三種主要類別

以詞法為基礎：較簡單的方式為計算單詞、短句；進階者為旨在識別重要、獨特詞的詞分(word scores)，以及關係語義網絡，可對照詞句間關係的映照網絡。

文本分類：通常以機器學習完成，不需特別編程即可自動學習。通常分為監督式學習(將文本按照預定類別分類)、無監督式學習(讓文本自動統籌歸類)。其中，不同的無監督式學習會有不同的操作，差別在於讓文本分類互斥或令同一文本可分為多個類別。

自然語言：單詞上下文和單詞特徵整合到分析中，例如單詞的語義上下文或單詞的詞性。

四、電腦紮根理論框架：三步驟解析

1. 使用以人為本的電腦探索分析進行模式檢測

本步驟旨在將複雜混亂的文本簡化為更簡單、更易於解釋的單詞列表或單詞網絡，盡管成果仍待人類解釋，但電腦的探索性分析仍可建議研究人員先前未曾考慮過的文本類別，避免先入為主。這步驟與傳統文本分析的編碼類似，但決策的步驟都會寫入編碼過程中，且電腦輔助文本的輸出結果可立即再現。

2. 使用以人為中心的解釋衍生假設

電腦紮根理論需要在結果與數據之間迭代來回比較，研究者也須對結構化後的數據進行定性分析，用以達成三個目的：確認識別出的模式之合理性、對方析結果進行解釋，以及將識別出模式進行優化，以符合人類對整體數據的讀取。

※由電腦主導的深度閱讀(Computationally guided deep reading)：使用主題建模可避免人工深度閱讀的偏見、忽視問題，而讓內容照主題的符合度進行分類，研究人員再在數學上識別出代表特定主題或類別的文本，並用以計算該類別的相對流行度。如此一來，研究人員不須閱讀全文就能對確認該文對相應主題的代表性。

3. 模式確認

前二步驟中，研究者透過解釋計算輸出後、通過引導的深度讀取來識別其在數據中的模式。為確保識別出的模式沒受演算法語個人偏見影響，本步驟需確認這些模式是否能通用到整個語料庫。

有多種方式能幫助確認文本中的模式，其中以有監督的機器學習(supervised machine learning)較為常見。要使用監督機器學習法，研究者得先根據前兩個步驟得出的模式，對文檔中隨機抽取的樣本進行編碼，然後再使用監督機器學習算法對其於文檔進行編碼。然後，研究人員就能使用這些編碼文件與前兩步驟中得出的假設進行驗證。

除有監督的機器學習，字典法、自然語言處理工具都可協助於模式確認一環。

五、範例：紐約與芝加哥婦女運動之比較研究

作者為證明美國的第一波(1800s~1920初)與第二波女權運動(1964~1980初)的政治主張存有地域差異，且隨著時間推移而持續存在，並非主流文獻所述地那樣，前後期立場截然相反，因此舉芝加哥與美國兩座城市為例，並收集兩個城市兩個時期婦女運動組織的政治立場進行分析，意圖揭示其中潛在的政治框架與政治邏輯。挑戰在於，這兩時期的政治用語以及待解決的政治問題皆有所不同，歸納出的模式邏輯必須做到可靠、透明與可複製。

步驟一：模式檢測

作者選定四個代表性的婦女運動組織做為案例，分別是第一波運動中，芝加哥的Hull House和紐約的Heterodoxy;第二波運動中，芝加哥的CWLU和紐約的Redstocking，利用這些組織產出的論述作為文本，以進行比較。

以比例差異(一種詞彙選擇技術)混搭STM(一種結構性主題建模法)，作者對四個組織的用詞進行同時期的成對分析，以提取每對組織最明確、有特色的用詞。

為找出最適合進行比較的主題，作者按照「最獨特詞比例差異」、「按組織加權詞最高的熱門主題」和「跨複數結構性主題模型的一個主題權重最高的單詞」，列出代表性單詞表。前二表可幫助研究人員快速確定主題中最有代表性的文檔，後者則是縱觀前兩者對四個組織的橫向比較之後，個別組織最具有代表性的前十個單詞(為確保代表性，作者製作前二張表時，有分別將主題數量設定為20、30、40、50個，並在表四列出比對)。

初步發現：紐約市提到的詞往往較為抽象，如「歷史，解放，女權主義者、意志」等等；芝加哥提到的單詞較為具體，如「墮胎，尼克松，醫院，學校和成員」。這些用語的差異，暗示著每個城市的政治話語都屬於不同類型。透過跨城市、跨歷史的比較，作者發現兩波婦女運動之間，紐約與芝加哥兩座城市隨著時間的流逝而加大了彼此間的差異，而城市內的政治相似度則變得更高。

步驟二：使用以人為中心的解釋提取假設

作者對電腦分析的歸納過程進行指導性的深度閱讀，這讓分析識別出的結果顯得更加語境化，將普通的單詞變成能進行抽象性描述的政治論據。

由電腦主導的深度閱讀利用每個主題的主題分佈，能按照研究者感興趣的主題降序對輸出結果進行排序，選出最能代表某主題的文檔。

作者對四個組織的前12最相符主題的每個主題都進行文檔摘錄，讓她得以了解該主題意涵；再將每個主題的前10個文檔以及其餘主題的代表性文檔進行定性的深度閱讀。

作者因而發現：芝加哥女性致力於滿足社區中女性的具體需求，如育兒或法律諮詢，並進而遊說國家以達成制度變革；紐約則喜歡詳細介紹婦女的個人歷史，對她們的經驗進行概括與抽象化，並以此主張催生出得以影響婦女生活的社會結構。

步驟一與步驟二的計算旨在達成三個目的：

1. 利用電腦提取人類難以察覺的潛在模式。

2. 輸出結果可立即重現，分析部分的計算也可隨時重現，使研究者不必為了解釋書出成果而反覆編碼

3. 使用的技術皆可擴展、合併，並能將計算輸出結果轉換為具有社會學意義的概念，以使研究人員能從數據中產生對社會更抽象的解釋性結論。

步驟三：模式確認

作者透過前兩步驟地歸納，有了兩種假設模式：

模式一：與紐約文本相比，芝加哥文本包含更多具體和特定的單詞，而紐約文本包含抽象和通用的單詞。

模式2：芝加哥文本經常被提及為組織，而紐約文本則經常被提及為個人。

透過WordNet的單詞層次結構與眾包數據庫，作者發現紐約的文獻比起芝加哥的文獻使用了更多的上位詞(含義較寬的詞)，因此符合模式一的假設。

而為了檢驗模式二的假設，作者使用「命名實體識別」功能(語音標記器的功能，可將句子中的單詞分類為語音的一部分，即『專有名詞』類)。透過簡單的統計，就發現紐約市比起芝加哥更常提起個人，芝加哥則更常強調組織。

婦女運動範例小節

1. 模式一、模式二皆成立。

2. 同一模式在兩波運動中都有所延續。

3. 分析可輕鬆、快速地重現，程序、結果的正確性都經得起挑戰。

六、總結

作者提供將電腦方法混入歸納式社會學內容分析的通用架構，可節省紮根理論耗費的大量人力時間成本，且可靠與可重複性兼具。而作者文末也重申：使用電腦輔助工具進行質性文本分析時，務須以社會學內部發展的學科知識作為核心基礎。

與本研究問題意識相關的概念與延伸對話：

1. 步驟二「使用以人為中心的解釋提取假設步驟中」，提供用戶對輸出結果進行篩檢，以免漏掉自然語言中涉及幽默、諷刺等面向的文本。這方面仍舊需要人工親力親為，資料量的繁浩與人的主觀性仍有造成負面影響的可能。不知是否可以設定一個檢驗模式，用以避免錯過具備諷刺意味的文本上下文？比如模式X：該段語句對某單詞的敘述中，忽然出現正反評價顛倒的情況，推測可能為諷刺語法。

2. 作者提到「主題建模算法」的缺失可靠步驟二、步驟三進行改善(由電腦引導的深度閱讀、模式再確認)。不知道是否原本就有針對「主題建模法」的防錯機制？

延伸閱讀：(請用學術體例將參考文獻中值得延伸閱讀之文章、書籍或網址列於此處)

1. Nelson, Laura K. 2015. “Political Logics as Cultural Memory: Cognitive Structures, Local Continuities, and Women’s Organizations in Chicago and New York City. Working Paper. Kellogg School of Management, Northwestern University.

2. Reed, Isaac Ariail. 2015. “Counting, Interpreting and Their Potential Interrelation in the Human Sciences.” American Journal of Cultural Sociology 3:353-64.

3. Schwartz, H. Andrew and Lyle H. Ungar. 2015. “Data-driven Content Analysis of Social Media a Systematic Overview of Automated Methods.” The ANNALS of the American Academy of Political and Social Science 659:78-94

4. Saldana, Johnny. 2015. The Coding Manual for Qualitative Researchers. 3rd ed. Los Angeles, CA: Sage

與電腦傳播相關之關鍵字及概念內涵：

監督式學習(supervised learning)：使用一整套有標記的資料來訓練演算法。全面加上標記的舉動代表訓練資料集裡的每個例子都附有答案，演算法得自己找出這些答案。

無監督式學習(unsupervised learning)：非監督式學習模型會依據手上的問題，以多種方式來整理資料。包含分群（clustering，深度學習模型會尋找彼此相似的訓練資料，並且將它們集合在一起）、異常檢測(標記資料集中的異常值)、關聯(資料樣本的某些特徵與其它特徵有所關聯。非監督式學習模型觀看資料點的多個關鍵屬性，便能預測有著共同關聯性的其它屬性)、自動編碼器(自動編碼器取得輸入資料，將其壓縮至程式碼內，再試著從該匯總後的程式碼重新建立輸入的資料)。

詞分(word scores)：一個縮放模型，用於估計先驗指定維度的位置（主要是政治角色）。

主題建模（Topic Model）：在機器學習和自然語言處理等領域是用來在一系列文檔中發現抽象主題的一種統計模型。

字典法：預先人工依據詞彙的含義，對詞彙進行定義和分類，研究者可以依據某一類別的詞彙出現的總次數除以文本總字數，來判斷這一文本的情緒導向，積極詞彙占比較高的文本意味著樂觀情緒，而消極詞彙占比較高的文本意味著消極情緒。

結構化主題模型(STM)：文檔主題生成模型（LDA）是在文檔中利用詞共現模式來發現潛在主題的一種主題模型。主題模型可以幫助我們處理現實中大量的非結構化的文本數據集。STM這個模型在聯繫我們已有的語料庫結構（文檔類原數據格式）和推測出的模型的主題結構之間提供了一個框架。

自然語言處理(NLP)：是人工智慧和語言學領域的分支學科。此領域探討如何處理及運用自然語言；自然語言處理包括多方面和步驟，基本有認知、理解、生成等部分。自然語言認知和理解是讓電腦把輸入的語言變成有意思的符號和關係，然後根據目的再處理。自然語言生成系統則是把計算機資料轉化為自然語言。

由電腦主導的深度閱讀(Computationally guided deep reading)：在本文脈絡中是指在步驟二中，透過主題建模整理，研究者得以直接接觸到最具符合文本主題的代表性文獻，藉此有效率的深度閱讀。

水火計畫讀書會論文摘要單(computional_grounded_theory).docx

Google Sites

Report abuse