【統計】【代數】

如何解決沉默螺旋民調再加15%的問題? 解三元一次聯立方程式

張貼日期:Oct 15, 2018 4:27:15 AM

作者陳宏賓 副教授國立中興大學應用數學系)

隨著年底選舉日期逼近,各種關於民調的議題持續浮上檯面。不久前幾天,一則關於選舉民調的新聞吸引我的目光,標題是〈「綠營選民沉默螺旋」姚文智:我的民調應該再加15%〉。

姚文智推論有15%民進黨支持者選擇沉默 (圖片取自電視節目<鄭知道了>)

「沉默螺旋」是政治學領域發展出來的詞彙,由德國政治學家伊莉莎白·諾爾-諾伊曼 (Elisabeth Noelle-Neumann) 於1974年提出,主要概念是,

「如果人們覺得自己的觀點是公眾中的少數,將不願意說出自己的看法;

反之,如果覺得自己與多數人的意見一致,則更會大聲的說出來。

形成少數的聲量越來越小,多數的聲量越來越大的趨勢。」

依據沉默螺旋效應理論,在進行民意調查時,民眾可能會因為覺得自己是少數,或者其他緣故,而拒絕表態支持自己心中所支持的對象。這類情況其實並不難想像,比方說支持某台北市長參選人的粉絲專頁推出宣傳動畫稱「叮叮~叮叮~熱愛台北生活的我們,都是叮叮」,然而網路用語「丁丁」一詞暗喻「腦殘」,這則宣傳毫不意外地引來網友冷嘲熱諷,在此情況下,想像有一個工作人員拿著民意調查問卷請你填寫,你能鼓起勇氣當著工作人員的面勾選該位候選人,承認自己是個叮叮嗎?

回到姚文智的推論,在沉默螺旋效應下,民進黨支持者有 15% 選擇沉默,這個推論有沒有根據我們不得而知,本文想探討的是姚文智難題是不是有比較科學的方法來解決呢?

姚文智難題

「因為沉默螺旋效應的影響,民進黨支持者究竟有多少 % 選擇沉默?」

敏感性問題調查早有研究

在調查中拒絕表態的理由眾多,不只局限於選舉意向,還有些調查涉及個人隱私,或者非法行為,或與一般社會傳統價值觀有所衝突: 性傾向、性經驗、薪水、藥物(毒品)、墮胎…等等,這類敏感性問題的資料蒐集,較容易因為受訪者拒絕回答或者隱瞞事實而產生誤差。

如何解決受訪者拒絕回答或者隱瞞真相的問題? 其實有個簡單的方法-解聯立方程式。

這個方法是我在今年初一次偶然機會,從逢甲大學統計系李燊銘教授的演講中得知,敏感性問題民調是李教授的專長之一,最早起源自Stanley L. Warner 1965年的一篇論文,提出以隨機作答(Randomized Response Technique)的方法來蒐集敏感性問題的資料。就我所知,逢甲大學校園內有些涉及敏感性問題的調查(像是性傾向、藥物使用),也是採用這套設計。除此之外,選舉民調也是李教授的研究主題,有興趣的讀者可以參考他和中研院三位研究員謝淑惠、杜素豪、王千文合作發表的研究論文:《台灣2012年總統選舉隨機作答模式調查探討》。

以2087年天線市長選舉的三組候選人丁丁、顆顆、遙遙為例,傳統民調問卷會直接向受訪者提問:

「天線市長選舉的三位候選人中,請問您支持哪一位?1. 丁丁;2. 顆顆;3. 遙遙;4. 尚未決定」。

有些受訪者的支持意向實際上已定,但因某種緣故不願表態,可能直接拒絕回答問題或改選 4 隱瞞真相。

為了改善這種情況,我們可以將問題設計成以下形式:

「請問天線市長選舉的三位候選人中,您支持哪一位?請不用告訴我是誰,只需要依據下表對照您的生日月份回答是A、B或者C即可。由於您回答的是『A、B、C』,每位候選人都有可能,因此我們完全不會知道您真正支持哪一位候選人,請放心回答。」

運用這種形式的問卷進行調查,可以達到在不知道每一個人的支持意向下,卻知道整體對每位候選人的支持率之目的。接下來將要採用的數學分析方法,建立在一個重要的前提之上-[假設受訪者生日月份的分配和他支持意向無關]。在此,無關的意思有兩個層面:

1) 是說在丁丁的支持群眾中,不會有某一些月份生日的人特別支持他,同理,顆顆和遙遙的支持者也是;

2) 在八月份生日的受訪者中,其對每位候選人的支持率分配應大致和全體的支持率分配相同,同理,其他月份也必須遵守這個前提。

令「丁」「顆」「遙」三個未知數分別代表三位候選人在此次調查中的得票數。根據 1) 和 2),我們可以推估受訪者中

{支持丁丁且是1-2月份出生的人}佔了丁丁所有支持者中的 2/12;

{支持丁丁且是3-6月份出生的人}佔了丁丁所有支持者中的 4/12,

{支持丁丁且是7-12月份出生的人}佔了丁丁所有支持者中的 6/12。

同理,顆顆和遙遙的部分也能夠估計出來,如下表所示。

舉例來說,如果收回來的有效問卷數量為 1215 份,有 375 個A,465 個B,375 個C,則我們可以根據上方表格,列出下面三條方程式:

又是大家非常熟悉的解三元一次聯立方程組,今年六月〈菜市場政治學〉網站王宏恩教授的一篇文章《如何估計手機族對民意調查的影響?解三元一次聯立方程式》也用了同樣招式。不管是運用簡單代入消去法或者加減消去法,很快就能夠解出方程組的解: 丁=405;顆=585;遙=225,除以總數 1215 即可算出三人的民調支持度大約是 33.3%支持丁丁,48.1%支持顆顆,18.6%支持遙遙。(以上數據純屬虛構,如有雷同實屬巧合)

[受訪者的生日月份]可否換成別的?

當然,可以!理論上,只要能夠知道該項隨機變數對於候選人支持率的分配就可以了,也就是表格中所假設的這些比值 2/12, 4/12, 6/12 要能夠盡量準確估計。

例如,換成[讓受訪者自行投擲一顆骰子],三項目分別對應到(點數1, 點數2或3, 點數4或5或6),如此一來,

{支持丁丁的受訪者們且投擲點數為1} 佔所有支持丁丁的受訪者的 1/6,

{支持丁丁的受訪者們且投擲點數為2或3} 佔所有支持丁丁的受訪者的 2/6,

{支持丁丁的受訪者們且投擲點數為4或5或6} 佔所有支持丁丁的受訪者的 3/6,

同理可知其他兩位候選人的情況類似。此處 1/6, 2/6, 3/6 也並非一定如此不可,也能使用其他數字比例,中學數學觀念沒有還給數學老師的話,我們知道只要避免三個方程式線性相依,就會有唯一解。

用科學方法解決姚文智難題

值得一提的是,上述的方法我簡化了很多細節問題,只為了呈現解決敏感性民調問題的關鍵數學原理,竟然是國中算到爛掉的解聯立方程組。實際上,真正要操作尚需要專業的統計方法去執行,並非如我寫的這樣簡單。例如,隨機變數在各方面的比例如何選取也可能會影響整體估計的準確度,要收集多少份資料才能讓生日在每個月份的分布接近1/12…等等,這些過程中的細節都可能會產生誤差,需要專業的統計方法去執行和評估。

綜合以上,姚文智若要解決選舉民調的沉默螺旋效應,建議可委任統計調查專業人士,採用這套專門對付敏感性問題民調的方法,說不定民調結果不只加 15%,甚至可能再加 50%!總而言之,閃開,讓專業的來。This is science!

後記閒談

今年首次舉辦的 UniMath 聚會中,我和幾位喜愛數學寫作的好友提起這個解決敏感性問題民調的方法,會後得到不少回饋,教師國數館館長莊惟棟老師更是神速分享這套方法在班級經營和魔術表演的應用,滿腦子靈活創意,隨時能將新接觸的知識,通化融入自己的專業領域中。

新課綱所強調的數學素養究竟是什麼呢? 根據課綱召集人張鎮華教授的詮釋:

(1) 數學學科知識的素養 (2) 應用到學習、生活與職業生涯的素養 (3) 正確使用工具的素養 (4) 有效與他人溝通的素養。

惟棟老師的行為已經充分展現數學素養的四個大方向。我個人想補充的是,學校老師能夠教你的數學素養很少,能給你的可能只有第一點數學學科知識的素養,其他三項基本上都是屬於學生個人的自我實現,因此,提升數學素養的教育行動,我認為也應當要有計畫地向學生宣導,有了素養思維上的認知察覺,才會有意識的改變自己的行為,達成觀念上的提升。

延伸閱讀

什麼是棄保效應?為什麼會出現三位候選人同時都不想公布民調?》,王宏恩,菜市場政治學

如何估計手機族對民意調查的影響?解三元一次聯立方程式》,王宏恩,菜市場政治學

參考資料

1. 謝淑惠、杜素豪、李燊銘、王千文, 台灣2012年總統選舉隨機作答模式調查探討, 調查研究-方法與應用, 35, 81-108, 2016-08.