【生活】【機率】

你的遊戲爛掉了(四)風險趨避

張貼日期:Sep 09, 2018 4:6:55 PM

作者高竹嵐 副教授國立陽明交通大學統計研究所)

期望報酬是影響決策的唯一因素嗎?

前一期,我們提到了期望報酬這件事情,玩家會遵照期望報酬選擇策略,但是,這並非遊戲中唯一影響玩家決策的要素。先舉個簡單的例子,以下有兩個行動給你選:

(A)你立刻「得到」100 塊。

(B)你丟一枚公正銅板,丟出正面你「得到」200 塊,但丟出背面你什麼都拿不到。

現在只能選一個行動,你選哪一個?

你可能注意到,這兩個行動的期望報酬是完全一樣的,都是 100 塊。但你是否覺得兩者是有差別的?為了更加了解人類的決策行為,科學家曾對此做實驗,實驗中有另一組題目,將前述的「得到」換成「支付」,結果發現,在兩組題目中很多人的選擇並不一致。這表示人們在思考決策時,肯定是有期望報酬之外的考量

這不難理解,就想像有人在跟你推銷投資商品或儲蓄型保單時,經常強調投資的風險(Risk)多低,企圖讓你買單。原則上,人類是一種風險趨避(Risk Adverse)的生物,同樣的期望報酬下,我們傾向選擇風險較低的方案。

※ ※ ※

到目前為止應該都還算符合直覺,對吧?好,讓我們來開始把事情弄得複雜一點:

用標準差估計風險

你可能注意到我們還沒有定義『風險』到底是什麼,這邊只是泛指『所有未來的不確定性』。風險的量化方式很多,有一種風險計算的方式是去看一個行動的標準差(Standard Deviation)。沿用上次的符號,如果一個行動的報酬是 X,它的平均報酬是 E[X],那這個行動的標準差定義為

看起來很嚇人,但它其實就是在衡量『到底會跟期望值差多少』。

l 以行動 A 為例,它的 X 恆等於 100,期望報酬 E[X] 也等於 100,所以它的標準差是 0。

l 行動 B 的話,它的 X 有 50% 的機率是 200,另外 50% 的機率是 0,而期望報酬是 100,所以它的標準差是:

風險趨避行為如何用數學描述

那要如何反應人們風險趨避的這件事情呢?一個方法是使用所謂的效用函數(Utility function)。效用函數講簡單一點,就是想去衡量人們有不同數目的錢時有多爽。再更白話一點,我們定義一個效用函數U叫做

U(錢)=有多爽。

這個效用函數有些性質。首先,越多錢越爽,所以這個函數遞增,也就是一次微分大於零。其次,100 塊時多賺100 塊,遠比 10000 塊時多賺 100 塊爽,這暗示函數的二次微分小於零

事實上,如果你認為人們是追求期望效用最大化,也就是去選擇讓你的期望爽度最高的選項,你可以證明,在以上條件下,同等期望報酬的選項中,人們自然而然選擇標準差較小的選項。

效用函數是因人而異的,畢竟有人視金錢為浮雲,有人視金錢為一切。

高風險高報酬是遊戲設計重要準則

在遊戲設計中有一個重要原則,叫做『高風險高報酬』。直觀的說,越高風險的行動應該要伴隨越高的報酬。不然,除非已經輸了被迫要賭一把,不然我沒道理去選一個風險比較高卻又沒有比較高報酬的選項。

再進一步,遊戲中也不應該存在兩個期望報酬相同但風險一個嚴格大於另一個的選項,不然對於懂得風險趨避的人,他只會選擇其中風險較小的那一個。

桌遊案例分析:『奶油還是派』

我們最後來看一個桌上遊戲中的案例。這款遊戲叫做『奶油還是派』。它好像也有披薩的版本,但我個人比較喜歡吃派,所以請容許我用這個版本說明。

圖片來源:桌遊海域

這遊戲中間的過程就容我略過,總之你會拿到一些長的像這樣的派:

圖片來源:桌遊海域

然後你拿到的時候要立即從以下兩個方案中二選一:

(A)立即翻面。

翻面的派,遊戲結束上面幾顆奶球就幾分。舉例來說,你拿到一張 11 號派立即翻面,你就確定會得到 3 分。

(B)不翻面。

沒翻面的派請依照數字擺放。遊戲結束時,你如果某種數字沒翻面的派最多,則你獲得那個數字的分數,否則沒分。舉例來說,如果在遊戲結束時,甲玩家有 3 張沒翻面的 11,乙玩家有 2 張沒翻面的 11,則甲玩家得 11分,乙玩家 0 分。

注意到(A)是沒有風險的,你一翻面就是確定得分。(B)則是有風險的,你有可能一分都拿不到。所以現在你也應該猜到了,B的期望得分要比較高才合理。

順道一提,裡頭 3 號派就是總共 3 張,11 號派就是總共 11 張。遊戲中總共 57 張牌,每次遊戲會出其中的 55 張牌。這可以約略估計一下每張牌的風險是多少。

挑戰

到這邊如果都了解的話,以下給大家一個小小的遊戲測試員挑戰:

上面那張圖是『奶油還是派』第一代的印刷,其實裡面有兩張牌印錯了,錯到公司之後還印了勘誤版。這兩張牌基本上違反了我們之前的討論。你能看出是哪兩張印錯了,以及它對遊戲所造成的影響嗎?