GTO还是个性化策略?扑克对局的智慧之选

       今天的文章旨在结合最近学习过程中遇到的手牌案例以及在WSOP比赛中所经历的牌局,讨论我们在GTO策略和针对性调整之间做出选择时的逻辑和方法。 主要谈论如何做好GTO策略和针对性剥削之间的微妙的平衡 。


       手牌1

       这手牌来自于2020年WSOP全球区线上主赛,对战双方为保加利亚职业选手Stoyan Obreshkov和巴西职业选手Bruno Botteon。当时比赛仅剩最后的十人,处于决赛桌泡沫阶段。

       我认为,与其他赛事不同,除了WSOP主赛外的决赛桌很少具有决赛桌泡沫属性。通常情况下,第十名和第九名之间的奖金差距并不大,并且仅仅进入决赛桌对于选手的整体收益影响也不会太大。

       然而,WSOP主赛作为每年一度的焦点赛事,其决赛桌本身就具有超越奖金的吸引力。特别是在2020年,由于疫情的原因,该比赛在线上进行,但最后的决赛桌却会在捷克的国王娱乐场进行线下比赛。这使得决赛桌泡沫的形成变得至关重要,并且带来了巨大的ICM压力。

       这手牌开始时Botteon持有46BB筹码,是全场的CL。他坐在CO位置,开池加注2BB。Botteon非常清楚自己作为CL可以利用ICM给场上其他选手施加巨大的压力,所以这之前几乎每一手牌都在开池加注。

       而我们的视角跟随Obreshkov。在大盲位Obreshkov手持KK,有24BB的筹码量。由于场上有好几个10BB左右的短码,所以Obreshkov是桌上ICM压力最大的牌手。

       BTN和小盲弃牌到Obreshkov,手持第二大的起手牌,即使是有ICM压力也是不可能考虑弃牌的。那么Obreshkov的选择就有弃牌,3-Bet和直接全下三种。

跟注是所有选项中最差的一种。跟注会给Botteon免费实现equity的机会。在很多牌面上我们都有可能由于ICM压力面对非常困难的决策。这种时候输掉几个BB的损失远比埋伏多赚几个BB的收益要大得多。

       很多朋友会选择全下,避免对手通过ICM在翻后给我们施压。但是从Botteon的手牌范围分析,对手的开池加注范围没有100%至少也有80%,这就决定了   他会有非常大量的加注-弃牌。那么我们在这个局面下还是可以考虑有一个3-bet范围。价值主要是AA/KK和一部分QQ,诈唬则采用AXo和KXo阻断牌。

       这里Obreshkov选择3-Bet到3.15x,在没有位置的情况下这个尺度在常规情况下是很轻的,但在当前牌局中其实是合理的选择。Botteon不会在这个ICM下轻易选择和一个中码对决,所以弃牌率仍然是有保障的。

       但是这里Botteon选择了跟注防守。他的范围应该大致包括了一些AA的埋伏,同色两高和中间手对。

       翻牌面A♠T♠9♣,Obreshkov的手牌范围在这个牌面上整体占有,采取全范围下注的策略,进行一个非常小额的20%的下注从对手的卡顺,Tx和89等牌型上获取价值。Botteon继续跟注。

       转牌3,Obreshkov在这里不打算继续主动投入更多的筹码,过牌寻求摊牌。Botteon也随后过牌。

       在河牌Q的情况下,Obreshkov做出了摊牌的决定,这个决定可以战胜诸如KQ、KT、JT等组合,因此他选择了继续过牌。然而,这时Botteon却进行了一个令人意外的18%下注。

       从GTO(Game Theory Optimal)的角度来看,在这个底池SPR(Stack-to-Pot Ratio)小于1的情况下,Botteon的最佳选项应该是全下或者过牌。采用如此小的下注将行动权再次交给对手是不明智的。但是在实际情况下,这个下注却是经过深思熟虑的。

       由于ICM(Independent Chip Model)的影响,Obreshkov在这里不太可能把摊牌价值转化为诈唬。Botteon很容易推断出Obreshkov的手牌范围被限制在AX小踢脚和KK上。如果Botteon选择了全下,那么Obreshkov必然会选择弃牌。因此,Botteon选择了一个非常精妙的超小尺度下注。

       从Obreshkov的角度来看,从理论赔率的角度来看,他只需要有13%的胜率就可以跟注,这个赔率是相当不错的。但问题在于,Botteon是否可能用如此小的尺度来进行诈唬。由于Botteon知道Obreshkov的手牌范围被限制,但却有不错的摊牌价值,因此使用这种尺度进行诈唬的可能性非常小。

       因此,Obreshkov做出了一个非常精明的选择,选择了针对性的过度弃牌。而Botteon的手牌是T♣T


       手牌2

       在河牌Q♦的情况下,Obreshkov摊牌显示的牌型有可能战胜KQ、KT、JT等组合,因此他决定继续选择过牌。此时,Botteon进行了一次下注,下注金额相当于总奖池的18%。

       这手牌发生在一场线上超快速赛中,入场费为$250。比赛刚开始,我坐在BTN位置,手中有15BB的筹码,拿到了Q♠Q。尽管我的筹码堆不算太多,但我仍然希望有一个开池加注范围,可以用一些价值牌混合一些偷盲的手牌,从而增加我进入池子的机会。因此,我选择以2BB的加注量开池,将AA、KK、QQ和AK作为价值牌,而将K2s、Q7s、54s、75s等手牌作为偷盲的范围。

       小盲弃牌,大盲位的一个澳大利亚Reg有25BB后手选择跟注。

       翻牌出现了T♣6♣J♠,对手选择了过牌。在这种局面下,我们有选择在下注时采用小尺度或大尺度的选项,但绝不能纯粹采取小尺度下注的策略。尽管我们在这个牌面上的牌型范围并不占据明显优势。许多我们的价值牌型都需要更大规模的下注来获取价值和保护,比如我们手中的QQ。然而,在这里我犯了一个错误,选择了一个只有25%的小尺度c-bet。

       对手选择跟注,转牌出现了T♠。显然,这对我们的对手的牌型范围更有利。由于我们c-bet的范围几乎不包含中对牌型,我们的对手有理由主动以donk 25%的频率出手。果然,对手选择了donk 25%。

       由于对手donk的范围非常广,我们手中的QQ实际上领先于对手的牌型范围。我们可以阻止对手的QT组合,并通过加注来从这个湿润的牌面上获得对手抽牌的价值。然而,出现了一个有趣的情况,我们的对手迅速进行了all-in的动作。

       行动时间在在线扑克中是至关重要的,尤其是对于迅速的行动。如果一个玩家花费时间思考,或者使用了时间银行,都可能有各种可能性。他可能需要去倒水或上厕所,也可能在其他桌子上面对复杂的决策,或者他真的在认真思考这手牌。秒all-in这个动作则蕴含了一个信息,就是我们的对手非常清楚的知道自己这手牌要怎么处理。

       这个牌局和牌桌情景并不十分普遍,其中包括一个出donk转牌以及加注的动作,并且SPR(剩余筹码与奖池大小的比率)较低。如果对手意图以诈唬为目的,他需要思考在这种情况下应该使用何种诈唬频率,以及哪些牌是最佳的诈唬组合。如果他打算以抽牌为诈唬,还需要计算当前的赔率和隐含赔率。

       从GTO(游戏理论最优)角度来看,我们手中的Q♠Q牌组具有不错的阻断效应,并且是我们手中的顶级牌力,因此应该选择跟注。然而,根据我们对对手的分析,这里对手的行为暗示着这是一个价值下注。因此,我们应该优先考虑针对性地做出决策,选择弃牌。


       手牌3

       这手牌发生在今年线上WSOP一场$1050买入的金手链赛的Day 1。比赛仍处于中期阶段,距离泡沫阶段还有一段距离。我当时是桌上的筹码领先者(CL),在枪口位置拿到了KK♣,于是我进行了一个2倍大盲注的加注动作。

       其他玩家都选择了弃牌,轮到大盲位是我非常尊敬和推崇的职业牌手和教练Patrick Leonard。他当时拥有61个大盲注的筹码堆,选择了跟注以防守。

       翻牌面7Q8♠。这个牌面上我们的手牌范围还是有优势的,且牌面比较湿润,我们的价值牌型会希望通过一个大一些的c-bet获取更多的价值。所以我们选择c-bet了75%底池。Patrick Leonard跟注。

       转牌Q,Patrick Leonard过牌。这就来到了我们这手牌第一个复杂决策的地方,我们是应该过牌还是应该继续下注。

       从GTO角度上讲,我们这里过牌和大尺度下注的EV是非常接近的。如果我们运用solver去计算,我们的KK需要过牌2/3,90%的尺度下注1/3的频率。

       如果我们要严格按照游戏理论最优策略(GTO)的思路行事,那么在某些情况下,我们需要使用随机数生成器来按照特定频率做出随机决策。然而,我个人并不经常采用随机数生成的方法。游戏求解器之所以会按照概率进行随机分配补充策略,是因为它的对手也是由AI控制,而且不存在可以针对性地利用的漏洞。 

       尽管我们在考虑游戏理论时可能会依赖于AI的预期价值(EV),但需要注意的是,我们作为人类玩家,与我们的对手也都是人类,因此面对AI的EV相同并不意味着在面对真人对手时也会相同。因此,通常我们可以通过有针对性的对手分析来判断出两个选项EV的差别。

       观察游戏求解器的下注频率时可以发现,我们手中很多的QX都需要选择过牌,以保护我们的过牌范围,从而避免在河牌时被对手限制,造成对手可以通过超池下注来剥削我们。然而,在实际游戏中,大部分玩家往往未能做到这一点。

       像Patrick Leonard这样的顶级牌手对此非常了解。因此,在我们选择过牌时,他有能力在河牌时进行大规模的诈唬。从保护我们手牌范围的角度来看,选择KK进行过牌可能会是更好的选择,因为这样有更高的预期价值。

       另外,通过游戏求解器观察我们下注后对手的跟注范围,除了很多的QX之外,还有所有的8X,占据了整个跟注范围的约一半。这些8X是我们在转牌下注时的核心价值来源。

       在实战中,通常情况下,当我们的对手对第二轮下注规模较大时,他们防御8x的频率会低于理论上应有的频率。即使是像Patrick Leonard这样的高手,在这种情况下也不太可能用所有的8x进行跟注。这将导致我们下注的期望值(EV)大幅下降。因此,这也是实战中KK选择过牌而不下注的重要原因之一。

       综合考虑这些因素,我们在转牌时选择了过牌。在河牌为7时,Patrick Leonard恰如其名地进行了一个2.5倍底池的下注。这是一个非常巧妙的下注尺度,可以最大程度地向受限制的手牌范围施加压力。

       从游戏理论最优策略(GTO)的角度来看,我们的KK处于顶端范围,是我们选择过牌以保护我们手牌范围的组合之一,牌力处于相当高的位置。KK可以阻止对手的KQ组合,但由于对手的手牌范围中包含了所有的QXs牌,这种阻断效果并不十分明显。此外,我们手中有K,这也阻止了对手在转牌后抽花跟注或转牌后诈唬的可能性。

       因此,根据游戏求解器的分析,尽管不带K的KK组合基本上都应该跟注,但带K的组合则应该放弃一部分以上。

       从实战角度来看,我们面对的是人类对手,而且是经验丰富的高水平选手。在Patrick Leonard眼中,我只是普通玩家中的一个。因此,如果他进行价值下注,他会期望我跟注;而如果是诈唬下注,他则希望我放弃手牌。因此,他的下注尺度可能会有所不同。我个人认为,如果是价值下注,他会更倾向于使用150%左右的尺度,而不是250%。

       因此,我推断跟注对于K♠K♥的期望值进一步提高。Patrick Leonard亮出了9♠J♦。尽管在flop时面对大幅c-bet时,他可能应该弃牌,但他可能认为在后续的街道上仍有击败我手牌的机会。然而,他在河牌进行的诈唬下注非常精彩,我相信这样的下注对于整个玩家池来说,可以为他赢得更多利润。


       总的来说,这些例子展示了在实际对战中如何将GTO理论与针对性剥削策略相结合和权衡。要实现这种结合,首先我们必须充分理解当前场景。这种理解的实现需要两方面:一方面是对手牌数的经验积累。经验丰富的牌手能够迅速感知到不同情况的差异,并凭直觉判断出应该进行针对性调整的方向。另一方面是专注力。你需要全身心地投入到牌局中,将所有感官和知觉都深入到细节中,迅速做出对手和场景的解读。

       因此,牌桌上除了牌技之外,专注力和心理调整能力也是至关重要的。在牌局之前,适当的热身和准备,牌局中情绪的控制和保持专注,以及牌局后的冷静和剥离,都可以有效提高你在牌局中的表现。虽然积累经验需要时间,但提高专注力则是你可以立即着手努力和提高的方向。