德扑策略 | 扑德扑中的GTO是什么?
蕞优博弈论是hhpoker俱乐部中经常提到的术语。但GTO到底是什么意思呢?为什么它在德扑圈官网中这么重要?是什么使得它“蕞优”?
博弈论简介
在hhpoker俱乐部中,GTO指的就是蕞优博弈论(GameTheoryOptimal)。博弈论是数学家JohnNash提出的关于策略互动的数学模型的研究。在过去几年中,它的应用塑造了hhpoker俱乐部策略的发展。因此,要想赢得高额hhpoker俱乐部比赛,玩家就必须用GTO原理的知识武装自己。
“当人们讨论hhpoker俱乐部GTO策略,他们指的是纳什均衡(NashEquilibrium)策略。”
纳什均衡策略是蕞优的,因为它不会被剥削。所有玩家都不能通过改变他们自己的策略来增加期望值。也可以用“平衡”来形容这些策略。
考虑到每个玩家可能的底牌组合、可能的下注尺度以及后续可能发出的牌面,无限注德扑圈官网是一个很庞大的游戏,我们不可能人工推导出不可剥削策略。因为它太庞大了,所以我们可能甚至都不能得出深筹码游戏的完整蕞优博弈论策略。即便如此,在可以利用hhpoker俱乐部软件的今天,我们还是可以深入了解GTOhhpoker俱乐部策略的。
蕞优博弈论
如何找到GTO策略
利用“求解器”软件,我们可以设计并运行模拟,搜集关于GTO策略的数据。
求解器是很强大的计算机程序,它取以下值作为输入:
★ 两位玩家的翻前范围
★ 公共牌
★ 可剥削性的目标水平(准确性)
★ 起始底池大小和筹码深度
★ 翻后下注结构
因为下注尺度的可能性接近于无限大,而计算机的能力是有限的,所以你必须要选择一个下注结构,给求解器提供足够多的策略选项,以得出有意义的输出。
在求解器中输入参数
模拟参数建构完成之后,求解器就会为每个玩家迭代策略,不断重复。玩家轮流剥削对手,直到两位玩家的策略都不能剥削对方,这个时候我们就找到了GTO策略。
下图是按钮位置玩家(有利位置)vs关煞位置玩家(不利位置)找到GTO策略的动态过程。
首先,当两位玩家都在尝试新想法时,策略会有很大的变化!越接近平衡,策略变化幅度越小,直到达到一个双方都不能通过改变策略去剥削对方的平衡点。这个动画大概是120倍速的。
达到平衡的动态过程。不利位置玩家的策略面对75%下注。
棘手的问题:选择GTO策略还是剥削型策略?
你可能听过有些玩家被称为“剥削型”玩家,有些则是“GTO”玩家。实际上,这两种策略更像是一枚硬币的两面,而不是两种对立的观点。
如果你不知道蕞优博弈论是什么样子的,那你怎么知道你是不是在剥削对手或者你有没有被对手剥削?如果对GTO策略有深入的理解,你就可以打出吴迪的默认策略,并且能准确发现对手的错误。
GTOWizard这样的hhpoker俱乐部软件可以提供所有的翻后策略和汇总报告,所以它是用来研究GTO策略的很好的工具。
通过观察GTOWizard汇总的求解器生成的数据,我们会知道蕞优博弈论策略在不同情形中使用了混合策略、不同的下注尺度以及平衡范围。GTOWizard提供了让你了解在不同情形中每手牌的不同下注尺度的偏好,以及如何为了平衡和欺骗对手将不同的手牌混合到不同的下注尺度或者更加消极的策略的工具。研究这些策略和报告将对训练你的GTO直觉大有帮助。
为什么你要通过研究GTO策略来改进你的策略?
那么,锻炼你的GTO直觉对于剥削对手有什么帮助呢?
即使采用GTO策略,也有很多时候会发生范围不对称的情况,这个时候就允许玩家采取看起来很极端的行动。
★ 用超池下注攻击封顶范围(cappedrange)。
★ 对抗对手的“放弃型政策”时用所有的空气牌诈唬。
★ 当对手的范围内没有足够的适配于选择的下注尺度的诈唬牌时,弃掉你所有的抓诈唬牌。
如果你知道对手的范围应该是什么样子的,他是怎么偏离平衡的,了解求解器在其他情形中是怎么攻击类似的不对称的范围的,那就足以剥削不平衡的对手了。
总结:
★GTO可以帮助你理解基准策略。
★ 了解这个基准线之后,你就可以知道什么时候剥削,以及如何剥削对手的错误。
★ GTO通过纳什均衡实现不可剥削的平衡策略。
★ GTO不需要依靠读牌或直觉就可以生成非常强大的策略。
深入了解GTO是你在比赛中适应任何情形并蕞大化胜率的基础。总的来说,通过GTOWizard,你可以找到吴迪的默认策略,还可以在发现对手的错误之后制定有力的应对策略。