今天的课堂,和蔼教授将带领叶寒、秦易、许黑、蒋尘、周游五位同学,以博弈论为核心,拆解“一次游戏”
与“多次游戏”
的不同玩法。
我们会从考试作弊的收益计算切入,结合商业监管、体育赛事的真实案例,穿插心理学的“即时满足偏差”
、哲学的“功利主义与义务论”
,最终理解:人生是场“无限游戏”
,所谓“远见”
,就是不用一次游戏的策略应对多次挑战,不用有限规则套无限未来。
上课铃刚落,教授手里拿着一张模拟试卷走进教室,笑着问:“同学们,有没有人曾想过‘就作弊这一次,应该不会被现’?或者觉得‘偶尔钻次规则空子,没什么大不了’?”
秦易有点不好意思地举手:“教授,我初中时一次数学测验没复习好,就偷偷看了同桌的选择题,当时觉得‘就一次,分数上去就行’,后来没被现,还庆幸了好久。”
许黑也点头:“我身边有人打游戏时用外挂,说‘就爽这一局’,结果后来被封号了,之前攒的装备全没了。”
教授点点头:“这就是我们今天要聊的核心——一次游戏和多次游戏,玩法天差地别。
很多人栽跟头,就是把‘多次游戏’当成了‘一次游戏’来应对。
我们先从博弈论的基础说起,博弈论分两类:零和游戏(比如下棋,你赢我输)和非零和游戏(比如合作做生意,可能双赢、双输,也可能一赢一输)。
大家常说‘追求双赢’,但非零和游戏里,有个很有意思的现象:‘双输’反而最容易稳定,这就是纳什均衡。
而要实现双赢,不仅要理性,更要‘敢信对方不耍赖’——但生活里的博弈,大多不是‘一锤子买卖’,而是反复进行的‘多次游戏’,这时候策略就得变了。”
“我们先算笔账,就用考试作弊的例子。”
教授在黑板上写下假设条件,“假设全班只有张三作弊,被现概率5。
没被现,他多拿1o分(收益+1o);被现,得o分(损失-1oo)。
大家算算,一次考试里,张三作弊的‘收益期望’是多少?”
蒋尘拿起笔飞快计算:“1o乘以95,减去1oo乘以5……1oxo95=95,1ooxoo5=5,所以95-5=45?那他作弊好像赚了?”
“没错,一次游戏里,期望收益是正的45,看起来‘合算’。”
教授话锋一转,“但如果考试不是一次,而是k次呢?比如1o次、2o次、3o次,而且只要有一次被现,之前所有分数清零,损失是1ook。
大家再算1o次考试的情况:全部作弊成功的概率是95的1o次方,大概6o;收益是1ox1o=1oo,损失是1oox1o=1ooo。
期望收益就是o6x1oo-(1-o6)x1ooo=6o-4oo=-34o?不对,教授,我是不是算错了?”
教授笑着纠正:“公式应该是‘成功时的收益x成功概率-失败时的损失x失败概率’,也就是o95kx1ok-(1-o95k)x1oo。
当k=1o时,o951o≈o6,所以o6x91=2o时,o952o≈o36,o36x2oo-o64x91=3o时,o953o≈o21,o291=1oo时,o951oo≈ooo59,ooo59x1ooo-o9941x1oo≈59-9941=-9351,几乎肯定亏。”
叶寒皱眉:“可现实里,有人会想‘我就作弊一次,以后再也不做’,这样不就只承担一次风险吗?”
“这就涉及到心理学里的‘即时满足偏差’和‘行为强化效应’。”
教授解释道,“人天生更看重‘眼前的好处’,而忽略‘未来的风险’——一次作弊成功,拿到高分的‘甜头’会强化这个行为,下次遇到没复习好的情况,就会忍不住再试。
就像有人第一次闯红灯没被撞,下次就更容易闯红灯;第一次撒谎没被拆穿,下次就更容易撒谎。
行为心理学里有个‘操作性条件反射’:得到正反馈的行为,会反复出现。
所以‘只作弊一次’的想法,大多是自欺欺人。”
“那怎么才能阻止这种‘侥幸心理’?”
周游问,“是不是只能靠加大处罚?”
“加大处罚是关键,但更重要的是‘改变游戏规则’——让‘一次作弊的损失’覆盖‘所有过往收益’。”
<