石头剪刀布 五招胜率大
我省高校博弈论研究成果入选麻省理工最优
记者 王婷 通讯员 王汝菲
本报讯 小儿戏里有大奥妙——“石头剪刀布”这个家喻户晓的手势游戏,可以作为经典博弈论和演化博弈论的基本模型分析出许多问题——由浙江大学、浙江工商大学、中国科学院组成的跨学科团队完成的关于“石头剪刀布”研究成果,日前被评为“麻省理工学院科技评论2014年度最优”,还入选了英国BBC2014年度科技新闻亮点。
这份21页的全英文研究报告,学名叫“可控实验社会博弈系统中一些非平衡统计物理问题”,包含着多种数理模型。这项曾被一些人讽为“吃饱了撑的”研究,却成了近5年来全世界50项入选“麻省理工学院科技评论年度最佳成果”之一,在这之前中国仅有两项入选,这是我国社会科学领域首次入选的成果。
这项研究成果由浙江大学王志坚研究员、浙江工商大学许彬教授和中国科学院周海军研究员带领团队合作完成。他们共招募了360名不同专业的学生志愿者参加,让志愿者对着电脑做 “石头剪刀布”游戏,在线进行为期300轮的两两随机配对“石头剪刀布”博弈。实验将“输”的得分设定为0,“平”的得分设定为1,而“赢”的得分则从1.1到2、4、9和100不等。为了激励参与者,得分可以用一定的兑换率折算成人民币,在实验结束后支付给参与者。
通过观察参与者使用的策略,研究者发现了获胜者或失利者习惯使用的游戏策略——
在宏观尺度下,“石头剪刀布”博弈导致了群体层面的策略密度的周期变化。比如,群体中“石头”比例多时,后一时刻“布”的比例上升的概率就大,“布”的比例高时,后一时刻“剪刀”比例上升的概率就大,同样,“剪刀”比例大时,后一时刻“石头”的比例就更可能提高。
在微观层面,研究发现个体行为存在一种隐藏的模式,出现了“赢家留,输家变”的策略。打个比方,一个人在上轮比赛中出了石头赢了,下一轮会倾向于再用石头,如果出石头输了,下一轮可能会选择布或剪刀,这种“胜留输变”的模式可能是人脑中固有的条件反射。
博弈论在英语中就是“游戏理论”的意思,“博弈论里有一个理论基础叫‘纳什均衡’,意思是博弈的参与者在可选择的策略里最优的一个策略组合,通俗点说——就是别人不改变我就不改变。”一位在研究生阶段开始学博弈论课程的毛同学认为,“石头剪刀布”这个游戏参赛者如果手势完全随机、不可预测,那么他们就最大程度避免了相互利用,达到了“纳什均衡”。而事实不是这样,在这个博弈中一方的损失就是一方的收益,不存在纯策略下的“纳什均衡”,人们在无意识中采用了“胜留输变”的策略,这是另一种演化后的“混合策略下的纳什均衡”。
由此毛同学觉得,研究者通过人们在这个游戏里的行为,来判断哪一种理论更能预测人类的行为——是传统博弈论的纳什均衡还是演化博弈论,很有价值。
事实上,这项研究的确发现个体行为本身并不是对“纳什均衡”行为的任意偏离,而是存在着一种隐藏的模式。不仅如此,基于真实个体行为的模型很好地再现了宏观周期现象,从而从逻辑上证实了从微观行为到宏观现象的内在关联。
《麻省理工科技评论》对此评价为:这项研究是对人们玩“石头剪刀布”方法的第一次大规模测量,测量揭示了隐藏的行为模式,聪明的人可以利用这个模式来提高自己的胜算。
美国科学院院士、实验经济学创始人之一查理·普洛特也给予了高度评价。他认为:“该团队选取了一个非常简单、非常小的问题,这一问题看起来毫无价值,但实际上却非常深入。这一博弈的结构贯穿了经济学中众多的博弈模型,因此他们所做的工作是在众多博弈模型相交之处,并集中在一个非常简明的例子之上。这一结果向我们展示了理解这一问题的最好方式,是非常好的科学成就。”
据了解,该成果已成为博弈论、微观经济学、优化算法理论和计算机科学领域本科教学教程的参考内容,并开始被正式发表的经济学和物理学类期刊论文引用。