量子通讯争议,到底争些什么?
谈谈第一张黑洞照片
谈谈《物理学咬文嚼字》
量子保密通讯,经典派陷入的N个误区
谈谈RSA算法
姬扬:推荐《普林斯顿数学指南》,每一个对数学感兴趣的人,每一个想对当代数...
姬扬:从我的求学经历谈科学精神的建立
博文精选举例说明科普的困难
姬扬老师的译作
博文精选:力学教学笔记之总结与展望
官方微信
友情链接

博文精选举例说明科普的困难

2018-06-22
 

善战者无赫赫之功 善医者无煌煌之名

 

科普的困难(http://blog.sciencenet.cn/blog-1319915-808203.html)在于没有足够的素材,因为科普的目的在于让普通人理解科学研究的主要精神和基本手段科学的主要精神和基本手段是非常少的科普工作者无法靠科普工作谋生。“授人以鱼不如授人以渔”的结果是“教会徒弟,饿死师傅”,太好的科普教育会砸掉工作者的饭碗。这样就造成了现在这样“只传授知识,不谈论方法”的现状,而且,因为机构必须定时定量地发布科技新闻,就只能人为地拔高工作的重要性

 

这种说法可能让人觉得很突兀、很古怪,下面举个例子来说明一下。既然是在科学网上讨论这个问题,我们就用科学网置顶的一篇博文为例。

周涛老师刚刚介绍了“博弈论领域正在兴起的革命[1]在任何的两人重复博弈中都存在这样一种零行列式策略:这类策略强大到无论对方如何抗争如何变化,总能做到比对方更胜一筹;或者能够凭借一己之力,单方面将对手的收益控制在一个固定的数值上。

我们就以这篇博文讨论的问题为例,说明现在科普工作中的一个常见问题,即,宣传时人为地拔高工作的重要性,而且,“只讲结论,不谈方法”我还想用自己的这篇博文说明,如果科普工作做得简单明快,反而会让读者产生“不过如此而已”的感觉。

周涛的博文应该算是起到了很好的科普作用,不仅体现在该文的推荐人很多、点击数较高而且评论者较多等方面,而且表现在这篇文章引起了好几个人的反驳,至少一个人阅读并思考了相关的具体工作---这个人就是我自己,我刚刚读了周文后面列举的文献[4][6](即本文的[2][3])。当然也不是没有缺点,具体表现在他介绍了一个非常违反常识的结论,并称之为博弈论领域的革命,但是在有人质疑这个结论的时候,他也只能说去读原文吧。顺便说一下,这也是科普工作很难进行的一个例证:专家由于各种原因并不愿意做科普,结果就只能留给外行来做---比如说,我。

 

博弈论是用数学工具对权衡判断进行定量分析的理论,其中最著名的例子就是“囚徒悖论”了。

这个悖论有很多中貌似不同的表达方式,为了具体讨论的方便,我们就用PNAS这篇文章[2]里的说法。XY面临这样的决断问题:如果他们彼此合作,每个人得到的好处(R)就大一些;如果他们彼此背叛,每个人得到的好处就小一些,或者说受到了惩罚(P);如果一个人选择合作,而另一个人选择背叛对方,那么前者就倒霉了(S),而后者就赚了(T)。不失一般性, T  R  P  S = 0。虽然两个人合作肯定对双方有利(每个人得到R),但是每个人的选择都是背叛对方:如果对方犯傻了选择合作,我就可以得到T;如果对方也同样精明,至少我也能得到P;可是我要犯傻了选择合作,就有可能得到惩罚S。这就是所谓的“纳什均衡”。只要你承认囚徒悖论的这些前提,就得承认你的策略只能是背叛。

当然,这个问题太简单了,而且它的结论也不太积极:如果你是一个理性的人,为了利益就只能选择背叛;而选择背叛的结果使得你丧失了获得更大利益的机会,好像说明你并不是一个理性的人。虽然说博弈论的出发点就是只有利,没有义(或者说,所有的义都可以用利来标价),但是,考虑到几千年来的“义利”之辨,是不是能够改进一些呢?这样就出现了重复博弈的问题。

重复博弈说的是,这两个倒霉蛋不仅要做这个抉择,而且要不停地做同一种抉择,做它无穷遍[4]。在这种情况下,会不会有什么奇迹发生呢?对了,你猜对了,“义”出现了,为了长期的利益,合作是更好的策略。原因也很简单。无论是单次博弈还是重复博弈,实际上都隐藏了一件重要的事情,比博弈本身还重要:除了这两个人以外,还有个外部世界,相对于个人在外部世界的生存来说,两个人的谁赢谁输并不重要,重要的是获得足够的利益使得自己能够在面对外部世界时生存下去。从这个意义上来说,合作这种“义”也就是“利”的一种表现形式而已,跳出了个人的小圈子,可能会有更大的利。“蜗牛角上争何事?”让我们一起来改造世界吧!

动态重复博弈说的是在博弈过程中,参与者可以调整自己的策略。这只是让问题稍微更复杂一点,并没有实质性的影响,我们就不仔细讨论了。

这就是我们大家耳熟能详的囚徒悖论了。这些结论实际上都只是我们的常识,人们已经掌握它们有几千年了。“防人之心不可无”,“合则两利,分则两害”,如此而已,只不过博弈论用些数字把它们包装了一下罢了。

 

现在,Press  Dyson ---至少从其他人科普他们的研究结果的文章来看---他们发现了一种惊人的策略,用周老师的话来说就是:在任何的两人重复博弈中都存在这样一种零行列式策略:这类策略强大到无论对方如何抗争如何变化,总能做到比对方更胜一筹;或者能够凭借一己之力,单方面将对手的收益控制在一个固定的数值上。这种说法确实违反了我们的常识:如果博弈双方都同样理性的话,如果他们具有相同的资源和知识,那么谁也不应该能够占到便宜。仔细地阅读他们的文章[2]就会发现,非同寻常的结论来自于非同寻常的假设:这两个人并不是同样的理性,其中一个人X(我们叫他聪明蛋吧)比对手Y(我们叫他笨蛋好了)更聪明,如此而已。

让我总结一下这种策略的结果:X(聪明蛋)总是能够获得比Y(笨蛋)更大的利益(比如说三倍);X能够单方面决定Y的收益。这个结果给人留下的印象是X具有常胜不败的策略。但实际情况并非如此,因为这两个结果并不能同时实现。

聪明蛋X能够单方面决定笨蛋Y的收益,实际上这并不像初看起来的那么困难。比如说,如果Y虽然是个笨蛋,但他是个好蛋,总是采取合作的态度,那么X当然可以让Y的收益等于从S(因对方背叛而受到惩罚)到R(因对方合作而获益)之间的任何值,只要X根据自己的心愿选择合作的几率就可以了。如果Y不仅是个笨蛋,而且是个坏蛋,总是要背叛,那么X仍然可以让Y的收益等于从P(因双方背叛而获得的收益)到T(因对方犯傻而得到的奖励)之间的任何值,只要自己不怕损失就可以了---只是这时候他看起来不像是个聪明蛋,而是更像雷锋。所以,只要X高兴,他总是可以把对方的收益限定到PR之间的任何一个值。Press  Dyson 的发现的惊人之处(他们发现了所谓的零行列式条件)在于,他们证明了,不仅仅是这两种极端情况,而是在更加宽松的一些条件下,这个结论也可能成立---但是,能够决定对方的收益并不意味着自己会在竞争中获胜,因为自己的收益可能比对方还低,或者是自己有更好的策略得到更大的收益。这个很重要的“但是”并没有在科普文章中体现出来,有意无意地误导了读者认为这是个常胜的策略。

至于聪明蛋X总是能够获得比笨蛋Y更大的利益,这也不奇怪:因为他比对方聪明嘛。这个策略说白了就是放长线钓大鱼,先给笨蛋一点小甜头(在对方背叛的时候也保证一点合作的几率),然后让他吃个大跟头(在对方合作的时候,给他来个更大的背叛几率)。他甚至能够引导Y选择策略,技巧就是选择甜头的大小。这个策略的问题在于有可能吃亏,如果对方是个只啃饵不吞钩的滑头鱼,那就赔掉了---但是根据问题的假设,Y是个笨蛋,他不会想到这个聪明主意的。此外,这个策略也不是最佳策略,只要对方是个笨蛋,X总是有办法能够得到更大的利益。但是,骗子骗得了一时,骗不了一世,一旦笨蛋觉悟了,这个游戏就没法子玩了。

上面说的这些东西都在Press  Dyson 的文章里,但是在宣传的时候(这篇文章似乎确实很重要,有很多关于它的报道)却或多或少地忽略掉了。这很可能是为了宣传的目的:你要不说得玄乎点,普通人根本就不会关心啊!

显然,这种策略也能够推广到多人重复博弈[3]中:对于聪明蛋来说,骗一个笨蛋是骗,骗一群笨蛋不也是骗嘛?只不过难度稍微大些罢了。周老师他们还指出了另一种困难,在多人博弈里,也许不止一个聪明蛋,而是有两个三个聪明蛋,这样骗人就更难了。我倒是有个建议,完全可以探讨这样一种策略,让聪明蛋们在重复多人博弈中发现到底有多少个聪明蛋,值不值得想办法让所有聪明蛋团结起来,对笨蛋们来个大杀四方---这样不仅有了剥削,还会产生阶级,也许还能产生整本的资本论呢。

这种研究倒是很新颖,问题在于怎么把对手当傻子看呢?既然是博弈论,就像兵法一样,怎么也应该料敌从宽吧。孙子告诉我们,“兵以正合,以奇胜”,“先为不可胜,以待敌之可胜就算是贵州的老虎见了黔之驴,也要先试探试探,发现“技止此耳”后才干事情啊。一方面认识到长期合作才是正道,另一方面又认为对方不够理性,可以趁机占些便宜,怎么说都有点对不起聪明蛋的称号啊。

 

好了,这样科普好像可以把道理说清楚,但是困难马上就来了:问题虽然讲清楚了,但是神秘感也没有了---聪明蛋总是要占笨蛋的便宜,天经地义嘛,有什么了不起的?“不过如此而已”啊。于是,科学革命不见了,读者也跑掉了,更重要的是,科普工作者也要饿死了。

这就是科普的困难没有足够的素材,因为科普的目的在于让普通人理解科学研究的主要精神和基本手段科学的主要精神和基本手段是非常少的科普工作者无法靠科普工作谋生。

福尔摩斯告诉华生[5],你知道魔术家一旦把自己的戏法说穿他就得不到别人的赞赏了如果把我的工作方法给你讲得太多的话那么你就会得出这样的结论福尔摩斯这个人不过是一个非常平常的人物罢了。”科普工作者也面临着同样的困难。 

 

 

[1]周涛零行列式策略:博弈论领域正在兴起的革命

http://blog.sciencenet.cn/blog-3075-808397.html 

[2] Press W H and Dyson F J 2012 PNAS 109,10409.

[3] Pan L, Hao D, Rong Z and Zhou T arXiv:1402.3542.

[4]这让我想起了电影《偷天情缘》,其中的主人公到小镇子报道土拨鼠节,没想到自己的生活陷入了死循环:不管他在土拨鼠节这一天做了什么,第二天醒来以后还是发现自己又回到了土拨鼠节,一切都没有改变。

土拨鼠之日  http://movie.douban.com/subject/1300613/

 [5] 柯南道尔,《福尔摩斯探案集,血字的研究》

 

 




关于我们
下载视频观看
联系方式
通信地址

北京市海淀区清华东路甲35号(林大北路中段) 北京912信箱 (100083)

电话

010-82304210/010-82305052(传真)

E-mail

semi@semi.ac.cn

交通地图
版权所有 中国科学院半导体研究所

备案号:京ICP备05085259-1号 京公网安备110402500052 中国科学院半导体所声明