1. > 电脑手机 >

博弈论案例分析(博弈论案例分析过程)

博弈论1:重新审视“囚徒困境”的最优解

"囚徒困境"不仅仅是个模型,它也是一个"思想实验",甚至成了一个"隐喻"或"框架"。什么时候会出现"囚徒困境"?如果合作的收益较小,背叛的代价较小,博弈的次数较少,参加博弈的人数较多,"囚徒困境"就更容易出现。博弈论也持一种悲观现实主义的世界观,它不承认人会大公无私地奉献,人与人之间充满了欺诈和背叛,但这样一种悲观的思想,却能推导出非常乐观的结论。博弈论告诉我们,即使这个世界很灰暗,但乐于合作的好人最终是会胜出的。为什么会是这样呢?

1. 精读书介绍:《策略思维》

我先讲讲为什么博弈论可以成为我们的行动指南。我们之前讲过人性。人性只在幽明之间。从幽的角度来看,我们是无法预测他人的行为的。从明的角度来看,"他人有心,予忖度之",我们可以在一定程度上猜测别人的心思。博弈论就是在幽明之间观察人类行为的。博弈论的基本观点是,你在作出自己的决策时,必须把别人的决策考虑进来。博弈论在经济学、政治学、军备竞赛,甚至进化生物学里都有广泛的应用。这门学问需要用到的数学很复杂,但核心观点却简单清澈。

本周的精读书是迪克西特和奈尔伯夫的《策略思维》。《策略思维》的英文书名是Thinking Strategically。这是我读过的最有意思的博弈论普及读物,翻译得也不错。

2. 囚徒困境:柴诃夫斯基已经招了

有一个苏联音乐家在各个城市间巡回演出。他在一个城市结束了演出,坐上火车,赶往另外一个城市。在旅途中,他闲得无聊,就掏出乐谱来看。这个奇怪的举动引起了克格勃的注意。克格勃以为他在看密码本。

于是,克格勃把他抓进一个小黑屋审问。克格勃问他:"老实交代,你是不是间谍?"音乐家莫名其妙,他说,我不是啊。克格勃说:"那你看的是啥?那个密码不是你写的?"音乐家叫苦不迭:"冤枉啊,那明明是柴诃夫斯基写的。"克格勃若有所思地点点头,走出了审讯室。过了没一会儿,这个克格勃又回来了。他得意地跟音乐家说:"我看你还是老老实实招了吧,柴诃夫斯基都已经招了。"

这就是博弈论里最有名的"囚徒困境"。假设克格勃真的把柴诃夫斯基也抓了起来,关在另一个审讯室里,那么,音乐家和柴诃夫斯基会不会招呢?我们先来看第一种情况,柴诃夫斯基和音乐家都不招。如果他们两个都不招,那么克格勃就只能判他们两年刑。

哎,不对啊?你可能会问:既然找不到证据,为什么要判他们两年刑?这是根据另一个苏联笑话。在苏联的集中营里来了一个新犯人。老犯人问他:你为什么被逮进来了?他说,我什么也没干啊。老犯人又问:那你被判了几年啊?他说我被判了五年。老犯人说,那肯定弄错了,你要是什么都没干,应该判两年。

这是插播一个笑话。讲完笑话,我们再回来看第二种情况。如果音乐家招了,还陷害柴诃夫斯基,说他是个里通外国的间谍,那么,音乐家告密有功,宽大处理,马上释放,可怜的柴诃夫斯基就会被判十年--谁叫他不先揭发别人呢。

这是第二种情况,那我们再来看第三种情况。如果他们俩都招了,那么克格勃就有他们的供词:既然你们都认罪,那就判你们五年徒刑吧。

于是,问题来了。如果你是音乐家,或者你是柴可夫斯基,你会怎么做?假如你不招,别人招,你判十年,别人无罪释放,你最倒霉。假如你招,别人不招,你无罪释放,别人判十年,你靠出卖朋友逃过一劫。如果你招,别人也招,你们两个都判五年。了解博弈论的朋友都知道,最后的均衡解是音乐家和柴诃夫斯基都会招供。为什么呢?假定你招,不管别人招不招,你的处境都比不招要好。这在博弈论里被称为占优策略,就是比别的策略都好。

你现在看一下文稿,里面有一张是对"囚徒悖论"的图示。我们来根据这个案例,分析一下为什么柴诃夫斯基和音乐家最后都会进了监狱。

R是双方合作时的收益,T是别人垫背你背叛时你的收益,P是双方都背叛时的收益,S是人家背叛你垫背时你的收益。比较这四种情况,你会发现,收益的大小依次是T、R、P、S。也就是说,最好的结果是你先背叛,其次是大家都合作,再次是大家都背叛,最倒霉的是人家把你出卖了,你还在帮人家数钱。

3. 博弈论的三个要素

你看,之所以会有"囚徒困境",跟各方在不同策略下的成本和收益有关。在博弈论里,我们把这个叫做支付结构。支付结构是影响博弈结果的第一个要素。除了支付结构,还有博弈的次数、参与的人数,都会对博弈结果有影响。

我们先来看第一个要素,也就是支付结构。要是我们把"囚徒困境"的成本和收益改一下呢?比如说,我们假设,被审讯的是一对真心相爱的夫妻,他们宁肯一起坐牢,也不肯背叛对方,也就是R的收益比T大,那就不会出现"囚徒困境"了。或者,我们假设被审讯的两个人都是黑帮的成员,如果其中一个人背叛,即使他会被放出来,但出来之后就会被别的黑帮成员杀死,也就是说,背叛的成本为无穷大,那么,也不会出现"囚徒困境"。

第二个要素是博弈次数。如果这两个被审讯的人是萍水相逢的,彼此都是陌生人,那么,互相背叛的概率就会更高,但如果他们都是一个村子里的,抬头不见低头见,早晚还会再见面的,那互相背叛的概率就会降低。这就是为什么在火车站容易出现更多的骗子,但在小区里却不太会有骗子的原因。

第三个要素是参与人数。如果只有两个人接受审讯,他们达成串谋的概率相对较高,但是,如果是派出所严打,一次抓进来100个人呢,这100个人想要一起串供的概率就会大大降低。人上一百,形形色色,人数多了,监督起来就困难,想混水摸鱼的人也就会多。

博弈论案例分析(博弈论案例分析过程)博弈论案例分析(博弈论案例分析过程)


生活中的博弈论有那些例子

“博弈论”中的经典案例

1、囚徒困境

假设警察局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就可能取决于两者对于犯罪事实的供认。警察局将这两名嫌疑犯分别关押以防他们串供。两名囚徒明白,如果他们都交代犯罪事实,则可能将各被判刑5年;如果他们都不交代,则有可能只会被以较轻的妨碍公务罪各判1年;如果一人交代,另一人不交代,交代者有可能会被立即释放,不交代者则将可能被重判8年。

对于两个囚徒总体而言,他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时,都要冒很大的风险,一旦自己不交代而另一囚徒交代了,自己就将可能处于非常不利的境地。对于囚徒A而言,不管囚徒B采取何种策略,他的最佳策略都是交代。对于囚徒B而言也是如此。最后两人都会选择交代。因此,囚徒困境反映了个体理性行为与集体理性行为之间的矛盾、冲突。

囚徒困境现象在现实生活中比比皆是。记得姜昆和唐杰忠过去说过一个公共楼道占用问题的相声。住户在公共楼道里堆满了杂物,结果大家都极不方便,以致即将分娩的妇女都没法及时被送往医院。但你如果不占用公共楼道,别人也会占用。每一居住面积狭小的住户从自我利益最大化出发,都会选择占用。但占用的结果却最终损害了大家的利益。

前几年,我国彩电市场上,生产厂家基于自我利益选择大幅降价,但由此引发的价格战使所有生产厂家都遭受重创,这也是一种囚徒困境。

2、斗鸡博弈

两只公鸡面对面争斗,继续斗下去,两败俱伤,一方退却便意味着认输。在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、背水一战的决心来,以迫使对方退却。但到最后的关键时刻,必有一方要退下来,除非真正抱定鱼死网破的决心。

这类博弈也不胜枚举。如两人反向过同一独木桥,一般来说,必有一人选择后退。在该种博弈中,非理性、非理智的形象塑造往往是一种可选择的策略运用。如那种看上去不把自己的生命当回事的人,或者看上去有点醉醺醺、傻乎乎的人,往往能逼退独木桥上的另一人。还有夫妻争吵也常常是一个“斗鸡博弈”,吵到最后,一般地,总有一方对于对方的唠叨、责骂装聋作哑,或者干脆妻子回娘家去冷却怒火。冷战期间,美苏两大军事集团的争斗也是一种“斗鸡博弈”。在企业经营方面,在市场容量有限的条件下,一家企业投资了某一项目,另一家企业便会放弃对该项目的觊觎。

当然,“博弈论”中还有其他一些著名案例,这里无法一一加以剖析。上述的三大案例、尤其是前两大案例,已经成为经济学中的专用名词,成为经济学中对许多问题进行分析的分析支架。

3、博弈策略

博弈策略的成功运用须依赖一定的环境、条件,在一定的博弈框架中进行。

谈到博弈策略问题,可以说在我国传统文化中,包含有许多精妙的博弈策略。许多成语及成语典故,就是对博弈策略的令人叫绝的运用和归纳。如围魏救赵、背水一战、暗渡陈仓、釜底抽薪、狡兔三窟、先发制人、借鸡生蛋等等。当然,博弈策略的成功运用须依赖一定的环境、条件,在一定的博弈框架中进行。

在博弈中,人们经常采用威胁策略,但其他博弈方也会采取对威胁的辨别和反威胁策略。经济学家泽尔腾就将不可置信的威胁剔除出去,解决了一个博弈中可能存在多个“纳什均衡”的问题,从而使人们能方便地预测博弈的结果。举一个通俗的例子来说,父母不同意女儿所交的男友,威胁女儿说:“如果你再同他交往,我们就与你断绝关系。”但这样的威胁往往是不可信的。对爱情执着的聪明女儿会置父母的不可置信的威胁于不顾,继续与男友交往甚至最终与之结婚,父母最后也会承认那个当初他们并不喜欢的女婿。这个结果便是剔除了不可置信的威胁后的“纳什均衡”,“博弈论”中称其为“子博弈精炼纳什均衡”。

“博弈论”研究还发现,在重复博弈中,如果博弈的次数是无限的,博弈方会选择相互合作的策略。因为如果一家企业采取不合作的低价倾销策略,其他企业也会采取相同的策略进行报复性竞争,长期下去,这些企业都将完蛋。企业深谙此理后,便会在相互默契中将价格维持在一个合适水平,尽量避免长期性、大规模的低价杀伤战。美国水表生产的四大巨头企业(班琪表业等)在长达几十年的时期内都维持了这种定价方面的良好合作关系,成为“博弈论”中经常被提及的案例。

但如果重复博弈的次数较少,则合作就不可能实现。如生产彩电的某企业已决定转产而不再生产彩电,它就不会与其他彩电企业继续价格方面的合作,而可能对库存品低价甩卖,因为别的彩电企业对它没有报复的机会了。一些人在快调离原单位或快退休时的拙劣表现,也属此列(包括所谓的“59岁现象”)。

再举一个生活中的例子:如果你去菜场买菜,当你对某种菜的质量、口味等有疑虑时,卖菜的阿姨常会讲:“你放心,我一直在这儿卖呢!”这句朴实的话中其实包含了华丽的“博弈论”思想:我卖与你们买是一个次数无限的重复博弈,我今天骗了你,你们今后就不会再来我这儿买了,所以我不会骗你的,菜的质量、口味肯定没问题。而你在听了阿姨的上述一句话后,常常也会打消疑虑,买菜回家。

在博弈中,人们掌握的信息经常是不完全的,这就需要在博弈进行过程(即动态博弈)中不断地收集信息、积累知识、修正判断。成语故事“黔驴技穷”实际上就包含了一个不完全信息动态博弈。毛驴刚到贵州时,老虎摸不准这个大动物究竟有多大本领,因而躲在树林里偷偷观察,这在老虎当时拥有的信息条件下是一种最优策略选择。过了一阵子,老虎走出树林,逐渐接近毛驴,就是想获得有关毛驴的进一步信息。一天,毛驴大叫一声,老虎吓了一跳,急忙逃走,这也是最优策略选择。又过了一些天,老虎又来观察,并对毛驴挨得很近,往毛驴身上挤碰,故意挑衅它。毛驴在忍无可忍的情况下,就用蹄子踢老虎,除此之外,别无它法。老虎最终了解到毛驴的真实本领后,就扑过去将它吃了。在这个故事里,老虎通过观察毛驴的行为逐渐修正对毛驴的看法,直到看清它的真面目。事实上,毛驴的策略也是正确的,它知道自己的技能有限,总想掩藏自己的真实技能。老虎吃掉毛驴的策略,在“博弈论”中就是所谓的“精炼贝叶斯均衡”。

人们常提到的“上有政策、下有对策”,其实是对管理者与被管理者之间的动态博弈的一种描述,面对上边的政策,下边寻求对策是正常的、必然的。从“博弈论”的角度讲,上边的政策制定必须在考虑到下边可能会有的对策的基础上进行,否则,政策就不会是科学、合理的。

从以上对“博弈论”简要、通俗的介绍中可以发现,我们身边充满了博弈,或者说,我们身边的许多行为、现象都可用博弈来概括。“博弈论”不仅属于经济学,也理应属于社会学、政治学、心理学、历史学等,这些学科也有理由分享“博弈论”那旖旎的学术风光和精细的分析技巧。

<案例二:智猪博弈>

这个例子讲的是,猪圈里有两头猪,一大一小.猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应。按一下按钮会有10个单位的猪食进槽,但谁按按钮需要付2个单位的成本.若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。表中第一格表示两猪同时按按钮,因而同时走到猪食槽,大猪吃7个,小猪吃3个,扣除2个单位的成本,支付水平分别为5和1.其他情形可以类推.

在这个例子中,什么是纳什均衡?首先我们注意到,无论大猪选择"按"还是"等待",小猪的最优选择均是"等待".比如说给定大猪按,小猪也按时得到1个单位,等待则得到4个单位;给定大猪等待,小猪按得到-1单位,等待则得0单位,所以,"等待"是小猪的占优战略.给定小猪总是选择"等待",大猪的最优选择只能是"按".所以,纳什均衡就是:大猪按,小猪等待,各得4个单位.多劳者不多得!

<案例三:性别战>

这个例子讲的是一男一女谈恋爱,有些业余活动要安排,或者去看足球比赛,或者去看芭蕾舞演出.男的偏好足球,女的则更喜欢芭蕾,但他们都宁愿在一起,不愿分开。这个博弈中,有两个纳什均衡:(足球,足球)(芭蕾,芭蕾).就是说,给定一方去足球场,另一方也会去足球场;类似的,给定一方去看芭蕾舞,另一方也会去看芭蕾舞.那么,究竟哪一个纳什均衡会实际发生?我们不知道.只有看实际生活了.

<案例四:斗鸡博弈>

设想两个人举着火棍从独木桥的两端走向中央进行火拼,每个人都有两种战略:继续前进,或退下阵来.若两人都继续前进,则两败俱伤;若一方前进另一方退下来,前进者取得胜利,退下来的丢了面子;若两人都退下来,两人都丢面子.这个博弈里也有两个均衡:如果一方进,另一方的最优战略就是退。两人都进或退都不是纳什均衡。

<案例五:市场进入阻挠>

这是产业组织经济学中的一个例子.设想有一个垄断企业已在市场上(称为"在位者"),另一个企业虎视眈眈想进入("进入者").在位者想保持自己的垄断地位,所以就要阻挠进入者进入.

在这个博弈中,进入者有两种战略可以选择:进入还是不进入;在位者也有两种战略:默许或斗争.假定进入之前垄断利润为300,进入之后寡头利润合为100(各得50),进入成本为10.各种战略组合下的支付矩阵亦可列表.这个博弈中也有两个纳什均衡,即(进入,默许),(不进入,斗争).为什么(进入,默许)是纳什均衡?因为给定进入者进入,在位者选择默许时得50单位利润,选择斗争时得不到利润,所以,最优战略是默许。类似的,给定在位者选择默许,进入者的最优战略就是进入.尽管在进入者选择不进入时,默许和斗争对在位者是一个意思,只有当在位者选择斗争时,不进入才是进入者的最优选择,所以,(不进入,斗争)是一个纳什均衡,而(不进入,默许)不是一个纳什均衡。

<案例六:承诺行动>

现实中我们知道存在很多不可置信的威胁,而如何令不可置信的威胁变的真正具有威胁能力呢?那就要引入"承诺行动"这个概念。

承诺行动是当事人使自己的威胁战略变的可置信的行动.一种威胁在什么时候才是可置信的?答案是,只有当事人在不实行这种威胁时,就会遭受更大的损失的时候.所以说,承诺行动意味着当事人要为自己的"失信"付出成本,尽管这种成本并不一定真的发生.但承诺行动会给当事人带来很大的好处,因为它会改变均衡结果.举例说,在市场进入博弈中,如果在位者通过某种承诺行动使自己的"斗争"威胁变的可置信,进入者就不敢进入,在位者可以获得更多的利润.一种简单的方法是,在位者与某个第三者打个赌:如果进入者进入后他不斗争,他就付给后者100.这时,斗争就变成了一种可置信的威胁.因为,如果进入后不斗争而是选择默许,在位者得到50的寡头利润,去掉100的赌注,净得-50;而若选择"斗争",利润为0,所以斗争比合作好.注意,有了这个赌,进入者就不敢进入了,在位者实际上无需支付100的赌注,却得到300垄断利润(在这个例子中,承诺行动的实际成本为0,但一般来说,承诺行动的成本不为零.而且,承诺行动的成本越高,威胁就越值得置信).

生活中的博弈论有那些例子

不至于要讲囚徒困境吧?

那讲工作上的事

假如你做的策划被上司偷了

那你是要向更高级的领导告状还是忍受

这也算一个博弈论问题

你要是告状,也许能够伸冤,但也会若到上司

他可能会给你下绊子

但不上诉他也许会再偷,你的工作就白废了

还有

物价方面

假如几个店铺联合起来

自然能够把东西卖的比较贵

但只要其中一个降价

其他店的客人就会全跑到那家去

那另外几家也会被迫降价

店铺联合本来是最好的赚钱方法

但店铺间一般是敌对关系

为防备有人订低价,引走客人

所有的店铺都会尽可能低价

其实我们学校门口的网吧刚上演了一出这个好戏

真是有感触啊!!!!!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, website.service08@gmail.com 举报,一经查实,本站将立刻删除。

联系我们

工作日:9:30-18:30,节假日休息