纯策略纳什均衡(纯策略纳什均衡怎么找)

生活百科 01-19 阅读:95 评论:0

什么是纳什均衡理论?

纳什均衡又称非合作博弈均衡,是博弈论中的一个重要术语,以约翰·纳什的名字命名。在博弈过程中,无论对方的战略选择是什么,一方都会选择一定的战略,这就叫主导战略。如果两个博弈者的战略组合构成各自的主导战略,则该组合被定义为纳什均衡。

当每个球员的平衡策略是达到其预期收益的最大值时,一个策略组合被称为纳什均衡,同时,所有其他球员遵循这一策略。

扩展资料;

纳什均衡可分为两类:纯战略纳什均衡和混合战略纳什均衡。

要解释纯策略纳什均衡和混合策略纳什均衡,首先要解释纯策略和混合策略。

所谓纯策略,就是为玩家提供一个完整的游戏定义。特别是,纯粹的策略决定了在任何情况下都要进行的运动,策略集合是玩家可以执行的纯策略集合。

混合策略是通过给每一个纯策略分配一个概率而形成的策略,混合策略允许玩家随机选择纯策略,在混合策略博弈的均衡中,由于每个策略都是随机的,当达到一定的概率时,就可以得到最优支付。由于概率是连续的,即使策略集是有限的,也会有无限的混合策略。

当然,严格地说,每个纯策略都是一个“退化”混合策略,一个特定纯策略的概率为1,另一个为0。

因此,“纯战略纳什均衡”是指所有参与者都玩纯战略,而相应的“混合战略纳什均衡”则是指至少有一个参与者玩混合战略。并不是每一个博弈都会有纯战略纳什均衡,比如“硬币问题”只有混合战略纳什均衡,而不是纯战略纳什均衡。

然而,仍有许多博弈具有纯战略纳什均衡(如协调博弈、囚徒困境博弈和鹿博弈)。甚至,有些游戏可以同时拥有纯策略和混合策略平衡。

参考资料来源;百度百科——纳什平衡

请教占优均衡和纯策略纳什均衡之间的区别

简单来说,占优策略是不管对方有什么策略,"我"都有唯一最优的策略,不会随着情况不同改变。而纳什均衡则是,根据对方的选择来决定自己的最优策略,会根据情况而变。

所以,占优策略均衡一定是纳什均衡,而纳什均衡却不一定是占优策略均衡。

纯策略纳什均衡(纯策略纳什均衡怎么找)

怎样用划线法求纳什均衡?

依据策略之间的相对优劣关系,分别寻找行和列的最优解:固定其中一个量,在另一个量收益大的下面划线;然后固定另一个量,对另外一个量收益大的划线。两者都有线的就是纯策略纳什均衡。

纳什均衡是指博弈中这样的局面,对于每个参与者来说,只要其他人不改变策略,他就无法改善自己的状况。纳什证明了在每个参与者都只有有限种策略选择并允许混合策略的前提下,纳什均衡定存在。

以两家公司的价格大战为例,价格大战存在着两败俱伤的可能,在对方不改变价格的条件下既不能提价,否则会进一步丧失市场;也不能降价,因为会出现赔本甩卖。

于是两家公司可以改变原先的利益格局,通过谈判寻求新的利益评估分摊方案。相互作用的经济主体假定其他主体所选择的战略为既定时,选择自己的最优战略的状态,也就是纳什均衡。

假设有n个局中人参与博弈,如果某情况下无一参与者可以独自行动而增加收益(即为了自身利益的最大化,没有任何单独的一方愿意改变其策略的),则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合(Strategy Profile)。纳什均衡,从实质上说,是一种非合作博弈状态。

纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。

纳什均衡也不意味着博弈双方达到了一个整体的最优状态,需要注意的是,最优策略不一定达成纳什均衡,严格劣势策略不可能成为最佳对策,而弱优势和弱劣势策略是有可能达成纳什均衡的。在一个博弈中可能有一个以上的纳什均衡,而囚徒困境中有且只有一个纳什均衡。

纯战略的纳什均衡是什么

混合策略表示的是博弈方对各个纯策略的偏好程度,混合策略纳什均衡是对多次博弈达到均衡结局的各个纯策略选择的概率估计

博弈论(2)—纳什均衡

如果想观看相关视频可以在西瓜视频(账号zidea)或者哔哩哔哩(账号zidea2015)找到我发布视频解说,注意头像和使用头像一致。

又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。 在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作 最佳应对 。 如果两个博弈的局中人的策略组合分别构成各自的 最佳应对 ,那么这个组合就被定义为纳什均衡。

在给出纳什均衡解释前,我们先得把一个概念说清楚最佳应对。

纳什均衡是刻画局势,如果一个局势下,每个局中人的策略都是相对其他局中人当前策略的最佳对应,则称该局势是一个 纳什均衡

如果一个局中人的某个策略对其他局中人的任何策略都是最佳对应,那么这个策略就是该局中人的 占优策略

在纳什均衡下,局中人没有人会想要改变改变,因为谁改变谁就可能在博弈中处于不利地位。

首先我们来看一看在囚徒困境中纳什均衡,对于囚徒困境的问题的纳什均衡是 双方都坦白 ,属于占优策略

其实不管局中人 2 是抗拒还是坦白,对于局中人的最佳应对都是坦白。从而可以看出纳什均衡点并不一定是整体的最优解。有人可能会说那么为什么不是对于两个人都有利的(抗拒,抗拒)呢,这里最佳应对是无论对手进行策略对自己都是最佳策略,在最后 maxmin 时候就更会了解为什么他们会做出坦白选择,这是一个规避风险的策略。

img src="./image_003/005.jpg"

这就是纯策略纳什均衡,混合策略下纳什均衡,女生看舞蹈概率 p 看足球的概率就是 1 - p,男生看舞蹈概率 q 看足球的概率就是 1 - q

妻子随机性的目的: 使丈夫无机可乘,不管丈夫选择哪个策略,其期望收益均相同

当丈夫给出概率分布不会让妻子在看足球和看,关于

以我对丈夫了解他更喜欢看足球,

局中人 1 的策略选择分布记为 , 局中人 2 的策略选择分布记为 。假设局中人 1 的策略分布不变,局中人 2 策略选择的效用为

剪刀—石头—布的混合 纳什均衡态

任何有限博弈(参与人与策略数目均为有限)都至少存在一个纳什均衡,这个均衡可能是纯策略纳什均衡(例如剪刀-石头-布),也可能是混合策略均衡,纳什均衡的多重性(例如性别之战)

纯战略纳什均衡

房地产开发博弈

房地产开发博弈、警察捉小偷与混和策略

实际上,在每个参与人都有优势策略的情况下,优势策略均衡是非常合乎逻辑的。一个优势策略优于其他任何策略,同样,一个劣势策略则劣于其他任何策略。

假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。

但遗憾的是,并不是所有博弈都有优势策略,哪怕这个博弈只有两个参与者。实际上,优势策略只是博弈论的一种特例。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。

来看这样一个房地产开发博弈的例子。假定北京市的房地产市场需求有限,A、B两个开发商都想开发一定规模的房地产,但是市场对房地产的需求只能满足一个房地产的开发量,而且,每个房地产商必须一次性开发这一定规模的房地产才能获利。在这种情况下,无论是对开发商A还是开发商B,都不存在一种策略完全优于另一种策略,也不存在一个策略完全劣于另一个策略。

因为,如果A选择开发,则B的最优策略是不开发;如果A选择不开发,则B的最优策略是开发;类似地,如果B选择开发,则A的最优策略是不开发;如果B选择不开发,则A的最优策略是开发。这样就形成了一个循环选择。

根据纳什均衡含义就是:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。即双方在对方给定的策略下不愿意调整自己的策略。

这个博弈的纳什均衡点不止一个,而是两个:要么A选择开发,B不开发;要么A选择不开发,B选择开发。在这种情况下,A与B都不存在优势策略,也就是A和B不可能只要选择某一个策略而不考虑对方的所选择的策略。实际上,在有两个或两个以上纳什均衡点的博弈中,其最后结果难以预测。在房地产博弈中,我们无法知道,最后结果是A开发B不开发,还是A不开发B开发。

再来看这样一个警察捉小偷博弈的例子。某个村庄上只有一名警察,他要负责整个村的治安。小村的两头住着两个全村最富有的村民A和B,A、B分别需要保护的财产为2万元、1万元。整个小村某一天来了个小偷,要在村中偷盗A和B的财产,这个消息被警察得知。

因为分身乏术,警察一次只能在一个地方巡逻;而小偷也只能偷盗其中一家。若警察在某家看守财产,而小偷也选择了去该富户家,就会被警察抓住;若警察没有看守财产的富户家而小偷去了,则小偷偷盗成功。

一般人会凭着感觉认为,警察当然应该看守富户A家财产,因为A有2万元的财产,而B只有1万元的财产。实际上,对于警察的一个最好的做法是,警察抽签决定去A家还是B家。

因为A家的财产是B家的2倍,小偷自然光顾A家的概率要高于B家,不妨用两个签代表A家,比如如果抽到1、2号签去A家,抽到3号签去B家。这样警察有2/3的机会去A家做看守,1/3的机会去B家做看守。

而小偷的最优选择是:以同样抽签的办法决定去A家还是去B家实施偷盗,只是抽到1、2号签去A家,抽到3号签去B家,那么,小偷有l/3的机会去A家,2/3的机会去B家。这些数值是可以通过联立方程准确计算出的,笔者这里就不给出具体的数学计算过程了。

细心的读者会发现,警察捉小偷博弈与前面所举的两个博弈案例有一个很大的差别,就是用到了概率的知识,警察与小偷没有一个一定要选择某个策略的纳什均衡,而只有选择某个策略是多少几率的纳什均衡。

在博弈论中,可以选择出某个策略的纳什均衡,这个策略叫做纯策略。

用专业的话来说,所谓纯策略是指参与者在他的策略空间中选取惟一确定的策略。但至少存在一个混合策略均衡点。

所谓混合策略是指参与者采取的不是惟一的策略,而是其策略空间上的概率分布。这就是纳什于1950年证明了的纳什定理。而这个博弈没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的策略选择是每个参与者的混合策略选择。

最常见混和策略就是猜硬币游戏。比如在足球比赛开场,裁判将手中的硬币抛掷到空中,让双方队长猜硬币落下的正反面。由于硬币落下是正是反是随机的,概率应该都是1/2。那么,猜硬币游戏的参与者都是1/2的概率选择正与反,这时博弈达到混和策略纳什均衡。

再比如我们儿时玩的“剪、布、锤”就不存在纯策略均衡,对每个小孩来说,自己采取出“剪”、“布”、还是“锤”的策略应当是随机的。一旦一方知道另一方出其中某个策略的可能性增大,那么这个对弈者在游戏中输的可能性就增大。因此,每个小孩的最优混合策略是采取每个策略的可能性是l/3。在这样的博弈中,每个小孩各取三个策略的1/3是纳什均衡。

由此可见,纯策略是参与者一次性选取的,并且坚持他选取的策略。而混合策略是参与者在各种备选策略中采取随机方式选取的。

在博弈中,参与者可以改变他的策略,而使得他的策略选取满足一定的概率。当博弈是零和博弈时,即一方所得是另外一方的所失时,此时只有混合策略均衡。对于任何一方来说,此时不可能有纯策略的占优策略.

Ø 通过了一学期的博弈论学习, 在日常生活中,知道可以凭借博弈论与信息经济学的思想方法来分析进而解决实际问题.日常生活中的一切,均可从博弈得到解释,大到美日贸易战,小到今天早上你突然生病。经济学的最基本的假设就是经济人或理性人的目的就是为了效用最大化,参与博弈的博弈者正是为了自身效用的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系,以争得效用的多少决定胜负,一定的外部条件又决定了竞争和对抗的具体形式,这就形成了博弈。

孙子兵法》上说:“知己知彼,百战百胜。”可见竞争对抗还有博弈各方拥有信息的特征。比如上一个例子中,博弈双方都明白对方的策略,从博弈理论来说,更拗口的说法是一方知道另一方知道自己的策略,反之另一方亦然,这种句法我们可以一直这么用下去,一直用到打“……”,而这正是博弈双方所掌握的公共信息。

因此我们可以了解到,形成一个博弈有4个要素:

1.博弈要有2个或2个以上的参与者(Player)。在博弈中存在一个必须的因素,那就是不是一个人在一个毫无干扰的真空里做出决策。比如一个单身汉,就不可能存在夫妻吵架的博弈,更不存在是否送花讨太太欢心的困扰。

从经济学的角度来看,如果是一个人做决策而不受到他人干扰的话,那就是一个传统经济学或管理学中最经常研究的最优化问题,也就是一个人或一个企业在一个既定的局面或情况下如何决策的问题。

任何理论与方法都不是万能的。博弈论亦然,它不可能包治百病。

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3590670841@qq.com 举报,一经查实,本站将立刻删除。

网友评论

相邻内容

    该模块只在文章页面有效!
    插件自动生成文章列表,仅建议修改模块名称