南开21秋学期(1709、2103、2109、1903、1909、2003、2009、2103)《初级博弈论》在线作业[答案]
正确答案:-----
南开21秋学期(1709、2103、2109、1903、1909、2003、2009、2103)《初级博弈论》在线作业[答案]答案
21秋学期(1709、2103、2109、1903、1909、2003、2009、2103)《初级博弈论》在线作业
试卷总分:100 得分:100
一、判断题 (共 50 道试题,共 100 分)
1.进化博弈论只能研究群体行为特征,即群体成员采用各种策略比例的发展变化和稳定性问题。
2.静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。
3.每种有限理性博弈模型有各自的适用情况,也有各自的局限性。
4.纳什均衡的“一致预测性”不是指不同博弈方的预测相同,而是指如果所有博弈方预测特定博弈结果会出现,那么所有博弈方都不会选择与预测不一致的策略。
正确答案:-----
正确答案:-----
5.纳什均衡是比上策均衡稳定性更高的均衡概念。
6.博弈方对风险上策均衡的选择倾向,还有自我强化的机制。
7.所有多阶段动态博弈都有子博弈。
8.重复博弈也是动态博弈,是特殊的动态博弈。
9.任何博弈方都不会采用任何严格下策,不管它们是纯策还是混合策略。
10.严格下策反复消去法不会消去纯策略什均衡,但会消去混合策略纳什均衡。
11.最优反应动态中,博弈方调整策略必须先后依次进行,不能根据对方的策略变化再次调整。
12.在零和博弈中不存在双方合作的可能性,但如果双方知道原博弈要重复进行多次,博弈方的行为会变得合作。
13.纳什均衡的普存在性,保证了纳什均衡分析是一种普适用的分析工具,纳什均衡的“一致预测”性质才具有更大意义,纳什均衡才会成为分析的中心概念和基本出发点。
正确答案:-----
正确答案:-----
14.在两人博弈中,个人追求最大自身利益的行为,能够真正实现个人自身的最大利益。
15.最优反应动态假设由于博弈方不了解对方得益函数或缺乏博弈意识等原因,无法在正确预期对方行为的前提下找到均衡策略,初始决策有盲目性,但博弈方了解自身得益函数,可以事后看到对手策略(组合),并采用最优对策。
16.动态博弈中博弈方在每个阶段的选择的行为都是独立的。
17.风险上策均衡的简单判别标准是,所有博弈方预计其他博弈方采用各个纳什均衡的策略概率相同时,都偏爱其中某一纳什均衡,则该纳什均衡就是风险上策均衡。
21.如果教育本身对提高人们的素质和生产率没有作用,那么企业招聘员工时把教育背景作为基本要求也就没有意义。
19.只要声明方和行为方的利益不是对立的,那么口头声明肯定能传递一些信息。
20.如果一个博弈中,不管其他方的策略如何变化,某种策略给一个博弈方带来的得益总比另一种策略小,则称前一种策略为相对于后一种策略的 “严格下策”。
正确答案:-----
正确答案:-----
21.对不完美信息动态博弈来说,如果一选择节点包含在一子博弈中,则包含该节点的信息集中的所有节点都必须包含在该子博弈中。
22.对一个博弈运用格下反消去法后,某个博弈方只有唯一的策略行下来,该略就是该博弈方的唯一理性选择,如果博弈的所有策略组合中只有一个存下来,幸存的策略组合就是该博弈的结果。
23.纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。
24.触发策略是重复博弈中实现合作和提高均衡效率的关键机制,是重复博弈析的重要“构件”之一。
正确答案:-----
正确答案:-----
25.如果原博弈唯一的纯策略纳什均衡本身是帕累托效率意义上的最佳策略组合,能够实现所有博弈方的最大利益,重复博弈显然不会改变博弈方的行为方式。
26.重复博弈会迫使博弈方考虑未来、长期的利益,对博弈方的行为造成约束,影响博弈方的策略和博弈结果。
27.最优反应动态必须考虑收敛过程、均衡的稳健性,也就是博弈方偏离收敛路径、均衡后能否恢复的问题,否则也会影响这种博弈模型分析的预测作用和价值。
28.重复博弈的子博弈必然是重复博弈。
29.运用海萨尼转换以后,不完全信息动态博弈与完全但不完美信息动态博弈基本上是相同的。
30.最优反应动态是否收敛和收敛的条件,均衡是否唯一和收敛速度快慢,正是这类有限理性模型的关键问题。
31.划线法是非常简便的博弈分析方法,由于它以策略的相对优劣关系为基础,因此在分析用得益矩阵表示的博弈时有普遍适用性。
32.古玩市场的交易中买卖双方的后悔都来自于自己对古玩价值判断的失误,若预先对价值的判断是正确的,那么交易者肯定不会后悔。
33.如果原博弈有唯一的纯策略纳什均衡,则有限次重复博弈唯一的子博弈完美纳什均衡,即各博弈方每次重复时都采用原博弈的纳什均衡策略。
34.根据博弈方式差别,博弈可以分为非合作博弈和合作博弈。
35.古诺产量博弈也有上策均衡。
36.相机选择引出的策略可信性间题最重要的意义,在于对纳什均衡在动态分析博弈中的有效性提出了挑战。
37.猜硬币博中两博弈方都以(1/2,1/2)的概率分布随机选择正面和反面是一个纳什均衡,而且是这个博弈唯一的纳什均衡。
38.博弈方数量越多,策略依存性越复杂,分析就越困难。
39.相机选择会使博方策略设定的行为缺乏“可信性”。
正确答案:-----
正确答案:-----
40.不完美信息动态博弈中的信息不完美性都是客观因素造成的,而非主观因素造成。
41.静态博弈和动态博模型对应社会经济的短期一次性关系,重复博弈就对应社会经济中的许多持续存在或反复出现的长期关系。
42.理性的博弈方不可能采用严格下策,但把严格下策排除出策略空间会影响博弈结果。
43.承认博弈方普遍存在理性局限,才是博弈分析者自身比较理性的态度。
44.虚拟行动是根据对手的当前策略进行反应,而最优反应动态则追踪对手以前采用各个策略的频率,并据此调整策略。
45.触发策略所构成的均衡都是子博弈完美纳什均衡。
46.因为原博弈本身不会成为原博弈的后续阶段,因此子博不能从原博弈的第一个节点开始。
47.在两人博弈中,掌握信息较多并不保证利益也较多。
48.完全不完美信息动态博弈中各博弈方都不清楚博弈的进程,但清楚博弈的得益。
49.两人零和博弈的无限次重复博弈中,博弈方仍然会每次重复采用原博弈的混合策略纳什均衡。
50.不完美信息动态博弈的基本特征是博弈方在信息方面不对称。
南开21秋学期(1709、2103、2109、1903、1909、2003、2009、2103)《初级博弈论》在线作业[答案]历年参考题目如下:
经济学专升本考试科目:大学语文、英语(二)。每科100满分,60分通过。
主要课程:国际经济学、国际金融、经济学原理、经济法、证券市场基础、初级博弈论、西方经济学(宏观)、西方经济学(微观)、金融衍生工具入门等。
与经济学专升本相近专业:会计学、金融学、财政学、国际经济与贸易、保险学等。
正确答案:-----
经济学专升本可以报考的学校有西南大学、福建师范大学、四川农业大学、中国地质大学(北京) 、 、西安交通大学等。
经济学专升本远程教育学历是国家承认、学信网可查的,可用在升职加薪、找工作、出国留学、考研、公考、落户积分、职业资格证书考试、职称评级等方面。
《初级博弈论》课程期末复习资料
一、客观部分:(单项选择、多项选择、不定项选择、判断)
(一)、判断题
★考核知识点:博弈方的策略和得益,
★考核知识点: 两人博弈
★考核知识点:静态博弈与动态博弈概念
★考核知识点: 完全信息博弈的概念
★考核知识点: 上策均衡
★考核知识点: 严格下策反复消去法
★考核知识点: 纳什均衡的一致预测性质
★考核知识点: 混合策略和严格下策反复消去法
★考核知识点: 动态博弈的非对称性
★考核知识点: 纳什均衡的问题
★考核知识点:子博弈的概念
★考核知识点: 重复博弈的策略、子博弈和均衡路径
★考核知识点: 唯一纯策略纳什均衡博弈的有限次重复博弈
★考核知识点: 两人零和博弈的无限次重复博弈
★考核知识点:子女对父母的赡养义务
★考核知识点:ESS的概念
★考核知识点: 囚徒的困境
★考核知识点: 两人博弈
★考核知识点: 单人博弈
★考核知识点:博弈方的能力和理性
★考核知识点: 上策均衡的概念
★考核知识点: 严格下策的概念
★考核知识点: 一致预测的概念
★考核知识点: 混合策略和严格下策反复消去法
★考核知识点: 动态博弈的策略和结果
★考核知识点: 子博弈的概念
★考核知识点: 子博弈完美纳什均衡的概念
★考核知识点: 重复博弈的概念
★考核知识点: 两人零和博弈的有限次重复博弈
★考核知识点: 无限次重复博弈
★考核知识点: 有限理性博弈分析框架
★考核知识点: ESS的概念
★考核知识点: 囚徒的困境
★考核知识点: 赌胜博弈
★考核知识点: 博弈过程
★考核知识点: 非合作博弈的概念
★考核知识点: 严格下策的概念
★考核知识点: 纳什均衡的一致预测性质
★考核知识点: 上策均衡和纳什均衡的关系
★考核知识点: 上策均衡和帕累托最优的均衡,
★考核知识点: 相机选择和策略中的可信性问题,
★考核知识点: 逆推归纳法
★考核知识点: 子博弈的概念
★考核知识点: 重复博弈的得益
★考核知识点: 有限次重复博弈
★考核知识点: 触发策略
★考核知识点: 有限理性博弈分析框架
★考核知识点: ESS的概念,
二、主观部分:
(一)、简答
★考核知识点:游戏与博弈
附2.1.1(考核知识点解释)
游戏和博弈的共同特征:
①都有一定的规则,规定游戏的参加者可以做什么,不可以做什么,应当按怎样的顺序做,什么时候游戏结束或一旦参加者犯规怎样处罚。
②都有一个结果,如一方赢一方输,平局或参加者各有所得等。
③策略至关重要,游戏者不同的策略选择常会带来不同的游戏结果。
④策略与利益具有相互依存性,即每一个游戏者所得结果的好坏,不仅取决于自己的策略选择,也取决于其他参加者的策略选择。
★考核知识点:有限次重复博弈的民间定理
附2.1.2:(考核知识点解释)
用wi,记博弈方i在一次性博弈中最差的均衡得益,用w记各博弈方的wi构成的得益数组。
不管其他博弈方的行为如何,一博弈方在某个博弈中只要自己采取某种特定的策略,最低限度保证能获得的得益称为“个体理性得益” 或“保留得益”。
博弈中所有纯策略组合得益的加权平均(权数非负且总和为1)数组称为“可实现得益”。
定理:设原博弈的一次性博弈有均衡得益数组优于w,那么在该博弈的多次重复中所有不小于个体理性得益的可实现得益,都至少有一个子博弈完美纳什均衡的极限的平均得益来实现它们。
★考核知识点:纳什均衡与严格下策消去法
附2.1.3:(考核知识点解释)
命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡
命题2.2:在n个博弈方的博弈中 中,如果
是G的一个纳什均衡,那么严格下策反复消去法一定不会将它消去
上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的
★考核知识点:唯一纯策略纳什均衡博弈的有限次重复博弈
附2.1.4:(考核知识点解释)
设原博弈G有唯一的纯策略纳什均衡,则对任意整数T,重复博弈 G(T)有唯一的子博弈完美纳什均衡,即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍,平均得益等于原博弈G中的得益。
★考核知识点:防共谋均衡
附2.1.5:(考核知识点解释)
如果一个博弈的某个策略组合满足下列要求:
(1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图;
(2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;
(3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。
满足上述要求的均衡策略组合称为 “防共谋均衡”。
★考核知识点:均衡的类型
附2.1.6:(考核知识点解释)
根据效率差异将市场均衡可分以下四种不同的类型
①市场完全失败。如果市场上所有的卖方,甚至质量“好”的商品的卖方,都因为担心卖不出去而不敢将商品投放市场,当然市场就完全不能运作,如果此时潜在的贸易利益确实是存在的,则我们称这种情形为“市场完全失败”。
②市场完全成功。如果只有质量好的商品的卖方将商品投放市场,而质量差的商品的卖方不敢将商品投放市场。此时因为市场上的商品都是好的,因此买方会买下市场上的所有商品,实现最大的贸易利益,我们称这种情况为“市场完全成功”。
③市场部分成功。如果所有卖方,包括有好商品的和有差商品的,都将商品投放市场,而买方也不管好坏商品都买进。这样的情况称为“市场部分成功”。因为这种情况下能够进行交易,潜在的贸易利益能够实现,但同时也会存在部分“不良交易”,即买方买进差商品时蒙受的损失。
④市场接近失败。如果所有好商品的卖方都将商品投放市场,而只有部分“差”商品的卖方将商品投放市场,同时买方不是买下市场上的全部商品,而是以一定的概率随机决定是否买进,即双方都采用混合策略。这样的市场称为“市场接近失败”。这种市场的总体效率低于市场完全成功和市场部分成功,但比市场完全失败要强
★考核知识点:博弈的定义
附2.1.7:(考核知识点解释)
规定或定义一个博弈需要设定下列四个方面:
①博弈的参加者(Player)——博弈方
②各博弈方的策略(Strategies)或行为(Actions)
③博弈的次序(Order)
④博弈方的得益(Payoffs)
★考核知识点:有限次重复博弈与无限次重复博弈的差异
附2.1.8:(考核知识点解释)
虽然无限次重复博弈与有限次重复博弈一样,也是基本博弈的重复进行,但两者还是有重要区别的:
①无限次重复博弈没有结束重复的确定时间,也就是最后一次重复。
②无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题,必须考虑后一期得益折算成前一期得益的贴现系数,对博弈方选择和博弈均衡的分析必须以平均得益或总得益的现在值为根据。
★考核知识点:混合策略和严格下策反复消去法的关系
附2.1.9:(考核知识点解释)
在包括混合策略的情况下,关于严格下策反复消去法的结论仍然是成立的。即①任何博弈方都不会采用任何严格下策,不管它们是纯策略还是混合策略;②严格下策反复消去法不会消去任何纳什均衡,包括纯策略纳什均衡和混合策略纳什均衡;③如果经过反复消去后留下的策略组合是惟一的,那么一定是纳什均衡。因此,在考虑混合策略的情况下,我们仍然可利用严格下策反复消去法进行分析,而且实际上引进混合策略只有使严格下策反复消去法的用处更大。
★考核知识点:子博弈的含义
附2.1.10:(考核知识点解释)
子博弈:“由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分”。这个定义实际上隐含了几个方面的含义:
a.因为原博弈本身不会成为原博弈的后续阶段,因此子博弈不能从原博弈的第一个节点开始,即原博弈不是自己的一个子博弈。
b.包含所有在初始节点之后的选择节点和终点,但不包含不跟在此初始节点之后的节点。
C.不分割任何的信息集。即如果一选择节点包含在一子博弈中,则包含该节点的信息集中的所有节点都必须包含在该子博弈中。这一条可以说是专对有多节点信息集的不完美信息动态博弈而言的。
★考核知识点:动态博弈的基本特点
附2.1.11:(考核知识点解释)
动态博弈的基本特点:
(1)动态博弈的策略和结果
①策略是在整个博弈中所有选择、行为的计划
②结果是上述“计划型”策略的策略组合,构成一条路径
③得益对应每条路径,而不是对应每步选择、行为
(2)动态博弈的非对称性
动态博弈的非对称性——先后次序决定动态博弈必然是非对称的。
★考核知识点:暗标拍卖的基本特征
附2.1.12:(考核知识点解释)
暗标拍卖的基本特征:
⑴密封递交标书;
⑵统一时间公证开标;
⑶标价最高者以所报标价中标。
★考核知识点:纳什均衡的一致预测性
附2.1.13:(考核知识点解释)
如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此这个预测结果最终真会成为博弈的结果。
★考核知识点:无限次重复博弈的民间定理
附2.1.14:(考核知识点解释)
★考核知识点:纳什定理
附2.1.15:(考核知识点解释)
在一个由n个博弈方的博弈 中,如果n是有限的,且 都是有限集(对 ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。
★考核知识点:完美贝叶斯均衡的概念
附2.1.16:(考核知识点解释)
一个策略组合和相应的判断满足下列4个要求,称为一个“完美贝叶斯均衡”:
要求1:在各个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的“判断”。对非单节点信息集,一个“判断”就是博弈达到该信息集中各个节点可能性的概率分布,对单节点信息集,则可理解为“判断达到该节点的概率为1”
要求2:给定各博弈方的“判断”, 他们的策略必须是“序列理性”的。即在各个信息集,给定轮到选择博弈方的判断和其他博弈方的“后续策略”,该博弈方的行为及以后阶段的“后续策略”,必须使自己的得益或期望得益最大。此处所谓“后续策略”即相应的博弈方在所讨论信息集以后的阶段中,针对所有可能情况如何行为的完整计划
要求3:在均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方的均衡策略决定
要求4:在不处于均衡路径上的信息集处,“判断”由贝叶斯法则和各博弈方在此处可能有的均衡策略决定
当一个策略组合及相应的判断满足这样四个要求时,称为一个“完美贝叶斯均衡”。这是完美贝叶斯均衡的比较完全的定义方法。
★考核知识点:逆推归纳法的问题
附2.1.17:(考核知识点解释)
①逆推归纳法只能分析明确设定的博弈问题,要求博弈的结构,包括次序、规则和得益情况等都非常清楚,并且各个博弈方了解博弈结构,相互知道对方了解博弈结构。这些可能有脱脱离离实际的可能
②逆推归纳法也不能分析比较复杂的动态博弈
③在遇到两条路径利益相同的情况时逆推归纳法也会发生选择困难
④对博弈方的理性要求太高,不仅要求所有博弈方都有高度的理性,不允许犯任何错误,而且要求所有博弈方相互了解和信任对方的理性,对理性有相同的理解,或进一步有“理性的共同知识”
★考核知识点:海萨尼转换
附2.1.18:(考核知识点解释)
★考核知识点:子博弈和子博弈完美纳什均衡;逆推归纳法
附2.2.1:(考核知识点解释)
定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。逆推归纳法是动态博弈分析最重要、基本的方法。
逆推归纳法的逻辑基础:动态博弈中先行为的理性的博弈方,在前面阶段选择行为时必然会先考虑后行为博弈方在后面阶段中将会怎样选择行为,只有在博弈的最后一个阶段选择的,不再有后续阶段牵制的博弈方,才能直接作出明确选择。而当后面阶段博弈方的选择确定以后,前一阶段博弈方的行为也就容易确定了。
逆推归纳法的一般方法:从动态博弈的最后一个阶段开始分析,每一次确定出所分析阶段博弈方的选择和路径,然后再确定前一个阶段的博弈方选择和路径。逆推归纳到某个阶段,那么这个阶段及以后的博弈结果就可以肯定下来,该阶段的选择节点等于一个结束终端。我们甚至可以用不包括该阶段与其后所有阶段博弈的等价博弈来代替原来的博弈。
定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。
并不是动态博弈的任何部分都能构成子博弈,也不是所有多阶段动态博弈都有子博弈。
首先子博弈不能包括原博弈的第一个阶段,这也意味着动态博弈本身不会是它自己的子博弈。
其次子博弈必须有一个明确的初始信息集,以及必须包含初始阶段之后的所有博弈阶段,这意味着子博弈不能分割任何信息集,也意味着在有多节点信息集的不完美信息博弈中可能不存在子博弈等。
定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。
子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。
逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。
子博弈完美纳什均衡能够排除策略组合中不可信行为选择的原因,是虽然包含不可信行为选择的策略组合可以构成整个博弈的纳什均衡,但其中的不可信行为选择,至少在博弈的某些子博弈中不符合博弈方的自身利益,因而不构成纳什均衡,因此要求在所有子博弈中都是纳什均衡的子博弈完美纳什均衡,就排除了其中存在不可信行为选择的可能性,从而在动态博弈分析中具有真正的稳定性。
★考核知识点:纳什均衡;无限策略博弈分析和反应函数;
附2.2.2:(考核知识点解释)
纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方的策略 ,都是对其余博弈方策略的组合 的最佳对策,也即
对任意 都成立,则称 为G的一个纳什均衡
古诺模型的纳什均衡也可以通过对划线法思路的推广来求。划线法的思路是先找出每个博弈方针对其他博弈方所有策略(或策略组合)的最佳对策,然后再找出相互构成最佳对策的各博弈方策略组成的策略组合,也就是博弈的纳什均衡。在无限策略的古诺博弈模型中这样的思路实际上也是可行的,只是其他博弈方的策略现在有无限多种,因此各个博弈方的最佳对策也有无限种,它们之间往往构成一种连续函数关系。
其实对一个一般的博弈,只要得益是策略的多元连续函数,我们都可以求每个博弈方针对其他博弈方策略的最佳反应构成的函数,也就是反应函数,而解出的各个博弈方反应函数的交点就是纳什均衡。这种利用反应函数求博弈的纳什均衡的方法称为“反应函数法”。
★考核知识点:混合策略和混合策略纳什均衡
附2.2.3:(考核知识点解释)
混合策略:在博弈 中,博弈方 的策略空间为
,则博弈方 以概率分布 随机在其 个可选策略
中选择的“策略”,称为一个“混合策略”,其中 对 都成立,
且
把策略扩展到包括混合策略时,纳什均衡概念仍然成立,其本质规定性也仍然相同,即如果一个策略组合满足各博弈方的策略相互是对其他博弈方策略的最佳对策时,就是一个纳什均衡。不过现在其中的策略既可能是纯策略,也可能是混合策略。这时候纳什均衡意味着任何博弈方单独改变自己的策略,或者随机选择各个纯策略的概率分布,都不能给自己增加任何利益。如果确实是一个严格意义上的混合策略组合(即未退化为纯策略组合的)构成一个纳什均衡,称则为一个“混合策略纳什均衡”。
猜硬币博弈中找混合策略纳什均衡概率分布的思路,即令各个博弈方随机选择纯策略的概率分布,满足使对方或其他博弈方采用不同策略的期望得益相同,从而计算出各个博弈方随机选择各纯策略概率的方法,在求其他严格竞争博弈的混合策略纳什均衡时也适用。当然,在博弈方人数较多,各个博弈方的纯策略数量较多,而且也不那么对称的博弈中,寻找混合策略纳什均衡要困难一些。
第一个原则,不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性。第二个原则是他们选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过针对性地倾向某一策略而在博弈中占上风。
★考核知识点:动态博弈的扩展性表示;子博弈完美纳什均衡
附2.2.4:(考核知识点解释)
动态博弈各个博弈方的选择行为有先后次序,每个博弈方的选择行为会形成依次相连的时间阶段,因此动态博弈中一个博弈方的一次选择行为常称为一个“阶段” 。动态博弈中也可能存在几个博弈方同时选择的情况,这时这些博弈方的同时选择构成一个阶段。一个动态博弈至少有两个阶段,因此动态博弈有时也称为“多阶段博弈”,也有称动态博弈为“序列博弈”
采用一种通过选择节点、从选择节点出发的表示博弈方各种可能选择的线段,以及博弈终端处的得益数组表示动态博弈的方法。这种表示法称为“扩展形”,也有称其为“博弈树”的。由于扩展形可以反映动态博弈中博弈方的选择次序和博弈的阶段,因此是表示动态博弈的最佳方法。正因为动态博弈常用扩展形表示,因此有时也被称为“扩展形博弈”。
定义:由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。
定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。
子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。
逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。
★考核知识点:逆推归纳法;子博弈完美纳什均衡
附2.2.5:(考核知识点解释)
定义:从动态博弈的最后一个阶段博弈方的行为开始分析,逐步倒推回前一个阶段相应博弈方的行为选择,一直到第一个阶段的分析方法,称为“逆推归纳法”。逆推归纳法是动态博弈分析最重要、基本的方法。
逆推归纳法的逻辑基础:动态博弈中先行为的理性的博弈方,在前面阶段选择行为时必然会先考虑后行为博弈方在后面阶段中将会怎样选择行为,只有在博弈的最后一个阶段选择的,不再有后续阶段牵制的博弈方,才能直接作出明确选择。而当后面阶段博弈方的选择确定以后,前一阶段博弈方的行为也就容易确定了。
逆推归纳法的一般方法:从动态博弈的最后一个阶段开始分析,每一次确定出所分析阶段博弈方的选择和路径,然后再确定前一个阶段的博弈方选择和路径。逆推归纳到某个阶段,那么这个阶段及以后的博弈结果就可以肯定下来,该阶段的选择节点等于一个结束终端。我们甚至可以用不包括该阶段与其后所有阶段博弈的等价博弈来代替原来的博弈。
由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的,有初始信息集和进行博弈所需要的全部信息,能够自成一个博弈的原博弈的一部分,称为原动态博弈的一个“子博弈”。
定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。
子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。
逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。
子博弈完美纳什均衡能够排除策略组合中不可信行为选择的原因,是虽然包含不可信行为选择的策略组合可以构成整个博弈的纳什均衡,但其中的不可信行为选择,至少在博弈的某些子博弈中不符合博弈方的自身利益,因而不构成纳什均衡,因此要求在所有子博弈中都是纳什均衡的子博弈完美纳什均衡,就排除了其中存在不可信行为选择的可能性,从而在动态博弈分析中具有真正的稳定性。
★考核知识点:划线法;箭头法; 纳什均衡;一致预测性
附2.2.6:(考核知识点解释)
博弈方的最终目标都是实现自身的最大得益。在具有策略和利益相互依存性的博弈问题中,各个博弈方的得益既取决于自己选择的策略,还与其他博弈方选择的策略有关,因此博弈方在决策时必须考虑其他博弈方的存在和策略选择。根据这种思想,科学的决策思路应该是:先找出自己针对其他博弈方每种策略或策略组合(对多人博弈)的最佳对策,即自己的可选策略中与其他博弈方的策略或策略组合配合,给自己带来最大得益的策略(这种相对最佳对策总是存在的,不过不一定惟一),然后在此基础上,通过对其他博弈方策略选择的判断,包括对其他博弈方对自己策略判断的判断等,预测博弈的可能结果和确定自己的最优策略。
划线法是一种非常简便的博弈分析方法,由于它以策略之间的相对优劣关系为基础,因此在分析用得益矩阵表示的博弈问题时具有普遍适用性。
箭头法的基本思路是对博弈中的每个策略组合进行分析,考察在每个策略组合处各个博弈方能否通过单独改变自己的策略而增加得益。如能,则从所分析的策略组合对应的得益数组引一箭头,到改变策略后策略组合对应的得益数组。最后综合对每个策略组合的分析情况,形成对博弈结果的判断。
纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方的策略 ,都是对其余博弈方策略的组合 的最佳对策,也即
对任意 都成立,则称 为G的一个纳什均衡
“一致预测性”:如果所有博弈方都预测一个特定的博弈结果会出现,那么所有的博弈方都不会利用该预测或者这种预测能力,选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此这个预测结果最终真会成为博弈的结果。也就是说,这里“一致预测”中“一致”的意义是,各博弈方的实际行为选择与他们的预测一致,而不是不同博弈方的预测相同、无差异。
纳什均衡具有一致预测的性质,而且只有纳什均衡才有这种性质,任何非纳什均衡的预测都不是一致预测,因此一致预测正是纳什均衡的本质属性。