龙空技术网

《模型思维》之博弈论模型

飘皓宇 208

前言:

如今我们对“动态博弈求解”大致比较讲究,姐妹们都想要了解一些“动态博弈求解”的相关知识。那么小编也在网摘上汇集了一些对于“动态博弈求解””的相关资讯,希望大家能喜欢,小伙伴们一起来学习一下吧!

标准式博弈,博弈参与者在一组离散的行动(通常为两种)中做出选择;序贯博弈(sequentailgame),博弈参与者按顺序选择行动;连续行动博弈,博弈参与者可以选择任意尺度或效果的行动。

一、标准式零和博弈在这种博弈中,每个博弈参与者选择一个行动,并根据博弈参与者自己的行动和另一个博弈参与者的行动获得一定收益。此外,博弈参与者双方的收益总和为零。博弈的策略是如何进行博弈的规则,它可以是对单个动作的选择、在不同行动之间的随机化,也可以是一个行动序列。博弈的纳什均衡(Nash equilibrium)是指这样一种策略,它们能够使每个博弈参与者的策略在给定其他博弈参与者策略的情况下是最优的。

随机化策略的最优性,对策略互动环境中的行为有很大的意义。体育运动也是零和博弈:一方获胜,另一方就要落败。

二、最小化风险博弈(minimize risk game)在这个博弈中,每一个博弈参与者都可以选择采取冒险的行动或安全的行动,这是一个非对称的零和博弈。博弈参与者的收益不仅取决于自己的行动,还取决于哪一个博弈参与者采取了哪一个行动。

在这个博弈中,行博弈参与者有一个占优策略,即采取安全的行动。无论列博弈参与者选择哪一个种动作,对于行博弈参与者来说,选择安全的行动总是更好的。但是对于列博弈参与者来说,情况却并非如此。如果行博弈参与者选择冒风险,那么列博弈参与者也应该选择冒风险;如果行博弈参与者选择了安全的行动,那么列博弈参与者也应该选择安全的行动。

三、序贯博弈在序贯博弈中,博弈参与者按照某个特定的顺序采取行动。由此,可以用一棵博弈树(game tree)来表示一个序贯博弈。博弈树由节点和边组成,每个节点对应于博弈参与者必须采取行动的时刻,该节点的每条边分别表示可以采取的某个行动。

在序贯博弈中,策略对应于每个节点处的行动选择。假设现有企业在发现有新企业进入时决定发动商战。那么,如果拟进入者知道这一点,就不会选择进入,因为这种情况下进入会产生负收益。这个行动序列——拟进入者选择不进入、现有企业在拟进入者进入时就会发动商战,是一个纳什均衡。然而,这并不是唯一的纳什均衡,也不是最有可能出现的结果。拟进入者选择进入市场,现有企业决定接受(不发动商战),这是第二个均衡。那么,应该如何在这两个均衡之间做出选择呢?我们可以利用细化准则。在序贯博弈中,一种常见的细化准则是选择子博弈完美均衡。用逆向归纳法(backward induction)来求解子博弈均衡:从最末端的节点开始,并在每个节点处选择最优行动。然后沿着博弈树逆向倒推,假设每个博弈参与者会在给定另一个博弈参与者在后续节点上的行动时选择最优行动。

四、连续行动博弈在连续行动博弈中,行动对应于努力水平。通过选择更大的努力,博弈参与者能够增大自己赢得奖励的概率。这个博弈还允许考虑任意大数量的博弈参与者。

均衡努力水平的表达式揭示了很多重要的含义,正如我们所预料的那样,个人的努力水平会随着奖金的增多而增大。同样,在均衡状态下,总努力水平将会小于奖金的价值。在假设博弈参与者会进行最优化的情况下也会得到这些结果。博弈参与者应该付出一定努力以赢得奖励,但是不应该付出不合理的努力水平。

标签: #动态博弈求解