龙空技术网

CCER夏季论坛演讲精要 | 北川透:能源配置中的家长式分配与自选

北大国发院 206

前言:

目前你们对“启发式算法和组合最优化的区别”都比较关切,咱们都想要学习一些“启发式算法和组合最优化的区别”的相关资讯。那么小编也在网上汇集了一些关于“启发式算法和组合最优化的区别””的相关内容,希望兄弟们能喜欢,咱们快快来学习一下吧!

题记:2023年6月10日,由北京大学中国经济研究中心(CCER)、北京大学国家发展研究院主办的第七届CCER夏季国际研讨会在太舞滑雪小镇进行。布朗大学教授北川透(Toru Kitagawa)应邀出席并做主题演讲。本文根据演讲内容整理。

很高兴参加这次会议。今天展示的这篇论文体现了应用和计量经济学家之间的良好互动和合作。我和坂口正生、木户大道都是计量经济学家。然后井田刚典、石原孝典、伊藤浩一郎、佐佐木修作是应用经济学家和实验经济学家。这就是计量经济学家和应用经济学家如何合作,共同研究对我们社会非常重要的事情。

概述:两种分配方式的利弊

文章的出发点是,近年来因果推断在微观研究中逐渐成为一个主导问题,但我们对政策评估从未真正进行因果推断。这是因为异质性的存在导致因果效应因人而异。

为什么我们关心异质性?为什么了解异质性很重要?原因在于如果政策成本高昂,那么通过利用异质性增加个性化政策,我们更好地实现政策目标——我们想要为受益最多的人提供政策,而不想给那些基本上政策无效的人提供政策。从异质性来看,我们想知道谁受益最多,谁受益最少。

因此基本的出发点就是以适当的方式分配政策来处理。在资源有限的情况下,最大化政策影响更为重要。这里的有限资源意味着预算可能有限或者能力可能有限。因此,靶向政策实际上是最近应用微观研究中的关键概念,而本文就是关于靶向的。这里有几个例子。在我与捷捷诺夫的论文中,我们研究了如何为异质性个体分配工作培训计划。芬克尔斯坦和诺托维迪多研究了补充营养援助计划。此外,如何分配伤残计划、能效计划、如何分配行为微调、如何为个人单独定价,这些都是很有趣也很重要的问题。

本文试图解决的主要问题很重要。一般来说,政策目标有两种受众,即是否被提供政策。计划者是应当以家长式的方式分配政策,或者提供一个机会,每个人都选择自己喜欢的?哪一个方式更好?有人认为计划者分配政策更好,因为计划者根据个人的可观测特征X分配政策。如果计划者最为了解每个个体,那么就应该家长式地分配政策。而经济学中更为传统的建议是提供选择,希望个人选择他们喜欢的政策,我们称之为自选。这种方法的直觉在于计划者只能观察到可观察的X。但是每个个体知道他们的不可观察的其他特征。并且基于这些不可观察的因素,也许他们可以选择比计划者更好的政策选项。此时我们最好提供选项,然后让个人选择他们的选项。计划者可以利用这种自选来提高福利。

这篇论文不在于判断上述两种方法哪种更好,而是在这两种方法之间寻得了一个平衡。问题的关键是谁具有选择政策的权利:个体,还是计划者。例如针对失业工人的就业培训计划,失业工人是否希望参与职业培训计划本身未知。我们希望将此计划分配给受益最大的人。计划者应该根据可观察的教育或者收入进行分配,抑或是让失业者选择他们喜欢的政策状态?失业者具有影响政策效果的未知特征,帮助他们理性地选择他们偏好的政策,通过最大化他们的效用函数,提高社会福利。理论上第二种方案更好,但前提是个人进行理性的选择。

上述讨论在我非常喜欢的曼斯基的书中有所表述。他说:“人们应该对‘个人比计划者更了解情况,因此可以做出更好的决策’这一断言持怀疑态度。”如果你从事微观理论研究,站在微观理论的角度来看,个人选择总是更优。但在实践中情况并非总是如此。曼斯基还表示:“当然,对这种说法的怀疑并不意味着社会计划比自由放任更有效。哪一种方式更优取决于选择问题的细节。”因此,根据政策不同,判断也会有不同。

因此,我们希望通过考虑以谁应该选择为目标来利用这两种方法的优势,即选择谁来选择。这里的方法是我们设计随机对照试验(RCT),并应用我在2018年与捷捷诺夫一起开发的实证的福利最大化方法(EWM)来估计政策效果,选择谁来选择。

让我快速解释一下RCT。我们将实验者随机分配为3类。第一类为“处理”,T,第二为“控制”,U,这是传统意义上的处理组和控制组。不同于传统RCT的是第三类随机分配的对象:“选择”,S。

通过RCT的数据,我们了解到福利贡献如何取决于个人的异质性特征X。在本文情境下具体而言,对于每一个特征X,我们可以计算在电力回扣计划下,基于电力消耗减少的福利贡献是多少。从RCT数据中,我们可以得到上述信息,然后设计一个策略,这个策略根据个人的特点分配最好的政策状态。T和U是家长式分配:计划者提供政策之后,个人必须接受政策干预;S是自由选择,在这种情况下,计划者将政策的选择权委托给个人,个人自选自己喜欢的政策状态。

家长式分配和自选的结合十分有效。实证结果表明,计划者根据个体的X分配T、U、S相比于仅分配T或U,或者仅分配S,福利收益在统计意义和经济意义上都有显著提高。这是我们基于电力节约项目的背景下得出的主要结论。

让我陈述一下这篇论文有什么样的贡献。

第一,我们提出了如何了解选择驱动目标的抽样设计。选择驱动目标意味着我们要根据个人的特征X分配3个政策状态。

第二,我们使用EWM估计了最佳的选择驱动目标的政策。

第三,我们在文中将这个估计应用到日本的节能回扣计划。

第四,我们表明,相比起家长制或者自主选择,“选择谁选择”都显著改善了社会福利。

框架:社会福利最大化的政策设计

以上是我们论文的基本概述,现在让我进入框架,介绍关于实验和政策估计的一些细节。

让我首先介绍一些符号。定义一个人的净社会福利收益为W,W可能与效用函数有关,也可能与收入等有关。本文中W指代电力能源的节省带来的福利改善。政策干预本身存在成本,例如金钱或者时间成本。W是政策的潜在结果变量,T、U和S对应的潜在结果变量分别为W(T)、W(U)和W(S)。假定我们观察到了个人的X,那么从计划者的角度来看,最优的政策处理方式是什么?计划者应该分配个人到哪一类?如果给定特征X,S对应的福利的条件期望大于其他两种政策状态,那么S最优,此时个人选择比家长式分配更好;同理,也会存在T最优或者U最优的情况。哪种情况成立是一个经验问题。这是基于总体特征的一个比较,我们希望从数据中了解个体特征X,选择每个人的最优政策状态。

具体而言,我们想要指导这些条件期望的排序,以分配每个人的政策状态。换句话说,我们要做的是划分可观察特征构成的空间。

想象一个可观察特征向量构成的空间,每个人都有自己的可观察特征向量,计划者要做的是把这个房间分成3个区域:区域GT包含那些接受政策处理的人。区域GU包含那些不接受政策处理的人,然后区域GS包含那些自我选择是否接受政策处理的人。因此我们应该将空间划分为3个区域。例如,假设可观察特征的空间是二维的,政策是之前提及的工作培训计划,X1是教育,X2是以前的收入。在这里,政策是接受工作培训计划,上图把这个空间分成了3个区域。拿GT区域来说,GT区域表示计划者直接干预并分配政策给个体;GU区域表示计划者直接干预然后使得个体不参与培训计划。GS则包含了那些计划者将选择权委托给个人的人,这些人自行选择是否接受工作培训。

让我们为这个例子进行具体分析。以前的收入高、受教育程度高的个体,也许他们能更好地了解他们自己的状态,此时,他们也许能够根据自己的不可观察因素来选择更好的政策状态,即是否参与工作培训计划。在这种情况下,让个体自己选择比较好。GT对应规划者想要干预并分配政策的区域。直觉是如果让个体选择自己的政策,他们可能会选择置身事外或者选择次优的政策状态。在这种情况下计划者需要家长式地分配T,对于GU地区的情况也是如此。

接下来是对于政策效果的估计,即总体的平均福利贡献。

在下面的公式中,G是政策实施状态,W是福利,从而社会福利W是分配策略G的函数。分配策略G取决于个体特征X。属于集合Gj,j为T或U或S。根据上面对于“划分”的定义,我们可以根据X来判断对应主体属于哪个分区,基于此分配不同的政策状态,进而得到相应的潜在结果。计划者希望最大化W的期望,作为社会福利的评判标准。在所有政策中,Gstar是最大化社会福利标准的政策。而我们已经有了RCT的数据,因此可以使用这个个体受到随机分配的已观测数据。通过比较不同政策下的社会福利贡献,得到上述Gstar。

我们使用EWM来构建评估社会福利标准的估计。基于RCT数据,我们构建的估计是无偏的,这通过估计对样本使用潜在产出结果的倾向得分作为权重,对潜在产出结果加权平均得到。倾向得分由实验涉及决定,因而已知,示性函数由实验具体如何随机分配决定,因而也已知而且随机。由此我们可以证明W hat(G)是对总体福利贡献的无偏估计。EWM的基本想法就是基于上面的条件来估计人口福利,并得到最优政策。

EWM的使用要求我们是首先明确有多少可行的划分,然后通过最大化W hat来估计最优的G。在我和捷捷诺夫的论文中,我们表明这种方法具有良好的统计特性。我们定义福利遗憾(welfare regret)是可行政策集合引致的社会福利的上确界和EWM得到的政策对应的社会福利的差值。如果我们将数据视为随机变量,则福利遗憾有一个分布,这个分布的均值会收敛到0,而且收敛速度是一大类潜在结果估计对应的分布中最快的收敛速度。这是我们的方法的非常优良的性质。

EWM也有挑战:计算。我们需要通过划分来最大化这个函数,而在集合上优化总是困难的。在实证应用中我们使用决策树算法的树分类来估计最优划分。感谢 Zhou、Athey 和 Wager(2018)提供了一个可用的R包。我们使用他们的R包,定义决策树的深度为6,循环搜索得到划分。让我们进行一些启发式讨论。回到之前定义的可观察特征的空间。我们有2个X,X1和X2。此时决策树试图将X的空间按垂直或水平进行划分。

上图是一个深度为2的策略树。深度为2表示有一系列“是”或“否”问题,并且问题数量为2。第一个深度问题是X1是否大于等于a1。根据第一个问题的答案,第二个问题会有所不同。如果第一个问题的答案是肯定的,该分支询问X2是否大于等于a2;如果否定,那么问X1是否大于等于a3。最后产生的划分称为叶。因此,这种创建了4个不同的划分,在每个划分中,我们分配不同的政策状态,T或U或T或S以最大化社会福利。实际操作中,我们在深度为6的情形中运行这个算法,这意味着我们有6个“是”或“否”问题的序列。随着深度数从2增加到6,我们的划分也会增加。

实验:给家庭节约用电奖励的实验效果

让我们看看实验。这个实验中,我们与日本环境部合作。日本以核电为主要发电方式。这意味着当电力需求很高时,我们不得不使用燃料等低效方式进行发电。如何控制电力需求是一个非常重要的公共政策问题。经济学家建议介入电力市场或者调整价格。通过这种方式,我们希望控制电力需求。电力需求因家户而异。家户对价格的反应非常不同,需求弹性差别很大。因此,驱动可以非常有效。

让我介绍一下实验的背景。在这里,我们要做的是通过给予回扣来控制电力需求。这意味着我们给这些家庭一笔现金,现金数额是根据这个家庭节省多少用电量来计算的。节省量用和基准消耗量的相对差别来衡量。我们定义电力消耗高峰时间是夏季的下午1点到下午5点,因为每个人都想使用空调,此时电力市场会供不应求。我们想要控制这种电力需求,并将这种基准消耗量定义为实验前一个月同一小时内的平均每小时电力使用量。实验发生在8月,因此在7月底,我们测量了每个家户的基准消费。然后相对于这个基准我们计算家庭节电,进而家户得到现金返还。回扣额度是1美元每千瓦时。此外,实行这个政策实验本身也存在成本,大概是291日元。

在下面的公式中,我们进一步定义这里的福利收益。

首先是无谓损失的减少,它来自供需三角。这是价格和边际成本差对应的楔形。此外还有一个delta,表示成本的长期降低,例如节省的电力长期来看可以用于工业生产。等式后半部分是实验成本。等式衡量了个人在不同政策组(T或U或S)的福利贡献。

我们进行了实验,实验样本数量大约是4000,然后我们进行了随机化处理。我们有3个类别。T和U的数量大致相同,S的数量大约是800。对于那些在S中的人,,选择接受政策的比例大约是40%。这里我进一步展示实验对于特征X的平衡检查,包括电力的高峰时段用量、高峰前用量和高峰后用量、在家人数、节能自我认知(我们询问他们对电力需求的关注程度),家庭收入等。我们还有其他家庭特征,例如年龄。这些特征对于预测需求响应非常重要。

可以看出实验中不同组别的X有很好的平衡。

政策设计前,我们首先来估算ITT,即相对于控制组U,处理组T和自选组S的因果效应是多少。因变量是高峰时期相对于高峰前/后时期使用量变化的对数值,结果显示处理效应是10%或5%的减少,取决于是T还是S。较高的处理效应说明住户有减少自己用电的空间。他们可能不会在高峰时段花费昂贵的电费,而是在高峰时段之前或之后增加自己的需求。这在直觉上反映了政策的有效性。

最优政策设计

现在让我们来利用EWM来估计政策效果。在这张表中,前三行是未处理/处理/自选的百分率,最下面两行对应驱动。当我们说“选择缺失驱动”时,它只是家长式分配T或者U。我们运行EWM来估计最佳的分配策略。在这里,分配是一半对一半。每户人每周的福利收益大约388日元。现在让我们看看选择驱动的目标。此时我们有三个政策,相比“选择缺失驱动”,个人可以得到自我选择的政策状况有大约553日元的福利收益。

在本文中,我们进一步对此进行了福利收益比较的假设检验,选择驱动目标与选择缺失驱动的福利收益差异约为166日元,且差异显著为正。

另一个有趣的分析是什么带来了福利收益。我们的故事是,对于那些根据不可观察的因素自行选择更好政策状况的家庭,他们的表现应该比计划者更好。此时计划者应该将选择权委托给家庭。对于那些可能做出错误决定而损害社会福利的家庭,计划者应当干预,分配T或U。我们可以从数据中验证这一想法吗?通过估计不同的LATE(局部平均处理效应),我们做到这一点。

让我解释一下这个等式,我们必须假设“谁选择”的排他性限制。

我们考察一个个体,如果被分配到S,他会选择接受政策(takers)还是不接受政策(non-takers)。并且如果个体自选T,那么他们自己的福利是W(T)。这意味着“谁选择”不会对结果产生因果影响。我们假设这个排除限制成立,然后我们就可以识别这个taker的LATE。takers的LATE被定义为,条件于如果这个人可以选择治疗而且选择T,那么选择T和U之间的期望差值。non-takers的LATE定义同理。我们使用一些工具变量的两阶段最小二乘方法来估计那些LATE。此外,我们还添加了家户的可观测特征X为条件。通过X可以知道家户属于EWM估计的哪个划分。

这张表解上面的重要故事。根据EWM推荐的政策条件,我们可以查看LATE for takers。首先,让我们将推荐的政策设置为U,这意味着EWM推荐个人不接受政策。如果这些人被分配到S,带来的福利影响基本上是负面的。如果他们选择U,效果将变为零。因此计划者应当干预并且给予U。类似的故事,我们从第2列的T可以看出,如果给这些人提供自选选项,那些选择U的人实际上可以在接受政策的情况下为社会福利收益做出很大贡献。在那种情况下,计划者应当干预并分配T。这个表格告诉了我们为什么家长式和自选的混合能够提高社会福利。

尽管这种政策可以有效地控制电力需求,根据每个家庭的储蓄额给予回扣,但公众有一个很大的顾虑:谁能真正省电呢?那些已经花费很多的家庭,他们有很好的空间来减少电力。谁会在电费上花很多钱?是富裕的家庭,所以这种政策给富裕家庭的钱比贫困家庭多。这是公众对这项政策的批评。所以在此基础上,我们将福利标准从均等形式改为以收入为权重的加权平均社会福利函数。我们采用了Saez(2003)提出的福利函数,该函数根据收入水平对家庭重新加权,贫困家庭的权重大于富裕家庭。

然后我们重新估计政策,我们表明,如果有足够的权重,平均而言,家庭可以获得的回扣会有所均衡。通过这种方式,我们试图回应公众的忧虑。

总结

请让我最后总结一下我们的贡献。

第一,我们基于EWM的估计方法提出了抽样设计以及福利评估,从而利用了家长式分配和自选的优势。

第二,我们运用了上述设计,在日本实施能源回扣计划,表明通过混合家长式分配和自选可以获得显著的福利收益。

第三,在因果推理中,存在自我选择的观察数据不是被认为是有用的。如果你进行因果推理研究,自我选择是不好的,因为你无法识别因果效应,因为选择偏差会扭曲估计。从政策设计的角度来看,有关于自我选择的信息并不是一件坏事,通过结合自我选择组别和RCT中的处理与控制组别,我们可以更好地设计公共政策。

标签: #启发式算法和组合最优化的区别