龙空技术网

用来预测奥运会奖牌数量的数学公式

遇见数学 1219

前言:

今天同学们对“c语言计算奥运会比赛某个参赛选手的得分”大体比较注意,各位老铁们都需要知道一些“c语言计算奥运会比赛某个参赛选手的得分”的相关资讯。那么小编同时在网络上网罗了一些对于“c语言计算奥运会比赛某个参赛选手的得分””的相关文章,希望同学们能喜欢,同学们一起来了解一下吧!

英文: plus.maths.org/content/harder-better-faster-stronger, 翻译: 赵小翼 校对: Ada

每届奥运会后,人们都在猜测哪个国家表现得最好。当拥有庞大人口的中国,和同时拥有高GDP和高人口数的美国在奖牌榜上名列前茅时,我们真的应该感到惊讶吗?我们能否看看奖牌榜,看看那些国家的表现确实好于预期。

2000年悉尼奥运会和2004年雅典奥运会,奖牌总数前五名的国家是一样的:

总的来说,每届奥运会上排名靠前的国家相同,但如果快速浏览一下奖牌榜,就可以发现两个明显发挥重要作用的变量:人口数和国内生产总值(GDP)。高人口可以让国家有更多的运动员供选拔;GDP可以被认为代表一个国家的经济状况,一个经济繁荣的国家更有可能把钱花在诸如体育等非生存必需的活动上。以人口为单位作调整后,我们发现排名前5位的国家,除了澳大利亚,其它都发生了变化,澳大利亚的金牌数在以人口数为单位的计算方式下,依旧表现优异。

印度人口众多,但2004年表现不佳,每十亿人才有一枚奖牌。然而我们可以预期,随着GDP的上升,未来印度将出现在奖牌榜的前列。若以GDP为考量单位,我们将产生新的前5名,这次澳大利亚从名单中消失,但古巴、牙买加和巴哈马依旧表现良好。

有没有方法可以预测一个国家在奥运会上赢得的奖牌数量?或者,我们可否至少设定一个基准线来判定一个国家在奥运会上的成功与否?让我们来看看2004年奖牌数量和国家人口数、GDP的曲线关系图,我们很容易就能发现,用线性模型来拟合这些点是比较困难的,也就是说,这些数据点并不是在某条直线附近聚集。

奖牌数与人口数的关系

奖牌数与GDP的关系

GDP和人口数量的极值表明我们应该使用对数。在对数坐标系中,纵坐标进行相应的变换,在新的坐标系下,原坐标系中的1-10之间的间隔,和10-100、100-1000等的间隔相同。这样的变换具有现实意义——人口众多的国家和人口较少的国家能够派出参加奥运会的运动员人数是相同的,同时,人口众多提供了一个选拨优秀运动员的好基础,但随着人口增长,这种效应将会减弱。

至于GDP,各国偶尔会出现天赋超群的运动员,对手接受再高花销的训练,也无法打败他们。梅西大学商业系Simon Geoffrey,Martina Kerim,Peren Arinb,Nitha Palakshappac和Sylvie Chettyd的报告 Do elite sports systems mean more Olympic medals? 中的调查结果支持这一观点,报告作者提出“获得金牌所需的非凡才能是无法被精英体育训练系统所替代和超越的。”以2004年获得15枚以上奖牌的国家为例,奖牌数量的对数与人口数量的对数和GDP的对数之间呈线性关系。使用线性回归——一种通过最小化数据点和拟合曲线之间的距离来拟合出一条直线的分析形式——我们可以找到一条拟合良好的直线。我们发现这个拟合的R²值(R²是相关性的统计量度,值在0和1之间)高于0.5,虽然这不足以证明相关性,但或许我们可以做些什么:

奖牌数的对数与人口数的对数之间的关系

奖牌数的对数与GDP的对数之间的关系

使用GDP对数和人口数对数的线性组合,我们可以得出一条拟合直线:

Ln(GDP)和 Ln(人口数)的线性组合与 Ln(奖牌数)之间的关系

我们可以看到古巴,澳大利亚和俄罗斯都位于最佳拟合曲线的上方区域,因此与其他获得了超过15枚奖牌的国家相比,它们的表现良好。这可以用古巴著名的拳击传统以及澳大利亚和俄罗斯在体育方面的资金投入来解释。备受指责的英国奥运队的表现并不像评论中说的那么糟糕

这种拟合模型的危险在于你可以在事件发生后拟合任意两个事物之间的关系——真正的挑战是提出一个有价值的代表模型,不仅可以让奥运代表队知道他们现在的表现如何,还可以预测他们将来的表现。

在论文 Who wins the Olympic games: Economic development and medal totals 中,国家经济研究局的Andrew B. Bernard和Meghan R. Busse提出了一个模型,其中考虑了人口,GDP,该国是否为奥运会东道国,以及该国是否曾为苏联或东欧集团的一部分。他们发现东道国在本国获得的奖牌数量比在其他国家多1.8%,同样地,他们发现前苏联或东欧集团国家(强制向体育输送资源),以及实行计划经济的国家,获得的奖牌数比同等条件的西方国家多3%以上。模型公式如下:

其中M是一个国家的奖牌数,N是人口数,Y是GDP,C,α以及β是常数;Host, Soviet和Planned是等于零或其它值的常量,其值取决于该国是否为东道主,是否为苏联阵营的一部分,或者是否实行计划经济。

在他们更成熟的模型中,作者把各国在之前奥林匹比赛中的表现也作为考虑因素,也许是为了考虑参加多次比赛的运动员所获得的经验。他们的总体结论是,尽管GDP是预测奖牌数据的最佳单一变量,但是否作为东道主等其他因素也需要考虑在内。他们的模型预测澳大利亚在参加自己举办的悉尼奥运会时,将比参加其它国家主办的奥运会时多获得17枚奖牌——澳大利亚在悉尼奥运会上实际多获得了18枚奖牌,该模型预测值仅比实际值少一枚。

考虑到这一点,此次中国作为东道主(2008年),并且将大量资金投入到奥林匹克运动中,易知它会在奖牌总数上名列前茅。

数据来源: 本文使用世界银行和国际奥委会的数据做分析。由于事后查出兴奋剂等因素,奖牌表可能会改变,但在撰写本文时数据是准确的。

标签: #c语言计算奥运会比赛某个参赛选手的得分