龙空技术网

秦九韶数学案——随机抽样统计推理的反问题 | 第四届数学文化征文

好玩的数学 86

前言:

当前你们对“反幻方算法”可能比较看重,同学们都想要剖析一些“反幻方算法”的相关文章。那么小编在网络上收集了一些有关“反幻方算法””的相关文章,希望我们能喜欢,我们快快来了解一下吧!

本文为“2022年第四届数学文化征文活动

秦九韶数学案——随机抽样统计推理的反问题

作者 : 李兴春

作品编号:084

南宋著名数学家秦九韶曾任县尉、通判、代理知州等官职,据说他在任上,利用数学知识智断了一起缴纳公粮的作弊案。

有一个纳粮户向公仓缴纳了1534石米,按规定应缴净米,但米内难免夹杂谷粒,就要数出米内夹杂的谷粒数,折成相应的净米补缴入仓。1534石米一粒一粒地数当然不可能,秦九韶利用简单的随机抽样方法,取米一捻作为样本,数了数共254粒,其中谷子28粒,28粒谷子在样本中所占比例为28/254,28/254约掉公因数等于14/127,由样本推断总体,谷子在1534石米的总体中所占的也应该是这个比例,于是用1534乘以14/127,得到约169石的谷数,根据法令折成相应的净米数补缴入仓。这个方法对于纳粮户来说是基本公正的,所有纳粮户也都按这个方法抽样统计谷数、米数。

但这一次,秦九韶统计完谷数、米数后,突然把脸一沉,对这个纳粮户说:“你的米不应该只有这么多谷子,是你看到公人偷懒,有时候取米样只取上层,你也偷奸耍滑,故意多加秕谷,还把秕谷倒入米堆下层。这样从上层取样计数得出的谷数,就会比你整堆米夹杂的谷数少。你偷加的秕谷至少也有50石,你全部谷数应该是220石上下。”

这个纳粮户见秦九韶连他偷加的谷数也说准了,知道再也瞒不下去,只好认错受罚,补足了净米数,从此也不敢再作弊了。

秦九韶是怎么识破这个纳粮户作弊呢?原来是这个纳粮户的一个佃户向他举报,佃户亲眼看到纳粮户故意将秕谷混入米堆,秕谷装满了50石的箩筐。但这个佃户素来和纳粮户有隙,他的举报是否属实呢?

秦九韶考虑到纳粮户偷加秕谷,只有在公人偷懒而使得取样没有代表性的情况下才可得益,否则他偷加的谷数仍然要被取样统计出来。于是他亲自在上下各层均匀取样,上层取样得到约169石的谷数,这应该是米内正常夹杂的谷数;下层取样得到约220石的谷数。多次抽样比较后都基本如此,秦九韶断定佃户的举报属实。因为如果下层这多出来的50石不是另加的,而是米堆里正常夹杂的,那么220石的谷数就应该基本均匀地分布于上下各层,不会出现这样泾渭分明的结果。

这个作弊案事实上是一个随机抽样统计推理的反问题。随机抽样统计推理从局部推断整体,而秦九韶因为佃户的举报,已经得知了总的米数和谷数,即1534石米的总体中有谷数220石,全部谷数在总体中所占的比例为220/1534。这样反过来从整体推断局部,全部谷数在总体中所占的比例220/1534也应该基本均匀地出现在样本中,但在米堆上层的样本中却是169/1534,显然就说明了有人为掺杂。

随机抽样统计推理的反问题依赖于随机抽样统计推理的正问题的有效性,即随机抽样统计推理真正做到了随机的抽样,抽取的样本有代表性,那么,从样本推断总体是有效的,反过来从总体推断样本也是有效的。样本是总体的一个自相似的“分形”,总体成比例缩小,应该就会与样本大致相合;样本成比例放大,差不多就应该放大成总体。简单的随机抽样统计推理其实蕴含着极深刻的分形思想。

随机抽样统计推理通常是从有限推断有限,即从有限的局部推断有限的整体,或从有限的整体推断有限的局部。还有从有限推断无限,即从有限的样本推断无限的总体,或从无限的总体推断有限的样本。也有从无限推断有限,即从无限的样本推断有限的总体,或从有限的总体推断无限的样本。这种情况需要有限的总体包含无限的样本,乍看之下似乎有悖常理,其实数学上的例子很多,较著名的有波兰裔美国数学家乌拉姆、匈牙利裔美国数学家冯·诺依曼等人发展起来的“蒙特卡罗模拟法”等。语言学上也有相似的例子:名词前缀的形容词越多,名词限定的范围越小。因此,单独“宇宙”这个词可能是无所不包的,如果前面加上许多形容词,如“可见的宇宙”“肉眼可见的宇宙”“近视的肉眼可见的宇宙”……宇宙所能限定的范围就会越来越窄,这个词的长度却可以越来越长。理论上,这个长度可以是无限长,但即使加了无限长形容词的宇宙也是属于单独一个词的宇宙之内。如果我们要统计词汇量来从样本推断总体,那么,只有两个字的宇宙是总体,有无限多词汇量的宇宙反而是只有两个字的宇宙的样本,也就是有限的总体包含了无限的样本。这个例子其实反映了逻辑概念内涵和外延的反比关系。

以蒙特卡罗模拟法来说,它的一个简明应用是可以估算不规则图形的面积,不规则图形的面积一般很难直接测量,但用有限推断有限或无限推断有限的随机抽样统计推理方法,就可大致不差地估算出其面积。在不规则图形外画一个正方形,将不规则图形全部包含在正方形中。现在我们随机地向正方形内标出一个个小点,这些小点称为随机点。最后计算落在正方形的全部随机点数和落在不规则图形内的随机点数,不规则图形内的随机点数所占正方形内的全部随机点数的比例,就可视同等于不规则图形面积在正方形面积内所占的比例;前者是样本,后者是总体。而正方形的面积很容易直接测量出来,这样通过不规则图形内的随机点数、正方形内的全部随机点数和正方形面积三个已知量,利用这个简单的等式就可求出不规则图形的面积。不规则图形内随机点数和正方形内全部随机点数越多,得到的不规则图形的面积就越精确。

根据著名的大数定律,当不规则图形内随机点数和正方形内全部随机点数趋向于无穷大时,它们的比率就趋向于真实的不规则图形面积和正方形图形面积的比率,也就是样本将会无穷无尽地成比例放大,而与总体完全重合。由于不规则图形面积和正方形图形面积都是有限量,它们的比率当然也是有限量,这样作为总体是有限的总体;而不规则图形内随机点数和正方形内全部随机点数趋向于无穷大,它们的比率也趋向于无穷大,这样作为样本是无限的样本,或者准确地说是“潜无限”的样本。从无限的样本推断有限的总体,我们得到的是最精确的结果。

另外还有一种随机抽样统计推理是从无限推断无限,即从无限的样本推断无限的总体,或从无限的总体推断无限的样本。这种情况多半是从离散的无限样本推断连续的无限总体,而且可视为是前面有限推断无限、无限推断有限甚至有限推断有限的一种极限推广形式,这里就无须专门加以讨论了。

现在我们考虑蒙特卡罗模拟法的反问题,已知不规则图形面积和正方形面积比率的总体,反过来求不规则图形内随机点数和正方形内全部随机点数比率的样本,显然也是不难求出的。这样做的用处是可以检验随机点的分布是否真正随机,比如我们可以把不规则图形在正方形内到处移动,如果移动到每一处计算出的不规则图形内随机点数都相差不大,那么我们就基本可以断定正方形内全部随机点是真正随机的。如果相差过大,就像秦九韶清点米堆上下层样本的谷数区别明显,那就说明随机点并不真正随机,我们就有理由怀疑不规则图形内随机点数和正方形内全部随机点数比率的样本,并不是有代表性的样本。这样,当我们又需要用蒙特卡罗模拟法求另一种未知的不规则图形的面积,我们就最好不要把这个新的不规则图形放在这个随机点不随机的正方形内,利用没有代表性的样本来求新的不规则图形面积和正方形面积比率的总体,那会使最终结果极不精确。

限制蒙特卡罗模拟法反问题以及所有随机抽样统计推理反问题应用的地方在于:总体容量大,样本容量小,通常容易计算样本而不容易计算总体,或者说,通常总体都是由样本累加得出的,既然总体都已经算出来了,样本更是已经算出在先了,还用得着再用总体来反推样本吗?就以蒙特卡罗模拟法求不规则图形面积来说,不规则图形内随机点数、正方形内全部随机点数和正方形面积三个量都是容易计算出来的,罕有这三个量是未知量而不规则图形面积是已知量的情况。

但应用受限并不等于完全没有应用,比如我们要算出两种溶液的混合均匀程度,两种溶液在没有混合之前的量是容易知道的,它们量的比率就是总体,而在混合后的溶液中任取一小部分,再把这部分中的两种溶液分离开,计算两种溶液量的比率,就是样本,如果这个比率与它们在没有混合之前的量的比率大致相同,就可断定是基本混合均匀的。从总体推断样本的随机抽样统计推理反问题就起到了作用。

再举一个例子:雨滴落下是断断续续的,通常我们要在物理上描述雨滴的运动,把它当成连续流体更方便,这样我们计算出一定时间内的雨量,这个雨量与这段时间的比率是总体,而在这个连续总体中离散的每一滴雨的雨量,我们并不清楚。这就需要从总体推断样本,在这总体的一定时间内截取一小段时间,如果这段时间短到只落下一滴雨,那么计算这一滴雨的雨量,它与这一小段时间的比率就是一个样本。如果这个样本比率基本等于总体比率,我们就从总体推断出了样本,也就是从大量作为连续流体的雨量推断出了离散的一滴雨的雨量。

在社会经济领域也应该有随机抽样统计推理反问题的许多用武之地,作为总体的社会经济统计数据,尽管基本都是从样本累加汇总得出,但由于信息的不对称,有时候公众只知道总体的社会经济统计数据而不会知道各个样本的数据,如果需要知道这些样本的数据,随机抽样统计推理反问题就可能派上用场了。

以往我们对随机抽样统计推理的正问题了解较多,对反问题关注较少。由于随机抽样统计推理反问题存在广阔的应用前景,将促使我们加强随机抽样统计推理反问题的研究。

已发文章>>

001 阅读《数学的故事》有感

002 我想和数学谈场恋爱

003 数学“化错”中的美

004 让数学思考成为数学课堂的主旋律

005 卢梭的“错”?

006 数学教学案例《找次品》

007 基于优化学生数学思维的高效课堂创建——以等腰三角形的判定一课为例

008 从特殊到一般,引导数学思维

009 数学文化融入家庭教育的研究

010 sin 震荡函数的图像分析

011 四阶幻方的“太极图”性质

012 无理数的定义和实数理论的建立

013 一个容易被忽视的问题——数学文化

014 “双减”背景下初中数学学科的合作学习方式探究

015 中学数学德育渗透的方法与路径

016 《数学的力量》读后感

017 基于数学文化的单元统整教学设计——以“圆的认识与面积”教学为例

018 有助于数的理解的数字圈环

019 以折叠为例,探究生长型数学教学模式

020 我从事数学科普写作的经验与启示

021 在阅读中滋长智慧——读《教育智慧从哪里来》有感

022 学习数学史 做数学的使者

023 开数学文化之窗 启数学文化魅力——阅读《美丽的数学》有感

024 “文学独白”——数学教学因你而精彩

025 如何用多面体三等分正方体

026 HPM视角下《圆的周长》教学设计

027 被误解的“勾股定理”

028 好玩的数学

029 帮小青蛙设计一个井

030 万物的基础——数学——读《从一到无穷大》有感

031 读《孙子算经》鸡兔同笼问题有感

032 HPM视角下高中数学多样化作业的设计

033 攀越高峰的领路人——数学文化

034 我的好兄弟:数学

035 细嗅数学文化之香

036 藤蔓的喜悦

037 物理力学中数学的影子

038 复数外传

039 函数的历史和发展

040 数学文化与我

041 数学之趣

042 探索数学知识背后的秘密

043 数学文化和我的数学学习

044 古代算数几何形体——阳马与鳖臑

045 数学文化与我的数学学习

046 我与数学文化

047 “形象”的数学

048 站在巨人的肩膀上学习数学

049 从数学文化和个人影响的角度剖析对数的历史

050 论数学文化

051 我与数学文化

052 正弦定理的源起与应用

053 数学文化融入初中数学教学的实践与思考

054 给数字爱好者的1个全新的0至9数字思考挑战及应用问题

055 并不需要的“承重墙”与数学课改中的问题 —— 兼与马立平博士商榷

056 奇妙的规律

057 生活中的“家常便饭”——数的表示方法

058 读《黄东坡智慧大讲堂——带你发现数学之美》有感

059 通识教育视角下初中数学思维培养从直观向抽象过渡的研究

060 读《古今数学思想》有感

061 为什么圆的面积的导数等于周长?球的的体积的导数等于其表面积?

062 《奇妙的数学文化》读后感

063 数学文化视角下《九宫图的奥秘》教学设计

064 关于毕达哥拉斯定理适用蒙特卡罗方法验证的探讨

065 遨游数学星空,体味数学奇妙

066 核心素养下的,数学文化中的美育渗透

067 探寻数学之奇,欣赏数学之美

068 框架思维——读《数学这样学就对了》有感

069 从肌肉记忆到《几何原本》第四公理

070 《数学大世界》读后感

071 除法才是四则运算的基础:兼与马立平博士商榷

072 从“海盗分金”到“囚徒困境”——博弈该如何进行?

073 “0”与“1”的辩证法和数学学习之路

074 感悟数学

075 我的好伙伴:数学

076 一则寓言故事带来的教学启发

077 神奇的数学 ——最大公因数、最小公倍数

078 怎样学好数学

079 “7”真是个神奇的数字

080 《一个定理的诞生:我与菲尔茨奖的一千个日夜》读后感

标签: #反幻方算法 #反幻方的解法