龙空技术网

「如虚如实说」| 你能确定吗?均值、方差、敏感度与特异度

杜如虚院士 254

前言:

今天兄弟们对“均值方差边界”大约比较注意,朋友们都想要学习一些“均值方差边界”的相关文章。那么小编同时在网上汇集了一些对于“均值方差边界””的相关知识,希望同学们能喜欢,姐妹们快快来了解一下吧!

原作始发于 广东科学中心 官方微信公众号

《指南针与均值》(广东科学中心「院士说」| 指南针与平均值)一文介绍了均值。不过均值只描述了数组的平均趋向,不能说明数组的差异。

例如:

数组“1,2,3”的均值是:

数组“0,1,5”的均值也是:

我们怎样区别出这些数组的差异呢?这就需要方差了。

方差这一术语最早是由罗纳德·费雪(Ronald Fisher,1890—1962)提出的。费雪出生于英国伦敦一个富商家庭。他是家中的幼子,小时候最受父母和哥哥姐姐们的宠爱。然而在他14岁的时候母亲突然病故,接着父亲的生意失败,全家不得不从伦敦最好的区域搬到了最差的区域。他顶着这些突如其来的压力,在哈罗公学(Harrow School)赢得了他的第一个奖学金。费雪视力很差,不能在电灯下久读。因此他常常闭着眼睛用心算来解决他最喜欢的数学问题。1909年,费雪考入剑桥大学并获得奖学金。

图1, 年轻时的罗纳德·费雪

1918年,他在自己的一篇论文中第一次提出了方差(variance)的概念。他说在分析变异时既要考虑均值的差别,也要考虑均值偏差的平方值,这就是方差。

假定两个数组的差值为:

那么均值是:

方差是:

这里“n-1”称为自由度(degree-of-freedom)。因为在计算均值χ时,所有的数据都已经被使用了一次了,在计算方差时再使用这些数据,只有n-1个数据是独立的。因此自由度是n-1。否则计算就会有误差。在上面的例子中,数组“1,2,3”的方差是1;数组“0,1,5”的方差是7。

在数据分析时,方差非常重要。在上面的例子中,两组数据的均值都是2,但方差不同(图2)。方差大,结果可信度就低。

图2,方差小(黄色曲线)与方差大(蓝色曲线)的区别

1919年,费雪在英国古老的洛桑农业实验站(Rothamsted Agricultural Experiment Station)找到一份稳定的工作。一天,费雪有礼貌地为他女同事穆里尔(Muriel Bristol)冲了一杯奶茶。穆里尔摇摇头说不喝。费雪觉得奇怪就追问为什么。穆里尔说她只喝先冲好茶再放牛奶的奶茶,而费雪先放了牛奶再加茶,顺序错了,味道不好。费雪认为牛奶先放后放,搅拌一下就是一样的了,没有区别。穆里尔坚持说她能分辨出来。这时,穆里尔的男友来了,他建议做个实验。于是,费雪冲了8杯奶茶,4杯先冲茶再放牛奶,4杯先放牛奶再冲茶。他把这8杯奶茶随机地给穆里尔品尝,穆里尔正确地分辨了所有的奶茶。费雪嘟囔着说这是不可能的,但也只好认输。

今天我们知道,牛奶中的蛋白和脂肪是憎水的,在热水的作用下会蜷曲起来生成小滴。但其中的乳清蛋白会在71℃左右分解,改变性质,发出焦糖的味道。当牛奶被倒进滚烫的热茶里时,飞溅而下的牛奶会快速分裂和分离,并浸润在热茶之中,进而导致大量的乳清蛋白分解。相比之下,将热茶倒进牛奶中,牛奶的表面会阻止了牛奶的分裂,从而最大限度地减少乳清蛋白的分解,因此也就没有了焦糖的味道。

费雪回去后做了一个估算,要凭运气准确地分辨出8杯奶茶的概率只有70分之一(你可以推算出来吗?)。所以穆里尔应该是能辨别出奶茶的味道。接着,他又计算出要凭运气在8杯奶茶中正确地分辨出6杯奶茶的概率是四分之一。不过此时辨别能力的置信度(confidence level)也打了折扣。费雪还想到了许多其他情况,如数据太少、品尝奶茶的顺序等等。

在过后的几个月里,他做了大量的奶茶实验和计算,并取得了突破性的成果。1921年,他提出了可能性(Likelihood)的概念。接着,他写了两本书:《研究人员的统计学方法》(Statistical Methods for Research Workers)和《实验设计》(The Design of Experiments)。在《研究人员的统计学方法》一书中,费雪定义了统计学的三个目标:

确定数据的采样空间(population);确定数据的分布(distribution)。决定估计值(如均值、方差等统计值);

书中还定义了一个以他的姓氏的第一个字母命名的概率分布F-分布。今天,这个分布是统计学中最常用的分布之一。

《实验设计》一开始就讲述了奶茶实验。接着讲述了好几种实验设计的方法。其中一个是用一个二值的指标X = {0,1}来预测一个二值的结果Y = {0,1}时会发生四种情况:

X = 0, Y = 0 (结果为阴性,预测也为阴性,真阴性,预测准确);X = 0,Y = 1 (结果为阳性,预测为阴性,假阴性,预测错误);X = 1,Y = 0 (结果为阴性,预测为阳性,假阳性,预测错误);X = 1,Y = 1 (结果为阳性,预测为阳性,真阳性,预测准确)。

假定这四种情况的概率如下表

那么预测的精度就是:

预测的敏感度是:

预测的特异度是:

这三个指标都十分重要的,敏感度描述找出真阳性的概率,特异度描述找出真阴性的概率,缺一不可。例如,用发烧(X)来预测Covid-19病毒感染(Y), 被病毒感染的未必发烧(FN),所以敏感度会不好。另一方面发烧的未必是由于病毒感染(FP),所以特异度也不好。

1933年,费雪回到剑桥大学,接替著名的统计学家卡尔·皮尔森(Karl Pearson,1857—1936)任讲座教授。皮尔森发明了相关系数(correlation coefficient)。他还在伦敦大学建立了世界上第一个统计学系,堪称统计学之父。但他曾经撰文批评过年轻的费雪。费雪一直耿耿于怀。费雪在剑桥大学的时候,卡尔·皮尔森的儿子埃贡·皮尔森(Egon Pearson,1895—1980)也在剑桥大学任讲座教授。埃贡·皮尔森发明了假设检验(Hypothesis Testing)的方法,是著名的统计学家。费雪和他的关系也不好。

1957年费雪从剑桥大学退休。1959年闲不下来的他去了澳大利亚工作。1962年在那里去世。他是研究统计学的,知道吸烟与癌症的关系。但却一直酷爱抽他的烟斗,最后死于癌症。

图3 晚年的罗纳德·费雪

1959年,费雪的二女儿与埃贡·皮尔森的博士研究生乔治·巴斯(George Box,1919—2013)结婚。1960年,他们搬到了美国。巴斯在威斯康辛麦迪逊大学任教,是著名的统计学家。

我的恩师吴贤铭教授(Shien-Ming Wu,1924—1992)师从巴斯。所以,费雪和皮尔森都是我的曾祖师。

撰文:杜如虚

排版&编辑 | Mosh魔时

标签: #均值方差边界