龙空技术网

什么是贝叶斯定理?数学公式,思维方式,赌局利器,生活信条...

超级预测 796

前言:

当前我们对“贝叶斯算法的优点是什么”可能比较重视,朋友们都想要知道一些“贝叶斯算法的优点是什么”的相关知识。那么小编同时在网摘上网罗了一些对于“贝叶斯算法的优点是什么””的相关内容,希望大家能喜欢,你们快快来学习一下吧!

首发于微信:超级预测

导语:贝叶斯是一个人的名字,贝叶斯定理反映了一种考虑问题的思维方式。

一般人的思维是先找到原因,再分析结果;贝叶斯则相反,就是也不知道期间发生了什么,只看到了结果,但可以通过结果来分析各种原因的可能性。

贝叶斯定理的数学方程长这样:

本文内容部分来自 farnamstreet 等网站相关文章;云猜平台翻译整理如下,转载请联系

如何用概率来思考问题?在生活中,或赌局上,根据所掌握的所有信息,用概率与绝对值来思考问题是很有用的。你可以借此改进先前的决定,并得到更好的结果。与此同时,概率思维也会督促你经常思考,我对这个预测有多自信?什么样的信息会影响这种信心?

贝叶斯定理

贝叶斯定理涉及到一些复杂的数学问题,但它的核心非常简单:概率估计应该从我们已知的世界开始,然后随着新信息的出现逐步更新。贝叶斯定理是一种将概率思维融入我们生活的简便方法。利用已有的知识去评估事物发生的概率就是贝叶斯式的思考方式。托马斯·贝叶斯(Thomas Bayes)是18世纪的一位英国牧师,他最有名的作品《一篇旨在解决机会主义问题的论文》(a Essay toward Solving a Problem in the Doctrine of Chances) 是在他去世两年后,由他的朋友理查德·普莱斯(Richard Price)在1763年交给了英国皇家学会。

这篇文章并没有包含这个定理,而是种下了这个想法的种子。了解概率计算的确切数学方法并不是理解贝叶斯定理的关键。贝叶斯关注的是,对真实性以及准确性的概率分配,更重要的是,当我们遇到影响情况的新数据时,我们应该如何调整对概率的估计。后来,法国学者皮埃尔-西蒙·拉普拉斯(Pierre-Simon Laplace)等人将这一理论发展成为一种有用的思考和计算工具。

托马斯·贝叶斯

举个例子:

我们想要做一个预测。预测北京市冬天,某一天下雪,那么当天堵车的概率是多少?

这里A代表堵车,B代表下雪

假设北京冬天堵车的概率是 80%(P(A) = 0.8)

假设北京冬天下雪的概率是 10%(P(B) = 0.1)

如果某一天堵车,下雪的概率是 10%, P(B|A) = 0.1

根据公式和已知概率,我们可以得到P(A|B)

0.1*0.8/0.1=0.8

也就是说如果北京冬天某一天下雪,那么有80%的可能性,当天会堵车。

这个非常简单的推导过程就可以被称为贝叶斯式的分析。贝叶斯定理在现实生活中的有什么应用呢?最常见的是分类问题,比如判断一封邮件是不是垃圾邮件。如果邮件中出现了“汇款”这个词,它是垃圾邮件的可能性是多大?可以认为,邮件中的每一个词都是特征之一。或者是给新闻分类,比如一篇文章中,如果出现了C罗这个词,那么这篇文章是体育类文章还是科技类文章呢?每条新信息都会影响原始概率,这就是贝叶斯定理的关键之处。

回到那条公式。我们把P(A)称为“先验概率”(Prior probability),即在B事件发生之前,我们对A事件概率的一个判断。P(A|B)称为“后验概率”(Posterior probability),即在B事件发生之后,我们对A事件概率的重新评估。P(B|A)/P(B)称为“可能性函数”(Likelyhood),这是一个调整因子,使得预估概率更接近真实概率。

通过以下这个例子,我们再巩固一下对于贝叶斯定理的理解:

一所学校里面有 60%的男生,40%的女生。男生总是穿长裤,女生则一半穿长裤一半穿裙子。假设你走在校园中,迎面走来一个穿长裤的学生,你能够推断出他(她)是男生的概率是多大吗?

同样,分清和理解问题中的规律和现象(理清问题中的规律和现象是理解和运用贝叶斯公式的关键)。两个规律:男生规律和女生规律。而且知道各个规律的发生概率:P(男生规律)=0.6,P(女生规律)=0.4。两种现象:穿长裤现象,穿裙子现象。而且知道各个现象发生概率,假设有10个学生,6个男生,4个女生,那么,P(穿长裤现象)=(6+2)/10=0.8,P(穿裙子现象)=2/10=0.2。另外,P(穿长裤现象|男生规律)=1.0,P(穿裙子现象|男生规律)=0.0,P(穿长裤现象|女生规律)=0.5,P(穿裙子现象|女生规律)=0.5。现在,看到了一个穿长裤的学生,需要推断是男生的概率,即P(男生规律|穿长裤现象)。

有了前面那些知识,根据公式

P(男生规律|穿长裤现象)=P(穿长裤现象|男生规律)*P(男生规律)/P(穿长裤现象)

还原为数字,即是1*0.6/0.8=0.75,这也就意味着,迎面走来一个穿长裤的学生,ta是男生的可能性为,75%。

衡量证据的份量

人们总是倾向于去关注最新的信息,而习惯性地忽略先验信息。但贝叶斯定理背后的主要思想是,我们必须根据需要不断更新我们的概率估计。纳特·西尔弗(Nate Silver)和艾伦·莱恩(Allen Lane)在他们的著作《信号与噪音》(The Signal and The Noise) 提醒我们:当我们把新信息放在我们已知、更大的背景下时,它们才往往成为最为关键的那一部分。

贝叶斯定理是对我们预测未来努力的一个重要的现实检验。它可以用于任何事情,从宏观经济预测到一局扑克游戏,贝叶斯定理即可以看作是一个数学公式,但贝叶斯推理也可以作为一种思维方式和经验法则。我们倾向于要么否定新的证据,要么接受它,当然,在这一过程中,我们也简化了许多问题。贝叶斯主义者试图以一种明智的方式权衡旧的假设和新的证据。

贝叶斯定理的局限性

不要认为贝叶斯定理可以解决一切问题。首先,世界本身便是一个不断变化的概率阵列;其次,我们还必须记住归纳推理的局限性。某事为真与说它为真是两码事。想想伯特兰·罗素(Bertrand Russell)的《哲学问题》(The Problems of Philosophy) 中提到的这些例子:

经常沿着某条道路行驶的马,很可能会拒绝走另一条路;家养动物看到喂食者,就会期待食物;终生喂养那只鸡的人最终扭断了这只鸡的脖子,所有这些对统一性的粗略期望都容易产生误导,我们不得不接受这样的事实,更均匀的、更细致的看法可能会更加适用于生活。

不过,归根结底,学习贝叶斯推理可以改变你的生活,在你沉浸于贝叶斯定理一段时间后,它开始对你的思维产生一些根本性的改变。例如,你会更加意识到你的信念置于某种灰色地带;它们不是黑色,或者白色,它们从0到100%之间不等,而且处在一个不断波动的状态。

使用贝叶斯定理的妙处在于它鼓励不断更新,还使我们有机会从多个角度审视局势,进而鼓励开放的思想。所以,接受不确定性,并将其转化为你的优势。不要因为拒绝新信息而固守过时的信念,而是要通过一个评估概率的系统来接受你遇到的新情况。

标签: #贝叶斯算法的优点是什么