前言:
今天兄弟们对“贝叶斯算法缺点”大约比较讲究,兄弟们都需要分析一些“贝叶斯算法缺点”的相关知识。那么小编也在网摘上网罗了一些对于“贝叶斯算法缺点””的相关知识,希望小伙伴们能喜欢,咱们快快来了解一下吧!A 司马懿PK诸葛亮:赢家是谁?
三国时期,诸葛亮亲率蜀军北征,安排马谡镇守战略要冲街亭。
但是,马谡把孔明的部署抛诸脑后、自作主张,导致街亭失守,司马懿趁势率15万大军直扑诸葛亮的大本营西城。这时,诸葛亮身边没有武将,只有一班文官、2500个兵卒,不足魏军的2%,双方实力判若天渊,怎么办?
孔明传令,将旌旗尽皆隐匿;诸军各守城铺,如有妄行出入及高言大语者,斩之;大开四门,每一门用二十军士,扮作百姓,洒扫街道。孔明乃披鹤氅,戴纶巾,引二小童携琴一张,于城上敌楼前,凭栏而坐,焚香操琴。
诸葛亮决定冒险一搏。他不疾不徐地安排好一切,然后端坐在城楼上:
司马懿前军哨到城下,见了如此模样,皆不敢进。懿笑而不信,遂止住三军,自飞马远远望之。果见孔明坐于城楼之上,笑容可掬,焚香操琴。左有一童子,手捧宝剑;右有一童子,手执麈尾。城门内外,有二十余百姓,低头洒扫,傍若无人,懿看毕大疑,便到中军,教后军作前军,前军作后军,望北山路而退。
司马昭认为这是孔明使诈,不足为惧,但司马懿的看法恰恰相反:
懿曰:“亮平生谨慎,不曾弄险。今大开城门,必有埋伏。我兵若进,中其计也。汝辈岂知?宜速退。”
司马懿认为诸葛亮一生行事严谨,断断不会在无人守城的情况下大开城门。诸葛亮对此已有预判:
孔明曰:“此人料吾生平谨慎,必不弄险;见如此模样,疑有伏兵,所以退去。吾非行险,盖因不得已而用之。”
为什么司马懿认为西城不是“空城”? 他的分析判断充分体现了贝叶斯思维。
▶首先,司马懿携街亭大胜的声威、凭十五万大军的兵力,原本打算与蜀军再决雌雄;诸葛亮在街亭失守之后,也可能采取闭门拒战的策略,但是,撤兵弃城(出现空城)的可能性很小;
▶接着,当司马懿来到城下,发现诸葛亮既没有排开阵势、准备与汉军再战,也没有紧闭城门、坚壁清野,而是优哉游哉地抚琴,城门洞开,不见一兵一卒。这种意外(现在称为“黑天鹅”)使他不得不重新判断情势,对此前的乐观估计作出大幅调整:
【情景一】如果是空城,诸葛亮在城楼上弹琴的概率有多大?
以诸葛亮的处事原则,司马懿断定他不会如此凭空冒险,所以这种情景的概率微乎其微。
【情景二】如果不是空城(已有埋伏),诸葛亮弹琴的概率有多大?
蜀军在街亭战败,诸葛亮很难在短时间内再次集结部队,此时选择“以逸待劳”是上策,他很有可能在西城里设下机关、布好陷阱,打开大门,是为了引魏军进入埋伏圈,这种情景的概率非常高。
因此综合来看,司马懿得出判断:诸葛亮行事一向稳健、谨慎,他敢于城门大开、闲坐抚琴,必定是早有准备,“西城是空城”的概率很低。
如果魏军的统帅换做没有如此理性的司马昭,很可能不管三七二十一,直接率兵攻打进去,别说拿下西城,活捉弹琴的诸葛亮也完全有可能……
这么一来,《三国演义》的后二十五回就要重写了。
在诸葛亮与司马懿的此番较量中,表面上是诸葛亮险胜、秉持理性的司马懿稍逊,但应该看到的是,“空城计”是非常极端的选择,诸葛亮赌上身家性命为之一搏,这在常态情况下是绝对不可取的。
反观司马懿,对情势进行细致的分析、对风险进行合理的评估,这种理性的思考方式,才是更值得我们学习和效仿的。
在他的判断过程中,充分体现了一个重要的理性思维准则——贝叶斯思维。
B 什么是贝叶斯思维
贝叶斯思维,是指按照贝叶斯定理分析问题的思维方式,主要内容是当面对不确定性的问题时,除了要根据现有条件进行分析,还需要考虑在相反的条件下、出现同样情况的可能性(即概率),并且据此对结论进行纠偏调整,这样才能得出更客观、准确的判断。
举个例子,如果天上出现乌云,下雨的概率有多大?
你可能首先想到“下雨时出现乌云的概率”,但是,它和上面的问题是不同的两件事,不能直接用“下雨时出现乌云的概率”来替代“出现乌云时下雨的概率”。
除了“下雨时出现乌云的概率”,我们还要考虑“不下雨时出现乌云的概率”,根据这个概率对上一步的判断进行调整,整个过程就是贝叶斯思维。
如果历史数据显示,后一个概率比较高(比如在云南大理等高海拔地区,有时出现乌云但并不会下雨),那么仅仅根据“天上有乌云”的条件,就不能推断出“下雨”,或者说,“下雨”的概率很低。
回到“空城计”的故事。根据“诸葛亮抚琴”的条件,能否作出 “西城是空城” 的判断?
司马懿想到了这个问题的对立面,也就是在“西城不是空城”的条件下,“诸葛亮抚琴”的可能性更大,由此,他认为“西城是空城”的概率很低,从而做出了撤军的理性决定。
“相反条件”在概率论中称为备择假设,它是贝叶斯思维中的两个重要支柱之一。
这是对贝叶斯思维的通俗解释。贝叶斯思维来源于贝叶斯定理,它的“本尊”是什么样儿呢?
C 掷筛子的上帝与贝叶斯定理
在西方的统计学和概率论建立之后,人们认为这完全证明了“上帝也在掷骰子”。
不过,十八世纪的英国数学家托马斯·贝叶斯发现了统计学中的一些缺陷,他认为人类在“掷骰子的上帝”面前也不是完全无能为力、听天由命。
贝叶斯提出,应当在统计计算中引入主观因素:
用客观的新信息更新我们最初关于某个事物的信念后,我们就会得到一个新的、改进了的信念。
比如,如果一个人总是做一些好事,我们会推断那个人是一个好人。也就是说,当你不能确定某一个事件发生的概率时,你可以通过与其相关的其它事件发生的概率,来推测该事件发生的概率。
如果用A、B代表两个不同但相关的事件,P(A)、P(B)代表它们发生的概率。很显然,在事件B发生的条件下、事件A发生的概率P(A/B),以及在事件A发生的条件下、事件B发生的概率P(B/A),是截然不同的,它们之间有什么关系呢?
贝叶斯经过研究,把这个关系归纳成了数学等式:
P(A/B)=P(A)*P(B/A)/P(B)
它表示的是,在B发生的条件下、A发生的概率P(A/B),不仅与A发生的概率P(A)、B发生的概率P(B)有关系,也与在A发生的条件下、B发生的概率有P(B/A)关。
这就是贝叶斯定理。
以前面“下雨”的例子来说,在“天上有乌云”的条件下的“下雨”概率,除了要考虑“天上有乌云”的一般概率、“下雨”的一般概率,还要反向考虑在“下雨”的条件下、“天上有乌云”的概率,
用贝叶斯公式表达为:
用贝叶斯定理把司马懿的分析过程表达出来,是这样子的:
这就是说,与其他统计学方法不同,贝叶斯方法是以主观判断为基础,先对目标估计一个值,然后根据其它条件或者事实不断修正,逐步逼近正确结果。
D 五步学会贝叶斯定理
为了帮助你更顺畅地理解贝叶斯定理,我总结了一个“五步法”,以基本概念为线索、层层递进:
第一步,正向概率
以“新冠肺炎”为例,根据目前已知的数据,武汉的新冠肺炎患病率为0.36%(累计确诊病例50000、总人口约1400万),随机选择一个武汉人,他是新冠肺炎患者的概率有多大?答案是0.36%。
这种概率称为正向概率,根据总体样本的分布情况,直接计算出单一事件发生的概率。
第二步,条件概率
接下来,我们把这个问题倒过来,从后向前看,上面的问题就变成:
随机选择一个武汉人,如果他有发烧、咳嗽等症状,他是新冠肺炎患者的概率有多大?
这就是上面讲到的条件概率,即根据一定的信息(即条件),逆向推测相关事件发生的可能性。
第三步,联合概率
联合概率是指事件A与事件B同时发生的概率,记作P(A,B),很显然,P(A,B)=P(B,A)。
利用条件概率,把等式两边的联合概率分别展开:
P(A,B)=P(A)* P(B/A)——事件A发生的概率、乘以在A发生的条件下B发生的概率
P(B,A)=P(B)* P(A/B)——事件B发生的概率、乘以在B发生的条件下A发生的概率
两个等式都表示“事件A与事件B同时发生”的联合概率:
P(A)* P(B/A)= P(B)* P(A/B)
经过数学变形,就得到了条件概率的求解公式:
P(A/B)= P(A)* P(B/A)/ P(B) ………(1)
这是贝叶斯定理的基本形式。应用到上述的例子中:
P(患病/有症状)= P(患病)* P(有症状/患病)/ P(有症状)
第四步,全概率
在上面的等式中,P(B)称作全概率,可以展开成:
P(B)=P(A)* P(B/A)+P(~A)* P(B/~A) ………(2)
其中,P(~A)表示与A相反情况发生的概率。
全概率的计算是关键一步。很多时候我们会忽略“未患病者中的有症状者”(即备择假设),导致对概率的错误估算。
在我们的例子中,P(有症状)就是全概率:
P(有症状)=P(患病)* P(有症状/患病)+ P(未患病)* P(有症状/未患病)
第五步,贝叶斯定理
把全概率等式(2)代入等式(1)的分母中:
P(A/B)= P(A)* P(B/A)/ [P(A)* P(B/A)+P(~A)* P(B/~A)]
这是贝叶斯定理的完整形式。
等式右边的P(A)称为“先验概率”,表示在没有考虑条件B的情况下、A发生的概率;左边P(A/B)称为“后验概率”,表示在根据条件B进行修正后的A发生的概率。
在上面的例子中,已知患病者的比例是0.36%,假设在“正常人”、“患者”两部分人中,“有症状”的比例分别为0.1%、85%:
在后面的G部分,我们会从另一个角度审视这个例子。
E 贝叶斯思维的应用实例
接下来我们用一些实例详细说明如何运用贝叶斯定理。
特别请你注意的是,数字只是为了帮助我们准确理解这个定理,重点在于计算过程、方法和逻辑,计算结果并不重要。在实际应用中,我们有时缺乏具体有效的数据(比如下面的例二),但仍可以按照以往经验、或者参照相近的类别进行粗略估计,不会影响最终的判断。
■ 应用一:汉密尔顿?麦迪逊?
在美国著名政治文献《联邦党人文集》中,有12篇文章的作者一直存有争议,无法确定究竟是汉密尔顿还是麦迪逊。
1787年,哈佛大学统计学家通过研究发现,在已经确定作者的73篇文章中,汉密尔顿写了9.4万字,麦迪逊写了11.4万字。
根据他们各自的用词偏好、即12篇文章中的相关词汇出现频率(词频),利用贝叶斯公式,学者们就能推测出这些文章的作者归属:
■ 应用二:孩子撒谎了吗?
孩子今天放学回来说老师没布置作业,你有些不放心,因为在这件事上,孩子以前撒过谎。
你打电话给他的同学明明,明明也说今天没留作业。现在你需要判断P(孩子说真话/明明说真话)。
你不仅要考虑“孩子说真话”的基础概率,即P(孩子说真话),还要考虑“当孩子说假话时、明明说真话”的概率,即贝叶斯定理中的备择假设,以此来验证基础概率。
你知道明明是孩子的好朋友,两个人常常会“串通口供”,那么,“当孩子说假话时、明明说真话”的概率很低。这时,如果你能确定明明说的是真话,则“孩子说真话”的概率就会被向上修正,也就是说,你应该认为孩子说的是真话。
换个角度来看,如果明明是个诚实的孩子,很少说谎话,不论孩子说的是否是真话,明明都不会撒谎,这种情况下“孩子说真话”的概率不会变化,也就是说,根据“明明说真话”的条件不会影响原有的判断。
■ 应用三:该买进股票吗?
你发现某个股票已经基本跌到位了,后面触底反弹的可能性很高,概率为80%,但你觉得信心不足,花钱找了一位投资高人给你咨询,他的判断和你一样。根据你的了解,他以往判断正确的概率是65%,判断错误的概率是35%,你该怎么做决定呢?
把这个问题“翻译”成贝叶斯公式:
经过修正后的概率比此前有一些提升,但幅度不大,原因是他的准确率并不高。如果他的判断准确性达到95%,最后的结果会提高到96%,你可以更有把握地买进了。
品尝了几道“开胃小菜”之后,下面为你送上“主菜”,我们运用贝叶斯思维,对冷战时期的重大事件“古巴导弹危机”做一深度剖析。
F 古巴导弹危机
1962年,是 “冷战”时期最危险的时刻,美苏两国的激烈对抗,险些将全世界拖入核大战的深渊。
事件的起因,源于此前美国与古巴关系的恶化。
1961年,美国宣布中断与古巴的外交关系,并对古巴实施经济制裁。三个月之后,美国策划了入侵古巴“猪湾事件”,加剧了两国之间的对立态势。迫于美国强大的压力,古巴转向苏联寻求援助。
苏联面对的形势是,以两国军事力量对比而言,美国不仅常规武器处于绝对优势,从50年代大力扩充核武库之后,在核竞赛中也处于领先地位,并且在意大利和土耳其境内部署了中程弹道导弹等战略武器,将苏联的重要城市和工业中心纳入有效射程之内。苏联感受到了前所未有的威胁。
此时古巴向苏联求援,正是苏联扭转不利局面的时机,遂决定向古巴部署武器。到1962年9月,苏联完成了42枚导弹的运输和部署,每一枚导弹都携带一个威力比广岛原子弹大20至30倍的核弹头。
苏联的行动被美国发现后,招致肯尼迪政府的强烈反弹。美国政府向苏联发出警告,要求撤回部署古巴武器,但苏联予以了“坚决拒绝”,并表示将对美国的威胁“作出最激烈的回击”。
肯尼迪立刻下令采取军事行动。
10月24日,在68个空军中队和8艘航空母舰护卫下,由90艘军舰组成的美国舰队出动,在从佛罗里达到波多黎各的几千英里海域上,布成了一个严密的弧形,完全封锁了古巴海域。同时,美国导弹部队全部处于“高度戒备”状态,导弹在发射台上听候指令。
局势危在旦夕,任何一方稍有不慎,就会引爆足以摧毁世界的核战争。苏联需要作出判断,如果不从古巴撤出导弹,美国发动军事进攻的可能性有多大?
我们用贝叶斯定理做一分析:
▶苏美的全球军备竞赛不断加剧,但没有发生过正面的直接冲突。在美国没有封锁古巴之前,苏联不确定“美国发动核战”的可能性有多大,假设概率是50%;
▶如果“美国发动核战”,必定会率先攻击苏联已部署在古巴境内的军事设施,在这种极端情况下,“封锁古巴”的概率会大幅上升,P(封锁古巴/美国发动核战)设定为80%;
▶如果“美国不发动核战”,即使双方擦枪走火,很可能仅仅维持在常规战争层面,那么“封锁古巴”的可能性尽管存在,但是会大幅度下降,P(封锁古巴/美国不发动核战)可设定为10%,
由此可以计算出,美国在封锁古巴的前提下,进一步发动核战的概率骤升至88%:
由于苏联判断在“美国不发动核战”的情况下,“封锁古巴”的概率很小,反过来印证了此前的预判,美国发动核战的概率将大幅度提升。
俗话说,胆儿大的怕不要命的。
美国子弹上膛,发出了“不惜一战”的信号。肯尼迪的坚决、果断,大大出乎赫鲁晓夫的预料。
26日,赫鲁晓夫致信肯尼迪,充分表达了“和解”的意愿,很快得到美国的正面回应。截至11月11日,苏联从古巴撤回全部核导弹和轰炸机,美国随后取消了对古巴的海上封锁。
如果这场危机演变成热核战争,对于肯尼迪与赫鲁晓夫、对于美国苏联和全世界,都是“不能承受之重”。
事实上,肯尼迪下令封锁古巴,是极为冒险的举动,大有“破釜沉舟”之势。正如诸葛亮在城楼抚琴一样,虽然概率很小,但是一旦发生,就会给对方的判断造成很大压力;但同时,也是封死了所有退路,把自己逼上了梁山。
在这个意义上,肯尼迪和诸葛亮的选择都是 “不理性”的。
G 作为压舱石的“基础概率”
以上对贝叶斯定理的解释中,我们把重点放在了“备择假设”上面,这是贝叶斯定理的支柱之一。在实际应用中,除了忽视“备择假设”以外,还有另一种情况,也会造成判断错误,这就是贝叶斯定理的另一个支柱——基础概率。
例如,在D部分的例子中,考虑到“在患者中85%有症状”,这个比例比较高,如果由此判断“有症状者患病”的概率,就会出现高估的偏差。
你应该注意到,整体“患病率”即基础概率只有0.36%,说明在人群中此病的发病例很低,计算结果显示“有症状者患病”的概率只有75%,显著低于85%,这正是基础概率的作用。
由于人们的思维习惯,通常会过于关注发生在眼前的具体事件,而忽视潜藏着的、作为基本情况存在的基础概率,导致出现夸大证据的误判。
实际上,在临床诊断、法庭审判、商业分析等很多现实生活领域中,经常发生这类理性谬误。
H 贝叶斯思维比定理更重要
学习理性思维、学习贝叶斯定理,重点不在于要按照公式详细计算,而是学会这种思维方式、形成贝叶斯思维的直觉。
在文章的最后,我们简要总结一下贝叶斯思维的三个关键要点:
第一,基础概率。从唯物哲学的角度看,基础概率是“矛盾的主要方面”。如果某种情况的发生概率就很低,哪怕证据再确凿,通常也应该否定这种情况出现的可能性。
以上面的肺炎感染为例,考虑到疾病发生率比较低这个基础概率,大致能判断出来很多人出现症状,与肺炎病毒并没有关系,而是其他病症引起的,因此需要再做进一步筛查、检测。
第二,备择假设。由于思维惯性的原因,我们往往被眼前的证据吸引、迅速做出判断,却忽视了在相反情况下的概率。备择假设促使我们更全面地、完整地思考问题。
第三,证据选择。在依据证据进行判断时,需要注意证据的科可靠性、准确性。比如,不能听信某些来源不明的消息,不能由于一件事情就轻易对别人进行评判。越是重要的事情,越需要尽量充分、详细的调查;而当证据、条件充分时,就要及时调整先前形成的判断,灵活应对。
贝叶斯思维是一种应用广泛的理性思考方式。掌握了这个“利器”,你会在看问题的深度和广度上都胜人一筹,形成更有见地、更有效的判断和决策。
标签: #贝叶斯算法缺点