电影《三大队》中,程兵曾是⼀名警察,负责侦破⼀起命案。程兵⼀直着⼿寻找⼀名疑凶王⼆勇的下落。⼀开始,只有⼀个模糊的⽬标⼈形象,程兵判断对⽅是王⼆勇的可能性很低。后来获悉⼀名男⼦与王⼆勇⻓相酷似,程兵对其是⽬标⼈的信⼼增加了⼀些。再经过深⼊调查,发现该名男⼦不仅爱看法制节⽬,还热衷于玩⽼式俄罗斯⽅块游戏,这两个与王⼆勇爱好吻合的线索,使程兵确信他就是⾃⼰要找的⼈,认为对⽅是王⼆勇的概率接近100%。
随着⼀个个新线索被发现,程兵对⽬标身份的判断在不断更新,从最初的低概率怀疑,到最终的⾼概率确认。这⼀过程正是运⽤了⻉叶斯推理,不断修正先验概率,得出后验概率的结果。
程兵判断⽬标⼈物是王⼆勇的过程,实际上是在进⾏⻉叶斯推理。假设有A、B两袋球,A袋内红球占3/4,B袋内绿球占3/4。随机给你⼀袋,通过⼀个个摸出球的颜⾊来判断是A袋还是B袋,这就类似于程兵在确定对⽅是否为王⼆勇的过程。⼀开始没线索,假设A、B袋的概率均为50%,这是“先验概率”。如果摸出⼀个红球,因它更可能来⾃A袋,A袋的概率就上调到75%,这是根据新线索更新后的“后验概率”。
接着如再摸出⼀个红球,A袋概率继续上调⾄90%。但接下来若连摸出两个绿球,A袋概率将重新降⾄50%。继续下去,再摸出4个球,如果8次中有6红2绿,A袋概率将⾼达98.8%,虽难确定绝对是A,但已极有把握。
这⼀动态更新概率的过程,就是将原先的判断与新线索不断融合,使结果越来越精确。⻉叶斯推理不只给出最有可能的答案,还量化了对此答案的确信程度。它代表着⼀种思维理念:坚持反馈迭代,摒弃固步⾃封,包容不确定性,勤于学习探索,理论与实践并重。
小百科:什么是“贝叶斯推理”?贝叶斯推理是⼀种在不确定情况下进⾏概率判断和决策的数学⽅法,它源于18世纪英国数学家托⻢斯·⻉叶斯的研究。贝叶斯推理的核⼼原理是:根据已知信息得出⼀个“先验概率”,然后每获取⼀条新证据,就利⽤⻉叶斯公式,结合新线索对先验概率进⾏修正,得到“后验概率”的更新值。这⼀修正过程会不断重复,持续引⼊新信息,使概率估计值逐步向真实概率靠拢。
具体来说,⻉叶斯公式运⽤了条件概率的乘法法则,将后验概率表示为:后验概率=先验概率*似然函数/证据概率。其中似然函数描述了新证据发⽣的概率,证据概率是⼀个归⼀化因⼦。这样就能通过简单的概率乘除法,将先验概率与新证据整合,得到修正后的后验概率估计。
通过循环迭代,⻉叶斯推理让我们在不断吸收新信息的同时,动态调整对事件可能性的判断。最终不仅给出最有可能的结论选择,还能量化出对这个选择的确信程度有多⾼。贝叶斯推理都发挥着重要作⽤,帮助我们在不确定的世界中作出明智的判断和决策。
美国⾟普森杀妻案曾在20世纪90年代引发轰动,⾟普森聘请“梦幻律师团”为其辩护。检察官展示出⾟普森曾⻓期家暴妻⼦的证据,认为这是“谋杀的前奏”。
⽽辩护律师Alan反驳称,美国每年虽有400万妇⼥遭家暴,但仅1432⼈被杀,概率只有1/2800,暗示⾟普森可能⽆辜。按⻉叶斯推理,妻⼦确已被杀,问题是⾟普森是否为凶⼿。⾟普森的家暴⾏为虽是⼀个线索,但与1/2800的概率⽆关。我们应关注的是,在妻⼦遇害的情况下,凶⼿正是施暴者的概率有多⼤。数据显示,在遭家暴且遇害的妇⼥中,凶⼿是家暴男的概率⾼达90%。
这⼀证据极⼤增加了⾟普森的嫌疑,但Alan的诡辩削弱了其说服⼒。
这启示我们,在不确定情况下,不应⽌步于表⾯数字,⽽要注重条件概率之间的关联。⻉叶斯推理教导我们,在获取新线索时,要动态修正既有判断,从先验概率推出后验概率。
贝叶斯推理应⽤范围⼴泛,包括⼆战密码破译、医学诊断、电商推荐、垃圾邮件识别、⾦融投资决策、剧本杀游戏等。在⼈⼯智能和计算光学成像领域也扮演重要⻆⾊。
我们拍照⽚时,相机记录完整光场数据,可直接获得清晰图像。但在很多情况下,相机只能获取有限的数据,却需重建出清晰照⽚。⼀个典型例⼦是2019年发布的⾸张⿊洞照⽚。由于⿊洞在遥远的宇宙深处,理想条件是建造⼀个地球⼤⼩的射电望远镜,但现实中只有分布在全球各处的8个普通⼤⼩望远镜采集数据。尽管数据有限,但通过对⿊洞的科学认知,从中猜测出⼀张“合理的”照⽚成为可能。
重建照⽚既需要理想化地满⾜各种约束条件,⼜需现实化地拟合测量数据。在⻉叶斯框架下,可将这两⽅⾯需求量化为概率值,并将它们结合为总体概率值,以此为⽬标寻找最佳重建结果。研究者历时两年,综合多种算法,最终才获得了那张被⼴为传播的⿊洞照⽚,尽管⽆法百分百保证与真实⼀致,但已是正确可能性最⼤的猜测结果。
不⽌在宇宙探索中需要考虑照⽚真相的不确定性,我们⽇常应⽤中也是如此。例如普通相机只能拍摄平⾯图像,要测量物体的三维形状,需结合投影仪和相机共同实现。通常需多次投射不同结构光条纹图案才能获取⾜够数据,如果只有单张条纹图案,数据不⾜会导致重建结果的不唯⼀性。在这种情况下,如何顺利重建三维模型?
普通相机的另⼀个局限是只能记录光场的振幅(或者说强度),也就是光的明暗,这对于拍摄⼀张⽇常普通照⽚没有问题。
但是在显微镜之下,⾯对所要观测的透明细胞和微⽣物,光的振幅常常⽆法体现出样本细节,⽽光的相位信息更加重要,相位表示了光的传播路程⻓短,⼀个细胞不同部位不同厚度的差异都会造成光相位变化。但光相位⼜没办法直接测量和记录,⽽且我们不仅需要样本的相位照⽚,对于显微镜,还进⼀步希望相位照⽚是放⼤后的结果。
为了获得⾼分辨率的相位成像结果,研究者提出了差分相衬(Differential phase contrast, DPC)和傅⾥叶叠层显微成像(Fourier Ptychographic Microscopy, FPM)相结合的⽅法,简单说就是通过⼀个LED灯的阵列照射样本,每次只开启⼀部分数量的LED灯照明,这意味每次光从不同⽅向照射显微镜下的样本。
在每⼀个照明模式下,都拍摄⼀张光强度的照⽚,最后从所有光强度照⽚的细节中,可以计算重建出原本不可⻅的⾼分辨率的相位成像结果。
“世界上没有免费的午餐”,在这⼀⽅案中,要付出的代价是拍摄不同光照条件下照⽚的数量,常常要超过100张,那么如果我们只有5张这样的照⽚,数据严重不⾜的情况下,还能同样获得⾼质量的计算结果吗?
普通相机所使⽤的图像传感器通常是⼀个由很多微⼩单元组成的阵列,每个⼩单元⽤于记录照⽚中每个像素的信息,然⽽在可⻅光以外的⼀些波段,⽐如红外,X光和太赫兹,这种阵列传感器难以制造出来,或者价格⾮常昂贵,研究者转⽽尝试另⼀种称为单像素成像(Single-pixel Imaging, SPI)的替代⽅案。
这种特殊的相机中,传感器只有⼀个像素,每次只能记录物体场景整体的光强弱,拍摄者需要每次把不同的投影图案照射到物体表⾯,经过很多次不同图案的照射,单像素探测器收集到⾜够多的数据,也可以计算重建出物体图像来。但同样这⾥的关键词是“⾜够多”,如果我们只希望照射很少量的投影图案,记录下很少的数据,能否依旧重建出清晰的物体图像呢?
以上各种情形下所⾯临的共同挑战在于,实际获取的图像数据少得可怜,却⼜希望还原出⼀张完整清晰照⽚,看起来都是“不切实际的幻想”,寄希望于“空⼿套⽩狼”,⽽⼈⼯智能证明了“幻想还是要有的,万⼀实现了呢?”。
⼀个深度学习神经⽹络数学模型,模拟⼈的⼤脑结构,包含了⼤量的神经元和相互之间的连接突触权重,研究者事先根据不同任务,准备⼤量训练数据,⽐如结构光三维测量中就是单张扭曲变形的条纹图案和对应的实际三维物体模型,相位显微成像中就是少数⼏张不同照明模式下的光强度照⽚和⾼分辨率的相位成像结果,单像素成像中就是数量有限的探测器数据和实际的物体图像。
神经⽹络模型经过训练后,模型中所有的连接权重数值得到优化,就学会了怎样从不充⾜的数据中猜测出所希望获取的照⽚,能够帮我们完成上⾯这些看似不可能完成的任务。
普通深度学习模型虽能给出预测结果,但⽆法量化该结果的可信程度。我们希望⼈⼯智能不仅能猜出答案,还要“有⾃知之明”,给出答案的可信度。⻉叶斯深度学习就可以满⾜了这⼀需求,它将神经⽹络当前的连接权重值视为先验概率模型,每个训练样本相当于⼀条新线索,可以不断将先验概率更新为后验概率。如此⼀来,神经⽹络不再固定不变,能同时给出预测结果及其不确定性估计。
举例来说,在计算成像任务中,普通神经⽹络只能输出重建的图像,⽽⻉叶斯神经⽹络不仅能重建图像,还能为每个像素值附加⼀个不确定度评估。这就展现了不确定世界的更完整图景。
总的来说,在现实⽣活中,我们常常⾯临种种不确定性问题,⽆法⽴即得知准确答案。⽐如刑侦⼈员需要从线索中判断嫌疑⼈是否为真凶;科学家需要从有限观测数据中推测出⼀张清晰的天⽂照⽚;医⽣需要从症状和检查结果中诊断疾病原因;等等。这些问题背后都存在多种可能的答案选择,我们很难⼀下⼦就下定论。
有了⻉叶斯推理这⼀强⼤⼯具,我们就能泰然⾃若地⾯对这些不确定性。⻉叶斯推理教导我们,要先基于已有信息给出⼀个初步的概率估计,这就是“先验概率”。之后只要不断获取新的线索和证据,就可以反复运⽤⻉叶斯公式,将新信息与先验概率融合,动态更新出“后验概率”的新估计值。
通过这种循环迭代的⽅式,我们就能以⼀种客观理性、渐进式的思维⽅式,有序地将零散的新旧信息整合起来,逐步缩⼩不确定性的范围,将概率估计值向最终的真实答案靠拢。最终,⻉叶斯推理不仅让我们找到正确可能性最⼤的答案选择,还能量化出对这个选择的确信程度有多⾼,让我们对结论的可靠性有个明确认知。
因此,⽆论是追查真凶,重建天⽂照⽚,还是诊断疾病,只要运⽤⻉叶斯推理,我们就能在不确定的环境中游刃有余,作出明智的判断和决策。