眼见非实

都说“眼见为实”，这本书却说“不是这样的”。对几乎所有生活在阳光下的动物而言，眼睛的出现，都是各自演化史上最引人注目的奇迹，甚至没有之一。具体到人类，眼睛为我们贡献了超过90%对现实世界的感官信息，被视为连通现实与心智的核心器官。从古埃及到如今的美元，眼睛作为一种神圣符号的历史已延绵50个世纪。

科学哲学家艾伦·查尔默斯在《科学究竟是什么》这本经典的开篇就将“眼见为实”定为科学之始，没有它就没有人类数个世纪以来的科技爆发。作为我们这个时代最为重要的战略家，基辛格更是一针见血地指出，何止科技，其实人类历史上发生的所有事归根结底只有一件：“认识现实”。

可是，你有没有想过这样一个根本问题：如果“眼见非实”怎么办？今天要介绍的这本书正是以此为要名——这本书试图回答一个无数科幻作品都在讨论的母题——人类不会不只是高等级智慧虚构出来的一串代码，而不自知？《眼见非实》说，你眼前的一切都不是真实的，“眼见为实”是人类迄今为止为自己编织出的最大幻象。

正如苹果公司今年6月刚刚发布的首款头显Vision Pro展示的那样，你肉眼真真切切看到的一切，和你戴上眼罩，眼前浮现出的界面内容没有什么不同，都是虚拟的“桌面图标”而已：你看到1米开外的桌上真真切切放着一颗苹果，那其实只是代码，当你闭上眼睛，就如同取下眼罩一样，苹果也随之消失。

由此，《眼见非实》的第二个特点也显现出来：它是一本烧脑之书，信息量极大、知识密度极高。书中的论证在神经科学、认知科学、哲学、进化生物学、物理学等众多人类知识群岛间跳跃，柏拉图、哥白尼、伽利略、康德、牛顿、莱布尼茨、达尔文、赫胥黎、爱因斯坦、哥德尔、维特根斯坦、霍金……群星闪耀。读这本书，就是与人类历史上那些最伟大、最深刻的智慧成果与灵魂对话，需要调动起你所有的知识储备，非常耗费脑力。

站在当下以ChatGPT为代表的人工智能革命的起点，《眼见非实》或许还是一本你迫切需要的未来之书，因为它触及到了这场科技竞赛的终极命题——什么是意识？我们该如何创造出真正的具有自主意识的人工智能？人工智能已不是一个“行业”或“领域”，它将是涉及人类生活所有方面的赋能者，所以，无论你身处哪个领域，要想跟上这场科技浪潮，把握住未来世界运作的底层逻辑，这本书都开卷有益。

花点时间从头到尾啃完这本《眼见非实》，在一个碎片化的世界，用跨学科思维让你对世界本质进行体系化思考，这本身就是一种极为难得的体验。你凭什么觉得你看到的就是世界本来的面目？2005年，顶级学术期刊《科学》列出了125个人类尚未解决科学谜题，“意识的生物学基础是什么”位列第2。

那这和《眼见非实》的主题有啥关系呢？事实上，迄今为止绝大多数“意识相关的神经活动”研究中，研究人员都发现，“看”，几乎是一个不可避免的发生动作。因此，几乎所有人都同意这样一个不言自明的“公理”：目光所及即为真实。进入21世纪，随着科学家对不同动物的视觉研究越多，这种“信念”越发让人觉得不对头。

2019年，杜克大学的研究人员发布了一项研究，编制了600种生物的视觉感知估计值，并且还原了它们眼中的世界，几年来早已传遍了中文互联网：左-人类的视觉，右-壁虎的视觉，左-人类的视觉，右-砗磲蛤的视觉，左-人类的视觉，右-蜘蛛的视觉，左-人类的视觉，右-蜜蜂的视觉，左-人类的视觉，右-蛇的视觉，左-人类的视觉，右-兔子的视觉，左-人类的视觉，右-海龟的视觉。

就视觉敏锐度来说，老鹰和其他猛禽堪称整个动物王国的“视力之王”。一只10斤重的老鹰拥有和人类一样大小的眼睛，视力却能达到人类的4到8倍，可以从3公里远的地方发现一只老鼠般大小的猎物：左-人类的视觉，右-鹰的视觉。而鲨鱼虽然无法分辨出颜色，但是凭借视网膜后的一种镜面晶体，鲨鱼在水底下的视力更是人类的十倍。

这还不算绝的，我们人类只拥有三色视觉，而一类叫做Mantis Shrimps的虾拥有12~16色视觉（大名鼎鼎的皮皮虾就属于这一家族）。如果没有相对应感应器官的话，我们甚至根本无法呈现出Mantis Shrimps眼中的世界。

这就产生了一个问题：如果说在漫长的演化史中，对客观世界更准确的视觉感知会带来更好自然适应性，那蜜蜂、鲨鱼等等这些物种，在地球上的存在历史都远超智人，它们眼中的“失真世界”是否才是世界本来的面目？

由此，《眼见非实》提出了一个理论框架来回答我们心中的疑问——“适应性胜过真实”定理（Fitness-Beats-Truth，FBT）。为了回答以上问题，我们不妨先做一个简单的生存策略游戏。有老鹰和鸽子两种动物，在生存游戏中，谁赢得一局就加20分，谁受伤则扣掉80分，用经典的博弈论矩阵来展现，最终结果会是怎样的呢？

如果鹰相互竞争，好斗本性使然，双方都不会退缩，直到决出胜负，又由于双方力量均等，所以胜负率各为一半。每局平均得分为：20×50%+（-80）×50%=-30，这样的结果有损于老鹰这个物种的整体自然适应度。如果鸽子相互竞争，双方也各有一半的概率赢得20分。但都不会受伤。所以每局平均赢得10分。鸽子这个物种对自然的适应度会增加。如果老鹰遇到鸽子，鹰赢，没有人受伤，鹰得20分，鹰的适应度有所增加。

如果收益是这样，自然选择会偏好什么策略？答案取决于鹰派和鸽派的占比。若所有人都是鹰派，则平均每个人在每场比赛中都会损失30分——这是一条通往灭绝的捷径。若所有人都是鸽派，则每个人平均在每场比赛中得10分，这是获得更好适应度的快速通道。但有一个问题。如果所有人都是鸽派，只有一个鹰派，那鹰派怎么都能赢。它每次与鸽派竞争都能得20分，是鸽派得分的两倍多。更高的适应度意味着后代会更多。

所以这个鹰派会繁殖更多鹰派。鹰派的数量什么时候会停止增长？当鹰派占总数的1/4时。

这就是演化博弈论的一个简单模型，用它可以研究我们的问题：自然选择是否偏好真实的感知？答案很明确：不。这个答案就是“适应胜过真实（FBT）定理”：适应会迫使真实灭绝的概率至少为（N -3）/（N -1）。

它的意思是，假设一只眼睛有10个感光器，每个感光器都有两种状态，根据FBT定理，这只眼睛看清实在的概率不超过千分之二。如果有20个光感受器，这个概率是百万分之二；如果有40个光感受器，这个概率是百亿分之一……而人类的眼睛有一亿三千万个光感受器，看清实在的概率基本为零。

也就是说，FBT定理认为，自然选择不会塑造我们去感知实在的结构，它塑造我们去感知适应度，以及如何得到它们。

比如，我们自己的感官不能感知氧气，事实上，我们直到1772年才发现氧气。但我们的感官能感知适应：如果缺氧，我们会感到头痛，如果氧气太浓，我们会感到头昏眼花。换言之，根据FBT定理，当我们用语言来呈现我们的感知时——空间、时间、形状、色调、饱和度、亮度、质地、味道、声音、气味和运动……没有一个是正确的。

可以说，任何内容理论，如果假设在正常情况下感知是真实的，则几乎肯定是错误的，因为我们进化是为了针对适应性来感知和行动，而不是为了感知客观实在的真实结构。FBT定理驳斥了感知哲学中目前提出的所有内容理论。一句话总结就是：如果我们的感官是由自然选择塑造的，我们就看不到这个世界一切客观实在的本来面目。

那么问题来了，如果我们的感官不能呈现实在，它们怎么会有用呢？为了回答这个问题，《眼见非实》构建了第二个理论模型——感知界面理论（interface theory of perception，ITP）。感知界面理论（ITP）某种程度上来说其实更像一个隐喻：每个感知系统都是一个用户界面，就像电脑桌面。这个界面是由自然选择塑造的；它可以因物种而异，甚至因物种中的不同个体而异。

假设你正在写一封电子邮件，文件的图标是蓝色矩形，位于桌面中央。这是否意味着文件本身是蓝色的，矩形的，并在你的计算机中心？当然不是。事实上，文件没有颜色和形状，它在计算机中的位置与图标在桌面上的位置无关。蓝色图标并不是故意曲解文件的真实性质。呈现真实性质不是它的目的，相反，它的作用是隐藏真实性质——避免晶体管、电压、磁场、逻辑门、二进制代码和软件编码的繁琐细节把你绕晕。

你花大价钱买了一个界面来隐藏所有这些复杂性（即“真相”），正是这个界面才能让你专注于制作电子邮件、编辑照片、发微博、复制文件。

在这种情况下，对实在的无知，有助于对实在的掌控。ITP认为，进化塑造了我们的感官，使之成为用户界面，以适应我们这个物种的需要。我们的界面隐藏了客观实在，并引导针对我们的生境的适应性行为。时空是智人界面的桌面，而你眼前“放在桌上的勺子”和“夜空中的星星”等等这些物理对象则是图标。

我们对空间、时间和物体的感知是由自然选择塑造的，不是为了真实地揭示或重构客观实在的真相，而是为了让我们活得足够久以繁育后代。作为一本由加州大学欧文分校认知科学教授所写的书，唐纳德·霍夫曼在《眼见非实》中提出的ITP，似乎还可以用来回答这样一个曾经难倒了无数文科生的问题，即，王阳明500多年前所说的：你未看此花时，此花与汝心同归于寂；你来看此花时，则此花颜色一时明白起来。

这句话到底是啥意思？以内克尔立方体为例，究竟哪一面在前？有时你会看到A面在前的立方体，有时你会看到B面在前的立方体。那么，当你不看的时候，中间的立方体哪面在前？答案显然是，当你不看的时候，就没有立方体——既不是A也不是B。每当你看的时候，你都会看到当时正在被构造的立方体。当你把目光移开，它就消失了。ITP认为时空中的所有物体包括时空本身都是如此。

空间和时间只是我们界面的格式，而物理对象是我们在思考各种选项来获得适应度收益时临时创建的图标。物体不是强加于感官的预先存在的实体，它们是从众多收益中获得比竞争对手更多收益的问题的解决方案。如果你看到桌子上放着的一个勺子，那么这里就有一个勺子，但是一旦你把目光移开，勺子就不复存在了。某种东西继续存在，但它不是勺子，也不在空间和时间里。勺子是一种数据结构，当你与某种东西互动的时候就会产生这种结构。

这是你对适应度收益以及如何获得收益的描述。

FBT定理告诉我们，获胜的基因不会是感知真实的编码。ITP告诉我们，它们为隐藏客观实在真相的界面编写代码，为我们提供带有颜色、纹理、形状、动作和气味的物理对象图标，使我们能以我们生存和繁衍所需的方式操控被隐藏的实在。时空中的物理对象只不过是我们桌面上的图标。我们对月球和其他物体的感知并不是为了揭示客观实在，而是为了揭示对进化至关重要的一件事情——适应度收益。

物理对象是对决定我们生存和繁衍收益的关键信息的理想展示，它们是我们不断创建和丢弃的数据结构。关于时间和空间的语言，关于具有形状、位置、动量、旋转、极化、颜色、质地和气味的物理对象的语言，是描述适应度收益的正确语言。但从根本上来说，用这种语言来描述客观实在是错误的。

基于以上理论，关于我们的眼睛，《眼见非实》提出了这样一个结论：视觉搜寻适应度，但这个搜寻过程本身也要适应，因为必须高效，必须谨慎分配其有限的资源。眼睛有1.3亿个光感受器，每秒要接收数10亿比特信息，但只有40比特赢得了注意。这个删除视觉垃圾的过程，遵循简单而迷人的规则。

对于从事市场营销和产品设计的人来说，要想在无处不在的争夺消费者短暂注意力的战斗中取得成功，了解这些规则至关重要。视觉过滤器的第一个要点是光感受器的布局。视网膜的光感受器是在中心部署得较多，在周边较少。如果你盯着中心的圆点，你会发现内圈较小的字母和外围较大的字母一样容易辨认。为了同样清晰，外围的字母必须更大，因为那里光感受器密度更低。

因此，成功广告的目标不仅仅是，有时甚至不是，呈现重要的事实。

它是精心制作的视觉信息，为的是抓牢目标客户搜寻的目光。下面这张图展示了高档商场中运动服装店入口处的橱窗。它用次要线索刺激眼睛，最糟糕的是左上角和右上角玻璃上的明亮反光，以及各处的较暗反光。它们在亮度和颜色上的对比，把人们的目光引向了死角：当顾客走动时，反光也随之移动，进一步增强了它们无意义的诱导。要改善这个缺陷需要用无反光玻璃。

但即使没有反光，这样的展示还是让四面八方的视觉丛林中充斥着无效的呐喊：一片热带雨林，两幅杰克逊·波洛克的画作，一面不合逻辑的橙色墙壁，僵硬的人体模型光秃秃的脑袋上突兀的反光，空洞的广告语——这些都是毫无意义的干扰。

视觉过滤器的另一个要点是，直到今天我们的眼睛仍然利用我们的祖先在更新世时期进化出来的策略搜寻适应性，我们可以利用这个古老的策略来促进现代市场营销，露出某些动物部位——眼睛、爪子、脸。从触发动物监视系统的原始目的来说，瞥见眼睛就相当于透过那只眼睛窥见了野兽。进化的逻辑提示了一个更好的策略：任何稍微有点像眼睛的东西都值得关注，哪怕只是短暂关注。

以上，是一些基于我们的操作界面中的因果关系的应用，但由于它们并没有揭示出这个客观世界真正的内在运作机制，尽管好用，一旦我们试图理解自己的意识体验，这种虚拟的关系就会阻碍我们。如果基于时空中的物体的任何理论都不能解释我们的意识体验，那应该以什么为基础呢？意识体验究竟有没有可能从计算机模拟中涌现出来？《眼见为实》认为可以，它提出了一种完全不同于主导现代神经科学乃至科学的物理主义的本体论——意识实在论。

其中的许多关键思想已经出现在先哲的思想中，从古希腊哲学家如巴门尼德、毕达哥拉斯、柏拉图到更近期的德国哲学家如莱布尼茨、康德和黑格尔，从东方宗教如佛教和印度教到神秘交织的伊斯兰教、犹太教和基督教。意识实在论假定无数种意识自主体拥有无限多样的意识体验，其中大多数我们无法具体想象，作为意识主体，人类没有什么特殊或核心地位。

由此，意识实在论重构了人工智能的问题：我们能否设计我们的界面，打开进入意识自主体王国的新窗口？一大堆晶体管无法为这个王国提供洞察。但是晶体管可以组装并编程为人工智能，从而打开一个进入那个王国的新窗口吗？《眼见非实》的作者唐纳德·霍夫曼认为，可以。将意识自主体结合在一起，可以创造出越来越复杂的自主体，这个过程最终会产生无限自主体，在体验、决策和行为上有无限的潜力。

他还认为，意识实在论可以打破科学和精神之间的藩篱。这种意识形态上的障碍是一种不必要的错觉，被古老的错误观念所强化：认为科学需要一种排斥精神的物理主义本体论，精神逃避科学方法。这将能更清楚地回答我们最大的问题：我们是谁？我们在哪里？我们活在这个世界上是为了什么？《眼见非实》认为，时空是你的虚拟现实，一副人类为自己制作的眼罩。物质和时空是源自意识的一种感知界面，你看到的东西是你的发明。

你只需一瞥就能创造它们，眨眼之间就能摧毁它们。这副眼罩你已经戴了一辈子。如果摘下来会怎么样？