不同的颜色对应着不同的电磁波频率,不同的音调对应着不同的声波频率,初中生物都教过我们人眼如何分辨颜色,但却没教耳朵怎么分辨音调。这是因为,想要理解后者,你需要先学会高等数学中的傅立叶变换。不过放心,我保证,就算你完全不懂傅立叶变换,也能看懂这篇文章。
每年,不知道有多少崭新出厂的大学生反复吊死在同一棵树上,这棵树就是高数。而傅立叶变换又是高等数学中最实用的内容之一。用比较时髦的方式来说,如果说线性代数是“人工智能的数学基础”,那么傅立叶变换就是“机器视觉的数学基础”。傅立叶变换重要到,在高等数学之后的数学、物理、工程课程上,不少都需要以傅立叶变换为基础进行分析,教授往往会默认你已经学会了傅立叶变换。
但是,如果我告诉你,你苦苦学不会的傅立叶变换,你的耳朵时时刻刻都背着你在做,你会是什么感受?我们能分辨多彩缤纷的颜色,也能分清楚歌曲音调的高低,而颜色和音调高低,其实分别体现了可见光(电磁波)的频率和音波的频率。人眼如何分辨颜色,初中生物就学过——人眼视网膜上有三种不同的视锥细胞,它们对不同波长的光敏感,可以将这些信号转换成电信号传入大脑。
而三种视锥细胞敏感的光,被我们称为三原色,分别是红色、绿色和蓝色。
那耳朵又是如何听到声音、分辨音调的?听到声音的过程初中生物也教过,就是声音从外而传导到鼓膜,鼓膜后面的中耳、内耳再把声音的振动转换成电信号传入大脑。但后一个问题,耳朵又是如何分辨音调的?初中生物可能就无法给你比较直观的解答了。因为音调本质就是音波振动频率,声波的振动频率越高,声调也就越高、声音就越尖。
视频在加速时,同一段声音波形的总时长减短,音调也就提升了,所以加速的视频音调听起来会是尖尖的,甚至还有点搞笑。
而要处理不同的频率,那就要请出频率终极解决方案——傅立叶变换了。傅立叶变换可以将一段随时间变化的信号,转换成它在频率上分布的情况。也就是说,通过傅立叶变换,我们可以找出一段波动信号中,存在哪些频率的声波。而这些频率就对应着声音的音调。
实际上,耳朵中最关键的结构之一:耳蜗,它本质上是一个傅立叶分析装置。声音从耳道向内传播,鼓动了鼓膜,鼓膜的振动通过锤骨、砧骨、镫骨(人体内最小的三块骨头)传导到耳蜗。耳蜗是一个管状螺旋结构,里面充满液体,能增大音波的振动强度。
耳蜗和基底膜共同组成了一个天然的、机械的、被动的傅立叶分析装置,将音波振动频率分散到了耳蜗的各个位置。这样,不同位置的毛细胞传出的神经信号,就相当于不同的频率的声音信号了。在理解耳蜗的运行逻辑后,就可以制造人工耳蜗了。人工耳蜗就是通过手术给耳蜗植入电极,用算法算出声音对应的频率,从而直接刺激相应位置的神经。这样,患者就不仅能感觉到声音,还能分辨声音的高低了。
2013年《物理评论快报》(PRL)上的一篇论文指出,人类对声音的频率-时间敏感性,甚至超出了傅立叶变换在数学上的分辨率极限。这个傅立叶变换的特征就是,对原始信号的时间分辨率,和对傅立叶变换后的信号频谱分辨率之间的乘积,存在一个最小值,无论如何也不可能小于1/(4π)。而在这篇论文中,研究人员给受试者随机播放几段时间有限的音频,让他们区分音调的高低。
结果发现,在几乎每次实验中,受试者的时间-频率分辨率乘积,都小于1/(4π),有时甚至只有前者的1/10。
当然,这也不是说人类的能力“超越”了数学极限,它反而说明,我们的耳朵其实并非单纯是一个机械的、被动的傅立叶分析装置。傅立叶变换的数学极限只适用于线性结构,我们的耳朵打破了这个极限,就说明我们的耳朵中有一些非线性的增益手段,帮我们不均匀的放大了特定频率、强度的声音。
科学家也并未对这个实验结果感到意外,因为早在1971年,科学家就在动物活体实验中发现了基底膜的非线性特征。目前的猜想是,耳蜗中的外毛细胞充当了这个非线性增益的角色。
当你在为傅立叶变换发愁时,你的耳朵甚至已经超越了傅立叶变换,一只脚踏入了非线性的领域。看到这里,你也能明白,初中生物不教听觉原理,确实是有原因的……