在今天这个信息爆炸的时代,我们每天都在制造庞大的数据量,绝大多数信息都被遗忘在了洪流之中,转瞬即逝,但也有不少信息,我们希望能一直保存下去,留给一代又一代后人。这个世界上有各种各样的信息载体,从远古的壁画、传统的纸张书籍,到近代发明的磁带、胶卷,再到现代的光盘、硬盘、U盘。信息储存的载体变得越来越轻巧,容量还越来越大,而且能储存的数据也更多样化。但我们真的能放心地把资料都交给它们吗?
在回答这个问题之前,我们先让了解一下这些存储设备是如何记录信息的。
现在的我们能把以前需要一个图书馆才能记录下的信息,全部装进一个不到巴掌大的硬盘中。这一切首先要归功于二进制的信息编码方式,无论是文字、图像还是声音,都可以用0和1来编码,虽然只有两种数字,但只要不限制位数就能有无限种组合方式,重要的是,这样简单的语言能让“肚子里没墨水”的机器轻松读懂。接下来就要考虑用什么来代表0和1。
电子设备是通过电流变化来识别信息的,而电场的变化会产生磁场,反之亦然,并且方向可控。利用这种电磁感应现象,我们就可以改变磁性载体组成单元(磁畴)的磁极取向,相应地定义为0和1。磁带和机械硬盘就是利用无数个微小的“磁铁”来编码信息的。磁化和去磁化的过程是可逆的,因此这类磁存储载体既可以反复读写。
机械硬盘(左)与固态硬盘内部结构(右)读取更快的固态硬盘则与机械硬盘不同,是通过载体的每个单元是否存在电子来定义0和1的。U盘等存取快速的闪存设备也是基于此原理。
还有大家熟悉的光盘,顾名思义,是利用载体的光学特性来记录信息的——反射光的区域定义为1,不反射则定义为0。
CD(左)和DVD(右)的微观结构,后者的信息密度更大 | 图源:大英百科全书光盘亮闪闪的那面涂的是一层反光材料,刻录信息时,激光会烧掉部分单元格上的反光材料,露出底下的吸光材料,这些不反射光的区域就是“0”所在的位置。烧掉的部分一般是不可逆的,这就是为什么许多光盘只能一次性记录信息,而无法重复读写(也有可重复擦写的光盘,如CD-RW)。
了解了上述信息存储原理,你就会发现缩小这些信息载体大小的关键在于如何缩小编码0或1,即1字节的基本单元。如今你拿在手中轻小的磁带,在1951年还是台比洗衣机还笨重的磁带机,其中的金属磁带每厘米只能储存50字节信息,1吨重的机身仅编码了一首MP3歌曲。相比之下,现在一个指甲盖大小的SD卡都能储存上百GB的信息,完全可以当一个移动小影院。
但科学家并不会止步于此,实验室中的信息存储单元大小几乎已经逼近极限——单原子水平。2016年,荷兰科学家以单个氯原子为基本单元来编码数据(有氯原子的位置是“1”,没有是“0”),成功储存了1KB数据。利用这项技术,理论上,可在一枚邮票大小的面积上储存60TB数据。
然而像这样存储信息,你需要使用扫描隧道显微镜在超真空和超低温环境下工作,门槛显然高得不切实际。
把信息储存载体变小,我们已经做到相当极致了,但在另一方面——信息保存期限上,这些高科技设备甚至还不如传统信息存储载体。普通机械硬盘使用3~5年就可能损坏,光盘可以保存10~25年,闪存设备包括U盘和固态硬盘则会随着读写次数的增加,慢慢患上“失忆症”。
看似过时的磁带依然在数据备份中扮演重要角色而看似被时代抛弃的磁带在理想条件下却能保存30~50年,因此像谷歌这样引领科技前沿的巨头依然会使用磁带备份重要数据。书籍中简简单单的白纸黑字更是可以传递数个世代,只要保存妥当,500年后依然能完好无损。
但纸这样的载体毕竟还是脆弱,一场火灾就会灰飞烟灭。而且还占地方,谁不想把沉甸甸的书包换成一个轻巧的pad?难道说,载体的信息存储容量和信息保存期限真就没法兼得吗?倒也不是,近年来科学家们在这方面已经取得了一些进展,只不过还没完善,下面这两种方式或许能成为保存人类文明的希望。
2013年,英国南安普顿大学的科学家用飞秒激光在玻璃盘的3维空间结构中打出一系列极小的点,将300KB的信息储存在其中。
如今他们已经把这种玻璃盘的信息存储能力提升到了300TB!既然5D光盘和普通光盘一样,都是用激光来刻录数据,那它又有什么特别之处?普通光盘记录信息只是“流于表面”,即只有二维水平,而这个“5D光盘”听起来虽然和“5D电影”一样有噱头之嫌,但至少它的确能在立体空间维度(3D)记录信息。剩下两个维度,一个指的是观察的角度,另一个是显微镜的放大率。
在5D光盘中,从纳米级别的微观水平到直观肉眼可见的宏观水平都记录了信息,观察者通过不同角度和不同放大倍数,可以从中读取出不同信息。但5D光盘更可贵之处在于它的耐久性,石英玻璃材质和表面的聚合物保护层使它对化学和物理伤害都具有很强的防御力。研究者基于实验结果认为,它在室温下的保存时间几乎是无限的,即使是在189 °C的高温环境中,也能活到宇宙现在的年龄(138亿年)!
其实论存储信息的本领,任何载体都不及构成我们的细胞,更准确地说是细胞核中的DNA。虽然生物个体会逝去,遗体会被分解,但DNA中的基因却通过复制重组,一代又一代地流传下去。从冰封的远古遗体,抑或是现代生物的DNA中,我们依然能解析出史前祖先的某些特征。
DNA的信息存储能力也毫不逊色——在肉眼完全看不到的细胞核中,带有A(腺嘌呤)、T(胸腺嘧啶)、C(胞嘧啶)、G(鸟嘌呤)四种不同碱基的脱氧核苷酸,以不同的顺序排成DNA长链,编码了一个生物体的一生。以人体基因组为例,其中含有超过30亿个碱基对,这一切都保存在直径仅几微米的细胞核中。如果将这些A、T、C、G以正常字体大小写在A4纸上,消耗的A4纸垒起的高度相当于40层楼高!
从这些层面看,大自然或许早已为我们准备好了最佳信息存储载体。科学家们从中获得启迪,尝试主动在DNA中编写信息。他们将A、T、C、G碱基以二进制编码,然后将数字化的文字信息翻译成碱基序列,再合成DNA序列,就实现了数字信息与生物信息之间转化。只要测个序,就能解读出其中的信息。但裸露的DNA依然相当脆弱,于是研究者给它们穿上了二氧化硅外壳,制成人造化石,以达到长期保存的目的。
他们让这个人造化石在70℃的高温中保存了一周,再读取信息,结果依然完好无损。不仅是文字,科学家已经成功地将电影编码进人工合成的DNA,而且理论上能够将人类有史以来拍摄的所有电影全都塞进一个小小的DNA人造化石中。然而,这样保存DNA并没有完全体现出它的优势——可遗传性。
虽然我们也能通过PCR技术人工复制数以万计的DNA,但手动备份肯定不如主动备份及时省事,而且细菌等微生物的繁殖扩散速度惊人,子子孙孙无穷尽也,即使出现DNA突变,科学家也能用算法矫正信息。实际上,哈佛大学的科学家在2017年已成功利用CRISPR-cas9基因编辑技术将一部短片编码到了大肠杆菌的基因组中,制造出了“细菌硬盘”,而且还能将信息遗传给下一代。