现代世界产生的数据日益增多,研究人员需要尽快找到可以存储全部数据的新方法。据估算,到2025年,全球每天产生的数据量将达463艾字节。继续采用传统硅技术存储所有数据很快会变得不切实际,但DNA可以解决这个问题。首先,DNA的信息密度比传统硬盘要好上数百万倍,1克DNA可以存储的数据多达2.15亿GB。不仅如此,如果储存得当,DNA也非常稳定。
2017年,研究人员仍可以从一匹70万年前灭绝的马中提取出完整的基因组。
DNA有望成为一种极为紧凑稳定的存储介质,但难点在于将计算机及数据构成的数字世界与遗传学的生化世界连接起来。目前,这还依赖于实验室合成DNA,虽然该方法的成本正在迅速下降,但目前仍然复杂且昂贵。一旦合成完成,在预备使用前,所产生的序列必须在体外小心存放或用CRISPR基因编辑技术将其拼接为活细胞。
现在,有一种新方法可以使人类将数据信息直接写入活细胞基因组中,实现碳基生物和硅基的连接:哥伦比亚大学的研究人员展示了一种新方法——“体内电刺激数据记录”(Data Recording in Vivo by Electrical Stimulation,DRIVES),巧妙融合了DNA与电子技术,通过电信号调节细胞中的氧化还原生物分子和传感器,直接将数字数据从计算机传输到活细胞中。
该研究刊载于《自然化学生物学》(Nature Chemical Biology),主导研究的Harris Wang说,这会引发很多数据存储及更高层次的新应用。电子与生物体直接进行信息交换,可以改变我们分析、存储和交流信息的能力。作为主要的生物信息存储介质,DNA强大的存储能力及稳定性使其逐步走上了数据存储的“新舞台”。
过去十年中,研究人员在DNA数据存储技术上已经取得了一些进展:物理隔离和选择性访问部分数据的存储策略以及优化数据编码及检索的算法进步,极大地提高了DNA信息存储的可扩展性和实用性;加之CRISPR和重组酶技术的不断进步,DNA作为高密度数据存储介质的前景广阔。使用DNA存储数据是提供更高密度存储的关键研究领域。
显然,72位距离现代硬盘的存储容量还有很长的路要走,甚至无细胞的DNA存储技术现在也只以千兆字节为单位。但Wang表示,这仅仅是此观念的证明,为记录仪供电的CRISPR机械效率、能够可靠读取的“传真条”长度、甚至用于编码数据的电子设备都有很大提升空间。“所有这些在未来几年内都会有所改善,我坚信,即使在短期内,也有将系统容量大规模扩展几个数量级的可能。”Wang说。