MIT开发全新DNA信息存储读取技术

作者: ZS

来源: Nature Materials

发布日期: 2021-06-21

MIT的研究团队开发了一种全新的以DNA为基础的信息存储和读取技术,解决了传统硅基存储介质面临的资源枯竭问题,并展示了DNA作为高密度存储介质的潜力。

人类文明的发展离不开信息传递与交互。随着人类文明从狩猎文明到信息文明的转变,信息改变了人们生活的方方面面,甚至影响了人们的生存。而随着互联网技术的快速发展,人类世界的数据信息也在急剧增长。有统计数据显示,目前全世界每天产生的邮件、照片、推文、视频等等数字文件超过250万Gb,而全世界总数字文件更是高达10万亿Gb。

这些数据大多被保存在巨大的数据中心中,一个存储量为10亿Gb的大型数据中心,占地可达数个足球场,建设和维护成本高达10亿美元。

随着5G技术的发展,人类信息存储的需求会更加爆炸,在可预见的未来,基于传统硅基储存介质的储存方式将不可避免地陷入资源枯竭的困境。于是,开发新的储存技术就显得尤为重要。近日,来自美国麻省理工学院生物工程系的Mark Bathe教授带领的研究团队,成功开发出了全新的以DNA为基础的信息存储和读取技术,实现了DNA数据的快速准确检索识别。

简单来说,这一技术首先将数据储存在DNA中,然后将每个数据文件封装在一个直径6微米的二氧化硅颗粒中,并且通过可显示内容的短DNA序列进行标记,通过这些标记,人们可以快速搜索所需的信息。

该研究以“Random access DNA memory using Boolean search in an archival file storage system”为题发表在最新一期的Nature Materials杂志上。对此Bathe教授表示,“我们需要新的方案来解决海量数据的存储问题,DNA的密度实际上比闪存还要高1000倍,理论上一个装满DNA的咖啡杯就可以存储世界上所有的数据。

另一个有趣的点在于,一旦你制造出了DNA聚合物,它就不会再消耗任何能量,我们可以将其永久储存。”

我们都知道,所有信息在计算机中都是借助0和1两种代码存储的,而DNA是由A、T、G、C四种碱基组成的。因此,长期以来就有科学家设想,如果将四种碱基中的A、T表示0,G、C表示1,那么DNA也可以存储信息了。相比于目前常用的以硅基材料为基础的信息存储技术,DNA的特性使其天生就是一种非常理想的存储介质。

首先,DNA非常稳定,合成和测序技术目前非常成熟,操作容易。其次,由于DNA密度较高,其数据存储密度远远超过传统数据存储技术,可存储规模更是远远超出现有最大数据中心的容量。直观来说,1立方厘米的DNA存储的数据信息比一万亿张光盘存储量还多。

然而,目前以DNA为基础的存储技术要想应用到临床还需要解决两个非常重要的问题。

例如DNA存储的成本问题,以目前DNA合成的成本计算,在DNA中存入100万Gb的数据,成本高达1万亿美元。对此,Bathe教授表示,“如果要跟硅基存储竞争,DNA合成的成本需要再下降6个数量级。不过,就像过去几十年间硅基存储价格的大幅降低,DNA合成成本预计在未来20年左右就会降到和硅基存储相当”。除了成本之外,DNA存储所面临的另外一个难题在于,如何从所有存储信息中挑出想要的文件。

作为替代方法,Bathe教授带领的研究团队开发了一种全新的检索技术。该技术首先将每个DNA文件封装到一个直径6微米的二氧化硅颗粒中,每个颗粒最高容量可达1Gb,同时每个二氧化硅颗粒都被标记上与文件内容相关的DNA单链条形码。接下来,研究团队验证了上述方法的可行性,他们将狮子、老虎、猫、狗、香蕉、飞机等等20个不同的图像编码到大约3000个核苷酸长度的DNA片段中,相当于大约100B。

每个文件都标有与“猫”或“飞机”等标签相对应的条形码。

当研究人员想要提取特定图像时,只需添加与他们正在寻找的标签相对应的引物,就能快速找到对应的文件。引物用荧光或磁性粒子标记,便于从样本中读取和识别匹配信息,这种方法允许人们自主删除所需的文件,而不会损坏其他DNA文件。

同时,研究人员使用了来自哈佛医学院Stephen Elledge教授开发的100000个序列库中的单链DNA序列,每个序列长约25个核苷酸。如果在每个DNA文件上放置两个这样的标签,可以对100亿个不同的文件进行唯一不重复标记,如果每个文件上有四个标签,则可以唯一不重复标记1万亿亿个不同的文件。通过这种方法,研究团队实现了每秒1KB的搜索检索速度,目前来看,这一速度仍然太慢。

不过,研究团队表示,目前DNA存储技术比较适合用于存储“冷”数据,也就是保存一些不常访问的数据。目前Bathe教授正在成立一家名为Cache DNA的初创公司,致力于长期存储DNA技术的研究。总的来说,Bathe教授的研究突破了DNA存储技术发展的瓶颈,为DNA存储过程中的信息搜索提供了一种新的解决方案。

未来,随着DNA作为存储介质成本的下降,人类基因测序和其他相关技术的发展,DNA存储技术非常有希望替代传统的硅基存储。

UUID: 20bfaa6b-eed1-4e47-ba8e-905409a3461d

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/学术头条公众号-pdf2txt/学术头条2021年/2021-06-21_一小杯DNA可装下全世界信息,MIT开发全新DNA信息存储读取技术.txt

是否为广告: 否

处理费用: 0.0050 元