未来的数据存储可以在DNA内实现?

中国生物多样性保护与绿色发展基金会  |   2017-08-03 00:00

人类正在以不可思议的速度生产海量数据资料,现有存储技术已难以满足需求。每五年,包括影像资料在内,人类生产的数据总量会增加10倍。当然,不是所有数据都需要存储,但制造商还没有制造出存储够快够多的硬盘、U盘等来保存人们想要留住的材料。既然我们不会停止拍照和录制电影,那我们就需要开发出新方法来保存数据。

微信图片_20170731102608.jpg

(图片来源于网络)

几千年来,大自然进化出一种不可思议的信息储存媒介——DNA,用以储存所有遗传信息以及构建蛋白质蓝图,但是DNA还有更多的用途。DNA容量也比现代存储介质高得多:对于成千上万的DVD数据,一个火柴盒大小的DNA就可以容纳全部。可以存留数千年的DNA也比当今的硬盘驱动器耐用得多(它们只能持续使用几年甚至几十年)。并且,硬盘格式和连接标准经常会过时,但只要生命存在,DNA就永远不会过时。

在DNA中储存数据的构思已经有几十年历史,但最近,哈佛大学和欧洲生物信息学研究所研究表明,现代DNA操作方法的进步终于可以将此想法变成现实。许多研究小组,包括苏黎世联邦理工大学、伊利诺伊大学厄本那香槟分校和哥伦比亚大学都在研究此问题。华盛顿大学和微软的团队拥有从DNA中成功存储和检索数据量的世界记录——200兆字节。

1、将二进位制信息变为原子

传统媒体如硬盘、优盘或光盘存储数据是通过改变磁性、电气或光学性质来储存0和1。

将数据存储在DNA中,概念相同,但过程不同。DNA分子是小分子的长序列,核苷酸:腺嘌呤、胞嘧啶、胸腺嘧啶和鸟嘌呤,通常指定为A、C、T和G。与电子产品储存0和1序列不同,DNA使用核苷酸序列存储信息。

有几种方法可以做到这一点,但总体思路是将数据模式分配给DNA核苷酸。例如,00可以相当于A,01可以相当于C,10可以相当于T,而11可以相当于G。以存储图片来讲,我们首先将其编码为如JPEG的数字文件,该文件在本质上是一长串0和1。比方说,该文件前八位是01111000;如果我们把这个序列打破成两个两个的数字,即01-11-10-00,对应着C-G-T-A。使用这样的序列,我们便可以把数据储存于核苷酸组成的DNA链中。

计算机可以建立非常大的数字文件,甚至是百万兆字节的大型数据库。单个DNA链却短得多,它们只保留大约20个字节。这是因为DNA链越长,化学构健就越困难。

因此,我们需要将数据分解成小块,并在每个序列的位置上添加一指示符。当阅读DNA存储信息时,该指示器将确保所有数据块保持正常的顺序。

现在我们有一个如何存储数据的计划,接下来需要去实践。

2、数据存储

在确定核苷酸字母的排序后,DNA序列会通过化学反应按照一个一个字母进行制造。这些反应是由装在A、C、G和T“瓶子”中的设备驱动。这些瓶子的液体溶液中还混合着其他化学品,以控制指定物理DNA链顺序的反应。

此过程给我们带来了DNA存储的另一个好处:备份副本。DNA链的化学反应不是一次性,而是在每个序列上复制出许多复制品。

一旦DNA链被创造出来,我们就需要保护它们免受潮湿和光的破坏。所以我们需要将它们弄干,放在一容器里,使它们保持在低温、干燥、避光条件下。

3、读取数据

为了从存储的数据中读出信息,我们使用的机器与用于分析细胞基因组DNA的测序机完全相同。这种机器识别分子是将每个分子分解生成字母序列,然后解码成为0和1的二进制序列。这个阅读的过程可能会摧毁DNA,但我们在每个序列中复制出的多个备份就会发挥作用。

而且,如果备份副本被耗尽,也很容易通过复制副本填充存储,就像大自然中一直在进行的DNA复制一样。

目前,大多数DNA检索系统必须要读取存储在特定容器中的所有信息。即使我们只需要少量的信息,DNA检索系统也无法筛选。这就好比只是为找到一封电子邮件,我们需要阅读整个硬盘来搜索目标。目前已经开发出基于生物化学研究方法的检索技术,该技术使我们能够识别和读取用户需要从DNA存储中检索到的特定信息。

4、剩余的挑战

目前,DNA存储仍在实验阶段。在它向大众普及之前,DNA存储必须实现完全自动化,而且构建DNA和阅读DNA的过程必须改进。这些过程都很缓慢,且容易出错。例如,现在的DNA合成技术可以让我们每秒读写几百字节;现代硬盘每秒可以写上百万字节。一张普通的iPhone照片要花几个小时才能储存在DNA中,而只需不到一秒钟的时间就可以将其保存在手机上或转移到电脑上。

这些都是重大、高难度挑战,但科学家们很乐观,因为所有相关的技术正在迅速改进发展。此外,DNA数据存储不需要生物所需要的精确性,未来科研人员可能会发现便宜、快速有效的方法实现在自然界最古老的数据存储系统中储存信息的目的。

原文链接:

https://www.scientificamerican.com/article/storing-data-in-dna-brings-nature-into-the-digital-universe/

原作者:路易斯·西吉(Luis Ceze)教授,卡伦·施特劳斯(Karin Strauss)教授和《美国对话》(The Conversation US)在2017年7月29日发表于《科学美国人》(Scientific American)

译文/Shuya  审/Edward  责编/Angel


来源:中国生物多样性保护与绿色发展基金会

原文链接:http://www.cbcgdf.org/NewsShow/4854/2699.html

版权声明:除非特别注明,本站所载内容来源于互联网、微信公众号等公开渠道,不代表本站观点,仅供参考、交流、公益传播之目的。转载的稿件版权归原作者或机构所有,如有侵权,请联系删除。

电话:(010)86409582

邮箱:kejie@scimall.org.cn