尽管数据存储技术近几十年内发生了翻天覆地的变化,但这种进步的速度,还是赶不上当今互联网时代的数据产生速度,您有没有觉得智能手机的空间老不够用?曾经有人预测,到2020年,全世界所有数据的总量将达到4.4×1013GB,如果全用平板电脑存储,摞起来的高度,可以从地球到月球六趟还多(http://www.emc.com/infographics/digital-universe-2014.htm )。
图片来源:EMC2
我们都知道DNA保存着物种的遗传信息,因此也可以看作是一种特殊的数据载体。实际上,DNA也是一种相当高效的数据载体,所能存储的信息密度比现有的数据存储技术高好几百万倍,无论是磁存储技术还是光存储技术;而且DNA分子的稳定性也比现有存储载体高得多。那么,能否用DNA这种遗传信息载体来存储电子邮件、宝宝照片、高清视频呢?
答案当然是“可以”。最近,微软(Microsoft)的工程师Karin Strauss和美国华盛顿大学的科学家Georg Seelig、Luis Ceze等人成功实现了用DNA存取数码图片。他们用无损的方式将数码图片编码成DNA的碱基序列存储在DNA中,并且随后还可以完整地读取这些信息,重新生成数码图片。他们的研究论文公布在4月美国亚特兰大的一个国际会议(ACM International Conference on Architectural Support for Programming Languages and Operating Systems)上。
文中所存储和读取的数码图片。图片来源:University of Washington
该团队首先开发了一个全新的方法,将数码图片背后的大串1和0数据转换成DNA的四个基本碱基:腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)。“你怎么将1和0变成A、T、G、C真的很重要,因为如果你使用一个聪明的做法,你可以把它排列得非常密集,并且不会出太多错误,” Seelig解释说,“如果你做得不对,就会产生很多错误。”幸运的是,科学家们找到了办法,他们将数码图片的数据分割成许多小段,转换成DNA信息后,通过合成大量的DNA分子而存储起来。
更具挑战性的是后续的读取信息步骤,这时不能有任何错误,否则信息就不完整。他们的策略是在上一步的合成过程中给DNA加入类似邮政编码或地址的信息,读取时,通过搜索这些“邮政编码”信息来确定该DNA分子是否是目标DNA分子。再通过DNA测序技术,确定目标DNA分子的碱基序列,再解码成大串的1和0数据,最终重新生成数码图片。
DNA存储和读取数据的原理示意图。图片来源:University of Washington
如果这一方法能被实际运用,那么就意味着百度、腾讯和阿里巴巴这样的公司正在使用的大型数据中心的谢幕。研究人员通过计算估计,如今需要一栋楼大小的数据中心才能存储的文件,仅仅方糖大小的DNA材料就能够全部容纳。
试管底部的一点点DNA就可以存储10 TB的数据(相当于600多部智能手机的容量)。图片来源:University of Washington
但是,这种方法目前也面临不少问题。首先,成本高,需要昂贵的实验室设备;其次,数据存取速度慢,合成DNA分子以及DNA分子测序,都需要不少时间。这意味着这一技术可能更适合大量数据的存档,而不是日常所需的快速存储和读取。
不管怎样,这种技术为人类利用生物材料改造数据存储设备提供了崭新的思路,也许以后我们的每一个细胞都可以作为大容量的“硬盘”,可以完整地存放所有高清视频、高清照片而不用再担心存储空间不够了。
2. https://homes.cs.washington.edu/~luisceze/publications/dnastorage-asplos16.pdf
如果篇首注明了授权来源,任何转载需获得来源方的许可!如果篇首未特别注明出处,本文版权属于 X-MOL ( x-mol.com ), 未经许可,谢绝转载!