您要打印的文件是:DNA 是否可以存储除了遗传信息以外的复杂信息?目前有哪些技术难点?

DNA 是否可以存储除了遗传信息以外的复杂信息?目前有哪些技术难点?

作者:佚名    转贴自:https://www.zhihu.com/question/532951888/answer/2517091001    点击数:29


DNA 是否可以存储除了遗传信息以外的复杂信息?目前有哪些技术难点?

鹿吃蛋挞​
中国科学技术大学 生物学博士

一、DNA是一套4进制信息存储系统
我们都知道,目前最常用的电脑系统的信息存储是基于二进制的 0和1。这里的0和1并不是真实的“0”和“1”,而只是用于指代两种不同的状态。存储介质的每个信息存储位的状态只有两种可能,只要我们约定好信息的编码方式,我们可以将几乎任何信息转变为由0和1组成的字符串。


网络图片:字母的二进制编码
而DNA包含A、C、G、T四种碱基(可以忽略表观修饰),因此我们可以认为DNA是一种 4 进制的信息存储系统,我们也可以将 A、C、G、T 看作 0、1、2、3。同样地,只要我们实现约定好编码方式,我们就可以将几乎任何信息写入到DNA中。
DOI:10.3390/polym10010028


二、DNA存储的优劣势及原因:
优势1、信息密度:理论上每个存储位的状态越多,其所能存储的信息也就越多、信息密度也就越高,所以DNA的信息密度理论上将远高于现有的磁介质。据专家预测,1 克的 DNA 可存储 2.15 亿千兆字节的数据,重量不到一块方糖的 DNA 可存储世界上所有的电影,而一辆两座厢式货车大小的 DNA 可容纳世界上产生的所有数据。
优势2、DNA稳定性好:如果用生物作为存储仓库,一般情况下的突变率非常低(百万分之一),所以DNA存储介质的稳定性较好。如果冷冻在永久冻土中,可保存 150 万年左右,也就是说DNA作为存储介质的使用寿命可达数千年甚至数百万年。而我们常用的存储介质一般在使用 10 年内就必须更新替换。
优势3、容错率高:DNA可以同时存在于大量的微生物体内,相当于每份信息都有许多拷贝,所以我们几乎不用担心信息丢失。
优势4、DNA长期存储成本低:鉴于DNA是生物的天然遗传物质,只要将DNA写入到生物体中,就可以几乎成千上万年地传递和存储下去,而几乎不用付出维护成本。即便人类文明毁灭,这些信息仍然可以轻轻松松地遗传下去。
劣势1、存储和读取慢:DNA的存储方式在某种程度上有点像磁带,即只能线性读取,所以可以预期DNA的存储和读取速度会比较慢;
网络图片
劣势2:存储和读取贵:要将编码信息的DNA导入生物体内病稳定遗传,相关操作和技术要求较高;而要读取DNA信息大概率需要通过高通量测序或者纳米孔测序技术,目前看其成本都不会低;
劣势3:(几乎)不能随机存取:似乎不需要解释,也似乎不那么重要。因为我们可能只会用DNA作长期存储介质,所以压根就不需要随机读取DNA的信息。
劣势4:信息丢失的偏倚性:如果要依赖生物体系对信息进行存储,那么显然不是所有的信息都能被稳定保持和遗传的。因为某些DNA序列可能会导致寄存生物的死亡。


三、面对的困难和挑战:
根据上面列出的劣势,就大概可以知道DNA存储面对的挑战了。目前难度最大的点,仍然是大规模的DNA操纵问题,主要需要解决的方面包括:降低大规模DNA操纵的成本、提高速度和准确性。
例如,目前合成存储 2MB 数据的DNA的成本大约为 7,000 美元,而读取数据又需要花费大约 2,000 美元。因此,要使用 DNA 作为介质来读取、写入、封装和存储数据,就需要大幅降低成本。
此外,目前合成 DNA 的错误率仍然较高,对于信息的准确和长期保存来说这也是巨大的挑战。