全世界每天产生的数据比以往任何时候都多。国际数据公司预测,全球数据存储需求将从 2020 年的 33 泽字节增加到 2025 年的 175 泽字节,这一数字远远超出目前可用方法的存储容量。这个不断增长的数字,加上维护和传输数据的成本和能源需求,需要新的解决方案。
自1950 年代以来,人们一直在考虑使用 DNA 作为存储数据的方法的前景。DNA 是一种分子,它存储着创造我们人类所需的所有指令。包含很多信息,我们在身体的每个细胞中都保存有所有这些信息的副本。BG大游娱乐平台
在生物细胞中,DNA 包含四种核酸碱基,腺嘌呤 (A)、BG大游娱乐平台胸腺嘧啶 (T)、鸟嘌呤 (G) 和胞嘧啶 (C),它们以不同的组合串在一起形成基因。基因被转录并翻译成蛋白质,这是我们细胞的功能“主力”。
在计算机中,信息存储为二进制数字或“位”,即 1 和 0。当以特定顺序读取这些位时,它们可以用作代码来指示要执行的程序。基于 DNA 的数据存储的总体目标是对合成的 DNA 链进行二进制数据的编码和解码。
虽然该领域具有巨大的潜力,但目前与体外相关的缺点DNA的合成限制了其大规模应用。与固态硬盘驱动器等其他存储技术相比,最先进的 DNA 化学合成是昂贵的。
西北大学的 Tyo 及其同事开发了一种新的体外方法,用于将信息记录到 DNA 中,该方法依赖于酶促系统。该方法使用 TdT 进行局部环境信号的时间敏感非模板记录或 TURTLES,发表在美国化学学会杂志上。
我们一直致力于将 DNA 作为存储介质进行工程设计。很长一段时间以来,通过对最常见的复制 DNA 的 DNA 聚合酶的研究。我们意识到这种类型的复制聚合酶可以停滞相对较长的时间,并且数据存储是不可接受的。相反,我们开始研究非复制性 DNA 聚合酶,并找到了一种具有完全正确特性的聚合酶。
DNA 聚合酶称为末端脱氧核苷酸转移酶或 TdT,将核苷酸碱基添加到单链 DNA 的 3-末端。其选择性可以根据细胞的生理条件和环境来表征。额外的链接被顺序添加到 [DNA 链] 的一端。
当一种化学物质,例如钴存在时,添加的 DNA 往往具有更多的 As 和更少的 G。当不存在钴时,反之亦然。因此,当我们允许在钴存在时添加链接时,我们记录为 1,而当钴不存在时,我们记录为 0。稍后读取 DNA 以解码信息时,如果一个区域存在大量 A 碱基,则记录为 1。如果存在大量 G 碱基,则记录为 0。
这样,随着环境的变化,正在合成的 DNA 链的组成也会发生变化。核苷酸掺入的平均速率也可以用作“时间戳”,以准确指示环境变化发生的时间。我们设计 TdT 以在存在生理相关浓度的钙时变构关闭。我们使用这种工程化的 TdT 与参考 TdT 协同开发能够记录 Ca 2+单步变化的双聚合酶系统在 60 分钟的时间内,在一分钟内发出信号。
当被问及该方法与化学合成 DNA 的速度相比如何时,化学 DNA 合成的工作原理是将 DNA 连接到一个表面,需要按顺序添加化学物质,然后在添加下一种化学物质之前将它们洗掉。这个洗涤步骤会造成缓慢。我们的方法不需要洗涤步骤,而是将所有用于 DNA 合成的试剂留在混合物中,并且 DNA 聚合酶的特性被可逆地调节。
该研究是原理演示的证明,该团队能够在一小时内报告多达 3/8 字节。这里有扩大规模的潜力,一张数字图片有数百万个字节,读取和写入硬盘只需要几分之一秒的时间。数百万条 DNA 链的并行化将允许更多和更快的数据存储,但我们将解决技术障碍,以增加字节数并缩短一条 DNA 链的记录时间。
对于有朝一日可以让我们同时研究数百万细胞之间相互作用的方法,这是一个非常令人兴奋的概念证明。我认为之前没有任何报道过的直接酶调节记录系统。
Tyo 及其同事希望全球其他研究团队能够为该技术做出贡献,以使其成为可行的商业化概念。谁知道呢,也许如果他们想出一些非常好的东西,他们可以给我们发一封信,解释他们对一条 DNA 链所做的事情!
1300%!百万次!美国开发出首个“热晶体管”,可作热开关登Science
新一代国产CPU——龙芯3A6000在京发布,性能达到国际主流产品水平
1300%!百万次!美国开发出首个“热晶体管”,可作热开关登Science
1300%!百万次!美国开发出首个“热晶体管”,可作热开关登Science