计算机技术论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

  • 欢迎访问 计算机技术论坛-电脑迷与初学者的家园!由于论坛管理严格,新注册会员可能遇到各种问题,无法解决的请发邮件 admin@jsjbbs.cn
查看: 1160|回复: 0

“我,就是数据”时代悄然将至

[复制链接]
发表于 2021-4-7 00:09:10 | 显示全部楼层 |阅读模式
#111723#寰球每年发生的数据须要4180亿个1TB硬盘才干放下,如果把如斯宏大的数据放到DNA上,只要 1kg DNA就够了!近来一家公司将16G的维基百科存储在了一个DNA份子上让人赞叹,DNA存储已成为最受存眷的新兴技巧之一,“我,就是数据”时期行将降临。
“我,就是数据”时期悄悄将至。
在科幻大片《超体》中,“女超人”Lucy凭仗药物的感化,大脑一直被开辟,取得了包含心灵感到、霎时接收常识等技巧。当大脑开辟到100%时,未然到达了“I am everywhere”的至高境地。

Lucy终究化身为超等“U盘”
而现在咱们正处于数据爆炸增加的时期,现存的硬盘、3D内存芯片等数据存储方法未然呈现“负荷太重”的迹象。如果要存储寰球的数据仿佛是一件较为辣手的事件,更不要提做到像Lucy那般集“全宇宙数据于一身”了。
一种新的方法便应运而生——DNA数据存储。
实在,这类实验早就曾经开端了。
客岁岁尾,法国一名16岁高中生Locatelli便将《古兰经》和《圣经》中的部份内容注入到了本人体内。把希伯来语和阿拉伯语的字符转换成DNA碱基的特定组合,而后用购置的病毒编纂到DNA链里,最后用打针器注入本人的大腿(具体内容见文末附录)。
除了这位高中生以外,上周,一家位于波士顿的始创公司Catalog发布,他们将维基百科英文版一共16G的全部文本存储在了一个DNA份子上!

外面就是贮存了16G维基百科的DNA
他们信任生物份子的寿命将比最新的盘算机存储技巧长很多。
16G的维基百科,只要一个DNA份子即可轻松存储
盘算机存储技巧曾经从带磁铁的电线酿成了硬盘,酿成了3D存储芯片。然而下一代存储技巧可能会应用与地球上的性命一样陈旧的方式:DNA。
始创企业Catalog克日发布,维基百科英文版的全部文本都被塞进了咱们身材应用的雷同基因份子中。也就是说,他们将维基百科英文版一共16G的全部文本存储在了一个DNA份子上!
Catalog用它的第一台DNA誊写器实现了这项豪举。

Catalog的DNA写入机能够以每秒4兆比特的速率写入数据,但该公司盼望使其速率最少进步1000倍。
至于说这个DNA誊写器有多大,呃,假如你先把家里的冰箱、烤箱抛弃,再打掉一部份橱柜,这台呆板便可以很轻易地装置在你的屋子里啦(呆板的巨细与一辆古代SUV差未几)。虽然它不太可能很快就将手机的闪存芯片推到一边,但Catalog以为,它对一些须要存档数据的客户曾经很有效了。
DNA链很小,很难治理,然而生物份子能够存储除了把持细胞怎样酿成豌豆动物或黑猩猩的基因之外的其余数据。Catalog应用了比人类DNA短但更多的预制分解DNA链,因而它能够存储更多的数据。
依托DNA而不是最新的高科技小型化装备来存储可能听起来像是发展了一步。然而DNA是严密的,化学上是稳固的,并且由于它是地球生物学的基本,它可能不会像硬盘驱动器或CD那样过期,也不会像软盘驱动器那样消散。
谁在市场上购置这类存储?Catalog有一个配合火伴要发布, Arch Mission基金会正试图将人类常识贮存在不仅是在地球上,乃至在太阳系的其余处所——就像SpaceX发射到轨道上的Elon Musk的Tesla Roadster一样。除此以外,Catalog还未流露其余客户是谁,或许能否会为其DNA写入效劳收费。
该公司在一份申明中说:“咱们正在与当局机构、发生大批测试数据的重要国际迷信名目、石油自然气、媒体和文娱、金融和其余行业的重要公司停止探讨。”
总部位于波士顿的Catalog具有本人的装备,能够在DNA中每秒记载4兆比特的数据。优化的速率应当是以后速率的三倍,让人们在一天内记载125千兆字节——大概相称于高端手机能够存储的容量。
传统的DNA测序产物曾经在生物技巧市场上贩卖,能够读取DNA数据。“咱们以为这一全新的序列技巧用例将有助于(大大)下降本钱,”Catalog以为盘算营业是一个潜伏的宏大市场。
Catalog首席履行官Hyunjun Park和首席技巧翻新官Nathaniel Roquet于2016年创建了这家公司。事先,Park是麻省理工学院的博士后,Roquet是哈佛大学的研讨生。
Catalog应用寻址体系,这象征着客户能够应用大型数据集。即便DNA以长序列存储数据,目次也能够应用份子探针读取存储在任何处所的信息。换句话说,它是一种像硬盘一样的随机存取存储器,而不是像半个世纪前大型盘算机壮盛时代的磁带盘那样的次序存取。
虽然DNA数据可能会被宇宙射线损坏,但Catalog以为它是一种比其余方式更稳固的介质。究竟,咱们有几千年前灭尽植物的DNA。咱们打个赌,你抽屉里的U盘在25年后还会用吗?
DNA存储数据的意思安在?
克日,《迷信美国人》与天下经济论坛结合宣布了2019年寰球十大新兴技巧,此中一项就是用DNA贮存数据。那末,用DNA存储数据的意思安在呢?

据软件公司Domo称,2018年,谷歌每分钟停止388万次搜寻,人们在YouTube上观看了433万个视频,发送了159362760封电子邮件,推特了47.3万次,在Instagram上宣布了49000张照片。
到2020年,寰球人均每秒将发生大概1.7兆字节的数据,假定天下生齿为78亿,这相称于每年约418个zettabytes。这么多的数据假如放在容量为1TB的硬盘上,须要4180亿个硬盘才干放下!
假如是如许的话,现在的数据存储体系通撑不外一个世纪。另外,运转数据核心须要耗费大批的能量。简而言之,咱们将面对一个重大的数据存储成绩,跟着时光的推移,这个成绩将变得愈加重大!
因而,硬盘存储的一种替换计划——基于DNA的数据存储才显得尤其主要。由核苷酸A,T,C和G的长链构成的DNA是性命的信息存储资料。数据能够依照这些字母的次序存储,从而将DNA改变为一种新的信息技巧情势。
它曾经过惯例排序(读取),分解(写入)而且能够轻松正确地复制。DNA也长短常稳固的,正如生涯在50多万年前的化石马的完全基因组测序所证实的那样,存储它不须要太多能量。
然而,DNA的存储容量是让人惊奇的。DNA能够以远超越电子装备的密度准确存储大批数据。比方,依据哈佛大学George Church及其共事于2016年宣布在“Nature Materials”杂志上的盘算,简略的大肠杆菌的存储密度约为每立方厘米1019比特。
在如许的密度下,一个边长约一米的DNA立方体能够很好地满意全天下一年的数据贮存需要,换个维度讲,1kg DNA就能贮存寰球数据。

寰球数据只要1kgDNA就能贮存
DNA数据存储的远景不但仅是实践上的。比方,2017年,哈佛大学的Church小组采取CRISPR DNA编纂技巧,将人手的图象记载到大肠杆菌的基因组中,并以高于90%的正确率读出。华盛顿大学和微软研讨院的研讨职员曾经开辟出一个完整主动化的体系,用于编写、存储和读取DNA编码的数据。包含微软和Twist Bioscience在内的一些公司正在努力于推动DNA存储技巧。
与此同时,DNA曾经被研讨职员用来以差别的方法治理数据,这些研讨职员尽力处置海量的数据。新一代测序技巧的最新停顿使得数十亿个DNA序列能够轻松同时读取。有了这类才能,研讨职员能够应用DNA序列的条形码作为份子辨认“标签”,以跟踪试验成果。DNA条形码正被用于大大放慢化学工程、资料迷信和纳米技巧等范畴的研讨步调。比方,在佐治亚理工学院,James E. Dahlman的试验室正在敏捷肯定更保险的基因疗法;其余人正在研讨怎样抗衡耐药性和避免癌症转移。
使DNA数据存储变得通用的挑衅之一是读取和写入DNA的本钱和速率,假如要与电子存储竞争,则须要进一步下降这些本钱和速率。即便DNA没有成为一种无所不在的存储资料,它几近确定会被用来以全新的方法天生信息,并临时保留某些范例的数据。
DNA可能存储数据,能否也可遗传?
前未几,新智元报导了一篇文章——顶级学术期刊《CELL》同日持续宣布两篇重磅文章,研讨职员在对线虫的研讨中发明,影象能够被遗传,乃至延续3-4代!
在2016年的SXSW大会上,南加州大学教学Theodore Berger发布了一个惊动全部科技界的新闻:
在对山公、老鼠的试验中,通过天然海马体实现了短时影象向临时贮存影象“几近完善”的转换,这项技巧能够实现对人脑影象的备份,并复制到其余人的大脑中。
这就象征着影象有可能“遗传”给后辈。
而克日,爱思惟尔(Elsevier)出书公司旗下的细胞出书社(Cell Press)杂志《CELL》同日宣布了两篇重磅文章——影象竟然真的能够遗传!

文章地点:
https://www.cell.com/cell/fulltext/S0092-8674(19)30448-9

文章地点:
https://www.cell.com/cell/fulltext/S0092-8674(19)30552-5
这两项重磅的研讨成果标明:最少在线虫(C.elegans)如许的生物中,影象能够被遗传,且能够保持3-4代。可谓推翻认知!
影象的遗传,或是另一种“长生”?
纵观汗青,有有数人在寻觅着长生不死的方法——他们或修炼本人的精力天下,或告急于丹药、或建筑雄伟的寝陵,想以此实现精力的连续和永存,但无一成真。
明天,咱们借助迷信发明,人们对“长生”的研讨也一直在延续着。
新智元此前报导过《Nature重磅封面:回生殒命大脑!》——耶鲁大学的最新研讨标明,猪大脑在殒命4小时后胜利回生,并保持了最少6小时。
这项研讨掀起了一波品德伦理的言论海潮,有人担忧这能否就会是僵尸启发录的开端;但同时另有人以为,让一些巨人的大脑回生,实现认识和影象的“长生”,将存在严重的意思。

而此次迷信家们的发明堪称是推翻了咱们的认知。
本来信息居然能够通过神经代代相传,加上此次DNA能够存储海量数据,不晓得这是不是另一种“长生”的方法呢?
附:16岁高中将《古兰经》和《圣经》注入体内
客岁岁尾,法国一名16岁高中生Locatelli将《古兰经》和《圣经》中的部份内容注入到了本人体内。他将文本转换成了DNA,并打针到了本人的大腿上。

12月3日,他还将这项试验的文章宣布到了Open Science Framwork(OSF)上。

论文地点:
https://osf.io/yj8xw/
从逻辑下去讲,这项豪举并不难。Locatelli起首用一个基础的体系将文本翻译为形成DNA的核酸。
在圣经《创世纪》中,他将22个希伯来字母转换成四种可能的核酸:胞嘧啶、胸腺嘧啶、鸟嘌呤或腺嘌呤。胞嘧啶和胸腺嘧啶分辨代表五个字母,鸟嘌呤和腺嘌呤分辨代表六个字母。

这张表是从《古兰经》的自力(isolated)字母中吸取灵感而开辟的
在阿拉伯语文本中,Locatelli去掉了28个字母中的5个,并给了此中3个奇特的核酸,容许Ra和Sad同享胸腺嘧啶。在这两种情形下,Locatelli都疏忽空格、标点标记和变音标记。

这张表的灵感来自希伯来字母和DNA暗码表
而后,他分辨从VectorBuilder和ProteoGenix公司购置了定制的DNA链,以及用于将新DNA拔出细胞的良性病毒。他买了一些心理盐水和打针器就动身去加入了竞赛。打针后,他只呈现了稍微的过敏反映。
Locatelli说:“我做这个试验是为了宗教和迷信之间战争的意味。”
然而,加州大学洛杉矶分校的生物化学家Sriram Kosuri表现,他不能肯定Locatelli的方式能否真的无效;没法评价病毒载体能否胜利地将分解的DNA导入了Locatelli细胞。
这位少年的研讨确切标明,在DNA中存储任何范例的信息并不是一件很难的事件。这是一种十分高效的存储方法,这就是为甚么迷信家们始终把它看做是在紧凑空间中保险存储大批数据的一种方法。
到现在为止,虽然生物技巧公司正在竞相寻觅更廉价的方式,但制作用于数据存储的分解DNA的本钱高得使人望而却步。
固然,贸易存储的目的是可能将其转换回可用的信息。从实践上讲,假如新的DNA被准确地植入Locatelli的细胞中,细胞会像他本人的DNA一样复制,也就是说他本人停止了基因编纂,那末基于文本的DNA便可以被翻译成文本。
但是,这可能并没有产生。最早进的医学研讨刚刚开端开辟基因疗法。即便人工分解的DNA被保留上去,最初的文本转换也十分不准确,很难重现实在的文本。
更多内容阅读推荐:洗衣机门打不开是怎么回事
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

无图版|手机版|计算机技术论坛 JSJBBS.CN @ 2008-2024 ( 鲁ICP备17021708号 )

技术支持 : 北京康盛新创科技有限责任公司

快速回复 返回顶部 返回列表