有了 DNA 存儲(chǔ)技術(shù),我們?nèi)梭w就是“云硬盤(pán)”
DNA 存儲(chǔ)技術(shù):并非首創(chuàng)
其實(shí) DNA 儲(chǔ)存技術(shù)早已有人在做了。2012 年,哈佛大學(xué)研究人員用 DNA 儲(chǔ)存了一本五萬(wàn)字的圖書(shū)。歐洲生物信息研究所(European Bioinformatics Institute )也在 DNA 儲(chǔ)存了莎士比亞的十四行詩(shī)以及馬丁?路德?金的演講《我有一個(gè)夢(mèng)想》的錄音帶。
突破性進(jìn)展:存儲(chǔ)效率大幅提升
盡管不是首創(chuàng),但是,這項(xiàng) DNA 存儲(chǔ)技術(shù)目前迎來(lái)了重大突破。研究員 Erlich 是該研究報(bào)告的作者之一,他表示:這是因?yàn)檫\(yùn)用了一種編碼技術(shù),能讓 DNA 存儲(chǔ)效率提升 60%,還能有效減小 DNA 存儲(chǔ)過(guò)程中的出錯(cuò)率。他在美國(guó)哥倫比亞大學(xué)擔(dān)任計(jì)算機(jī)科學(xué)系教授,同時(shí)也是紐約基因組中心(New York Genome Center)的核心成員。
“把數(shù)據(jù)輸入 DNA 只需要不到一秒鐘。DNA 說(shuō)白了只不過(guò)是四種核苷酸(nucleotides)排列組合的結(jié)果。我們只需要把這些核苷酸和數(shù)據(jù)一一對(duì)應(yīng)。”研究員 Erlich 說(shuō),一旦掌握了編碼方法,或者找到了符合編排或數(shù)據(jù)輸入要求的 DNA,那接下來(lái)的工作就很輕松了。這是因?yàn)?,可以由企業(yè)來(lái)負(fù)責(zé) DNA 的實(shí)際制造過(guò)程。
獨(dú)特魅力“這么做,是為了激發(fā)人們的想象力嗎?沒(méi)錯(cuò)!就是想讓人們感受到科學(xué)有趣的一面!”DNA 具有密度大、穩(wěn)定性高的優(yōu)勢(shì),因此 DNA 儲(chǔ)存技術(shù)仍然比新興的同類(lèi)技術(shù)更讓科學(xué)家著迷。研究員 Kosuri 說(shuō):“DNA 儲(chǔ)存技術(shù)所涉及的難度,相當(dāng)于把單個(gè)原子放在一個(gè)物體表面?!?他指的是 IBM 公司,該公司曾在 1989 成功用 35 個(gè)氙原子拼出了“IBM”的字樣。
他說(shuō):“排列原子也不是不可能的事,但必須要運(yùn)用極高的成像技術(shù),在接近于絕對(duì)零度的真空狀態(tài)下才能完成。這就涉及到核心技術(shù)了。相比之下,我們的 DNA 技術(shù)要比它更實(shí)用,雖然在存儲(chǔ)方面肯定沒(méi)有軟盤(pán)或 U 盤(pán)那么實(shí)用。”
DNA 還可以?xún)?chǔ)存 3D 影像。雖然全息存儲(chǔ)(holography memory)和賽道儲(chǔ)存(racetrack memory )技術(shù)也可以做到,但是研究員 Kosuri 說(shuō),DNA 技術(shù)能儲(chǔ)存的密度比它們要高得多。
克服技術(shù)難點(diǎn)
但是,DNA 的合成過(guò)程是非常艱辛的。研究員 Kosuri 表示:“難就難在,DNA 合成過(guò)程中,約有 5% 的時(shí)間,會(huì)損失掉隨機(jī)合成的一個(gè) DNA。而且,不僅合成困難,就連讀取 DNA 也是一個(gè)問(wèn)題。如果有一種編碼技術(shù)能夠避免這種損失,那么 DNA 存儲(chǔ)技術(shù)就會(huì)變得簡(jiǎn)單得多,也利索得多?!?
美國(guó)《科學(xué)》雜志發(fā)布的這項(xiàng)研究,的確實(shí)現(xiàn)了這種編碼技術(shù)。研究員 Kosuri 表示,這項(xiàng)技術(shù)可以讓 DNA 合成過(guò)程中出現(xiàn)的失誤容易讓人接受。這要?dú)w功于一種特殊的編碼技術(shù),而用這項(xiàng)技術(shù)傳送數(shù)字信息,通常能夠適應(yīng)連接中斷的情況發(fā)生,比如在智能手機(jī)上播放 Youtube 視頻。Erlich 表示,這就意味著,這種編碼技術(shù)能夠處理那些比研究中使用的 DNA 質(zhì)量低得多的 DNA。
研究員 Kosuri 沒(méi)有參與該項(xiàng)研究,但他是上述 2012 年哈佛大學(xué)研究報(bào)告的第一作者,如今是加利福尼亞大學(xué)洛杉磯分校(UCLA)的一名生物化學(xué)教授。
蘇黎世聯(lián)邦理工學(xué)院化學(xué)工程師 Grass 也參與了這項(xiàng)研究,他表示,研究團(tuán)隊(duì)成功地在 DNA 中存儲(chǔ)并且恢復(fù)了一個(gè)操作系統(tǒng),是個(gè)“優(yōu)雅的成就”。他還說(shuō):“我每天都在‘使用’DNA,所以我明白這項(xiàng)工程必須要萬(wàn)無(wú)一失?!?Erlich 表示,他們是故意把那個(gè)操作系統(tǒng)放進(jìn) DNA 的。”如果不把文件完美地恢復(fù),那么就可能會(huì)損毀某些內(nèi)容。但我們就是要證明我們不怕把這種可能會(huì)損毀的內(nèi)容放進(jìn) DNA?!?
Kosuri 也同意這種方法十分高效:“我認(rèn)為他們采用了正確的實(shí)驗(yàn)測(cè)試算法。他們選對(duì)了算法,而且看起來(lái)很奏效?!?
成本巨大
在化學(xué)工程師 Grass 看來(lái),合成 DNA 的成本比編排 DNA 的成本還要大。他說(shuō):“雖然編排 DNA 的成本太高,無(wú)法實(shí)際應(yīng)用,不過(guò)現(xiàn)在有了納米微孔 (nanopore) 插入計(jì)算機(jī)進(jìn)行 DNA 編排的技術(shù),所以它的成本越來(lái)越小了。但是,合成 DNA 的成本仍然十分之高?!?
研究員 Kosuri 也表示:“DNA 儲(chǔ)存技術(shù)規(guī)模化應(yīng)用的唯一阻礙就是,它的成本實(shí)在是太高了。關(guān)于編碼、編碼的工作方式以及這種編碼是否可靠等種種問(wèn)題,我們的研究報(bào)告都一一解答了。但是,唯獨(dú)成本問(wèn)題,是我們目前解決不了的。”
Grass 認(rèn)為,要想讓 DNA 能夠儲(chǔ)存信息長(zhǎng)達(dá)數(shù)百年之久,就必須要采用另外一些手段把 DNA 固定住。他解釋道,基因物質(zhì)可以在動(dòng)物骨頭和動(dòng)植物化石中固定保存,但是自由 DNA 卻不一樣,具有不穩(wěn)定性。如果把它放在實(shí)驗(yàn)室,一年以后里面的信息就會(huì)開(kāi)始損毀了。
前景:依然明朗
研究員 Kosuri 已經(jīng)不再?gòu)氖?DNA 儲(chǔ)存技術(shù)研究,但是他本人對(duì)這項(xiàng)技術(shù)的發(fā)展還是持樂(lè)觀態(tài)度。他說(shuō):“上百萬(wàn)倍的成本聽(tīng)起來(lái)很?chē)樔?,但是在過(guò)去的 15 年,我們已經(jīng)把成本縮小為原來(lái)的上百萬(wàn)分之一了?,F(xiàn)在,不僅僅是編排 DNA,就連合成 DNA 的成本也已經(jīng)有所下降?!?
研究員 Erlich 憧憬在未來(lái),有人可以發(fā)明一種“專(zhuān)門(mén)用于 DNA 存儲(chǔ)的工序,方便我們快速合成劣質(zhì) DNA”,從而減少成本。他說(shuō):“我們可以質(zhì)量參差不齊的 DNA 先提取出來(lái),然后再根據(jù)編碼方式來(lái)逐步對(duì)其進(jìn)行糾正。這是我們未來(lái)的研究方向”
目前的研究是一個(gè)良好的開(kāi)端。研究員已經(jīng)在 DNA 存儲(chǔ)了許多內(nèi)容,它們能靈敏地減少存儲(chǔ)錯(cuò)誤,其中包括:一個(gè)操作系統(tǒng)、一個(gè)電腦病毒、一張價(jià)值 50 美元的亞馬遜禮品購(gòu)物卡、1895 年于法國(guó)上映的世界上第一部電影《火車(chē)到站》(Arrival of a train at La Ciotat)、航天飛行器“先驅(qū)者”(Pionner)的一塊載有人類(lèi)訊息的鍍金鋁板以及美國(guó)數(shù)學(xué)家、信息論的創(chuàng)始人克勞德?艾爾伍德?香農(nóng)(Claude Elwood Shannon)于 1948 年發(fā)表的一篇研究報(bào)告。
研究員 Erlich 說(shuō):“有人問(wèn)我,‘你怎么能夠把視頻存進(jìn) DNA 呢?’ 這也是我要向我 6 歲小兒子解釋的問(wèn)題。”
文章轉(zhuǎn)自生物探索
- 上一篇:CRISPR篩選發(fā)現(xiàn)非編碼DNA的調(diào)控功能 2017/4/11
- 下一篇:4.11帕金森日| 威脅中老年人的“第三殺手”,提高認(rèn)知度很關(guān)鍵 2017/4/11