作者:尤冠景/有勁基因
網路和智慧型手機發展至今,已經改變了許多人日常生活和工作的模式;大家現在經常會在社群網站上用文字、照片、影片無國界地與人交流,也已經習慣把重要檔案上傳至雲端備份。網路雲端的硬體容量好似無窮無盡;然而,真是這樣嗎?
全球近年的網路數據量成指數性成長,2018年時是33 ZB,預估到2025年將達到175 ZB1。儲存數據用的藍光光碟及硬碟雖然仍繼續快速發展,但也開始接近目前技術的資料密度極限2,有一天或許就會因為硬體容量極限的問題,使得網路不再便利,同時硬碟實體耗材佔據空間越來越大也會造成麻煩。於是科學家們開始尋找新的資訊儲存方法,而生物體內的超級資訊記憶分子⼀DNA,便是其中一個開發目標。
生物學期刊龍頭Nature曾報導過細菌DNA可記憶的資料密度是一般硬碟的一百萬倍(如表一所示)3;而人類細胞的基因體帶有約30億個鹼基對,可見其在資料儲存上的實力雄厚。該篇Nature報導中,受訪者IAPRA(Intelligence Advanced Research Projects Activity)的電腦科學家David Markowitz表示:如果資訊能夠像大腸桿菌基因一樣被緊密排列,那麼大約只需要1公斤的DNA就可以儲存全世界的資料量。除此之外,DNA的穩定性絕佳;一般硬碟壽命不超過10年,但DNA不一樣,連存在古代生物遺骸上的都有機會被鑑定到。在次世代定序技術成熟、價格又下降的現在,大量定序的需求越來越多,DNA作為記憶載體的這個點子,因此獲得了高度關注。
表一、細菌DNA資訊儲存與現有儲存科技的比較
由表格可知 ,細菌DNA在資料儲存方面的讀寫速度仍遠遠不如硬碟(Hard disk)及快閃記憶體(Flash memory),但相較於現有科技,其在資料保存期限(Data retention)、耗能(Power usage)以及資料密度(Data density)方面,表現都十分傑出。(圖片來源:Extance, A. Nature. 2016 Sep;537(7618):22-24.)
然而,DNA的高度穩定性對資料儲存來說,也會造成困擾,那就是:資料一旦存進去就很難刪除,除非把DNA給分解掉;倘若遇到需要銷毀機密資料的情況,就只有進實驗室才有可能做到。而分解DNA的方法,例如加入DNA分解酵素(DNase)、照射紫外燈、加溫達200度以上、加入漂白水等等,都需要用到特別的儀器或試劑才能做到。因此為了方便刪除DNA中儲存的資料,有研究團隊建議可以利用兩種不同的DNA雜合體(Hybrid DNA),在不分解DNA的前提下將資料刪除4,如下圖一所示。
在資料儲存時,除了儲存資料的DNA序列(圖一帶有藍色message訊息的DNA序列)之外,會再添入一個帶有雜訊的DNA序列(圖一帶有褐色noise雜訊的DNA序列);然後將這兩個DNA序列分別跟Truth marker、和False marker兩種序列進行配對產生兩種Hybrid DNA (圖一左),之後再將這兩種Hybrid DNA混合一起(圖一右上)。Truth marker與False marker所能配對的序列(B序列)雖然是一樣的,不過,由於False marker的尾端序列有做過化學修飾,因此在進行聚合反應時,DNA聚合酶無法在其上作用,只有帶著Truth marker及message訊息資料的DNA序列可以被正確增幅放大並被定序出來(圖一右下)。
圖一、Hybrid DNA系統示意圖
圖片來源:Kim, J., Bae, J.H., Baym, M., & Zhang, D.Y. Nat Commun. 2020 Oct;11(1):5008-5015.
如果想刪除儲存在DNA上的資料,只需加熱DNA至95度、5分鐘,就可以將DNA與marker分開(詳見圖二)。當溫度下降到可以重新配對時,因為Truth marker與False marker配對序列完全一樣,所以會出現四種配對可能(圖二右);有些帶著message訊息資料的DNA會因為與False marker結合,而無法被讀取,同時也會有部分帶著noise雜訊序列的DNA序列會因為與Truth marker結合,反而被讀取出來。這麼一來,原始儲存的資料就無法被解讀,進而達到資料消除的目的。
圖二、Hybrid DNA系統資料刪除原理
圖片來源:Kim, J., Bae, J.H., Baym, M., & Zhang, D.Y. Nat Commun. 2020 Oct;11(1):5008-5015.
這個研究團隊4還實測了DNA資料儲存的保存期限,指出資訊在攝氏25度的環境下儲存65天後,還可以經定序正確還原出99.21 %的資料,並推算出此套Hybrid DNA系統在攝氏25度下的資訊半衰期長達15年。他們在比較了不同溫度半衰期圖型的位移後,指出若是能儲存在更低的溫度,如攝氏4度,半衰期還可能再延長100倍。至於資料刪除的效果,在加熱達95度5分鐘後,只剩下4.79 %的資料可以被正確讀取出來(如圖三所示)。
圖三、綜觀整套hybrid DNA系統
圖片來源:Kim, J., Bae, J.H., Baym, M., & Zhang, D.Y. Nat Commun. 2020 Oct;11(1):5008-5015.
目前想將DNA硬碟順利上市,其實仍有許多問題需要克服,包括:讀寫速度太慢、合成及定序價格太高、發展全自動系統難度高等等;不過,當然還是有公司如微軟、新創企業Catalog、DNA合成大廠Twist Bioscience等持續投入資金在這項潛力技術的研發上,且全球各研究單位也一直有相關論文產出。或許真的有那麼一天,記憶容量不夠又佔位子的硬碟會被捨棄,改用生物DNA作為資料儲存的載體。
參考文獻
1. Reisel, D., Gantz, J. & Rydning, J. (2018). The Digitization of the World- From Edge to Core. In Data Age 2025: An International Data Corporation (IDC) White Paper- #US44413318. Retrieved from seagate.com https://www.seagate.com/files/www-content/our-story/trends/files/idc-seagate-dataage-whitepaper.pdf
2. Ceze, L., Nivala, J., & Strauss, K. Molecular digital data storage using DNA. Nat Rev Genet. 2019 May;20(8):456-466. https://doi.org/10.1038/s41576-019-0125-3
3. Extance, A. How DNA could store all the world's data. Nature. 2016 Sep;537(7618):22-24. https://doi.org/10.1038/537022a
4. Kim, J., Bae, J.H., Baym, M., & Zhang, D.Y. Metastable hybridization-based DNA information storage to allow rapid and permanent erasure. Nat Commun. 2020 Oct;11(1):5008-5015. https://doi.org/10.1038/s41467-020-18842-6
留言列表