在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

使用DNA在現(xiàn)實世界中存儲數(shù)據(jù)

DPVg_AI_era ? 來源:YXQ ? 2019-08-01 15:29 ? 次閱讀

相比傳統(tǒng)的數(shù)據(jù)儲存方式,DNA存儲具有占用空間小、獲取容易、儲存時間長3大優(yōu)勢,但也面臨存儲速度慢、花費高的弊端。隨著技術的不斷成熟,它真的能成為主流嗎?

全球每年產(chǎn)生的數(shù)據(jù)需要4180億個1TB硬盤才能放下,若是把如此龐大的數(shù)據(jù)放到DNA上,只需 1kg DNA就夠了!DNA存儲才是未來!

幾年前,甚至研究人員也不愿使用DNA來存儲數(shù)據(jù),因為這看起來過于科幻,并沒有任何實用價值。今天,我們可以使用正確的軟件和生物化學模塊擴展PostgreSQL,并在DNA上運行SQL。

在這個數(shù)據(jù)爆炸的時代,全球的數(shù)據(jù)不僅遠遠超過我們理解數(shù)字的能力(比如你知道Zettabytes是多少嗎?)更超過了我們的儲存能力。

一切都是數(shù)字化的,一切都越來越多地運行在基于數(shù)據(jù)訓練算法的應用程序上,而這些算法反過來會產(chǎn)生更多的數(shù)據(jù)來為更多的下游應用程序和算法提供信息。你懂了吧?

簡單地說,按照這種速度,很快就沒有足夠的數(shù)據(jù)存儲和計算材料可供使用。這就是為什么人們現(xiàn)在已經(jīng)開始尋找替代的數(shù)據(jù)存儲介質的原因。使用DNA來存儲數(shù)據(jù),這聽起來很奇怪,實際上很有意義。現(xiàn)在,研究人員取得了突破,使他們能夠將DNA存儲整合到流行的開源數(shù)據(jù)庫PostgreSQL中。

DNA是如何儲存數(shù)據(jù)的?

DNA的核心是數(shù)據(jù)存儲層。DNA由四種堿基組成:腺嘌呤、鳥嘌呤、胞嘧啶和胸腺嘧啶(又名AGCT)。從這四個堿基中,DNA形成由三個核苷酸組成的基團(稱為密碼子)。密碼子是給我們的細胞指示蛋白質形成的單位。

我們的信息技術基礎設施基于以位(bits)為單位的信息存儲(由兩位數(shù)字組成:0和1),而DNA信息存儲在四個潛在基本單元的串中。為了將非遺傳信息存儲在DNA中,我們必須首先將二進制數(shù)據(jù)從位轉換為DNA數(shù)據(jù)(AGCT)結構。

將Bits轉換為DNA序列

理論部分實際上相當簡單。與使用硅或磁性介質(它們的工作原理是將狀態(tài)存儲為1和0的序列)相同,存儲A、G、C和T的序列。但是,這在實踐中是如何工作的呢?如何在DNA中寫入和讀取數(shù)據(jù)呢?

這聽起來可能有點遙不可及,但分子技術的進步已經(jīng)使它成為可行——盡管并不完美。

例如,微軟展示了世界上第一個自動DNA數(shù)據(jù)存儲和檢索系統(tǒng)。如果你想知道這個DNA來自哪里:這是合成DNA,產(chǎn)生它的是系統(tǒng)的一部分。

天然存在的DNA由兩條核苷酸鏈的雙螺旋的形式構成。相反,用于數(shù)據(jù)存儲的DNA是單鏈核苷酸序列,也稱為寡核苷酸(oligo),它通過化學過程合成,該化學過程一次構建一個核苷酸。

使用DNA在現(xiàn)實世界中存儲數(shù)據(jù)

倫敦帝國理工學院 SCALE實驗室負責人Heinis和Eurecom數(shù)據(jù)科學系助理教授Appuswamy 在創(chuàng)新數(shù)據(jù)系統(tǒng)研究會議上發(fā)表了題為“ OligoArchive: Using DNA in the DBMS storage hierarchy ”的研究論文。雖然他們不是第一個使用DNA存儲和檢索數(shù)據(jù)的人,但他們是第一個使用結構化數(shù)據(jù)、與現(xiàn)成的數(shù)據(jù)庫集成、并超越存儲、實現(xiàn)計算的人。

關于DNA作為數(shù)據(jù)存儲層的第一件事是,每次執(zhí)行寫操作時,都必須合成寡核苷酸。這將如何在實踐中發(fā)揮作用?實驗室技術人員是否必須待命執(zhí)行此操作,并“重新填充”用于化學過程的原材料?

并非如此,根據(jù)Appuswamy和Heinis的說法,這是微軟通過其自動DNA存儲和檢索系統(tǒng)所證明的價值所在。這表明,在沒有人參與的情況下操作這樣一個過程是可能的。就像除了維護,沒有人監(jiān)督數(shù)據(jù)中心的日常運作一樣,這同樣適用于基于DNA的數(shù)據(jù)中心。

盡管如此,我們還遠沒有用合成DNA陣列取代硬盤。首先,以這種方式存儲數(shù)據(jù)的現(xiàn)代技術非常緩慢。剛開始,科學家們花了一周時間來存儲一兆字節(jié)的數(shù)據(jù)。

Appuswamy和Heinis一致認為,在這方面還需要更多的工作。但這超出了他們自己的研究范圍,所以只能等待生化合成過程進一步提高。

首先,他們注意到存儲速度已經(jīng)越來越快,目前速度是每秒幾KB。雖然與SSD相比,這仍然非常緩慢,但這是一個很大的進步。對于Appuswamy和Heinis的研究(即歸檔存儲),這實際上是可以接受的。

數(shù)據(jù)庫引擎使用三層存儲層次結構,由具有不同價格/性能特性的設備組成。性能層存儲高性能OLTP和實時分析應用程序訪問的數(shù)據(jù)。

容量層存儲由延遲不敏感(latency-insensitive)的批分析應用程序訪問的數(shù)據(jù)。歸檔層用于存儲很少訪問的數(shù)據(jù),例如,在安全合規(guī)性檢查或法律審計期間。今天磁帶通常用于這一層。

OligoArchive通過將基于磁帶的歸檔層替換為基于DNA的歸檔層來改變數(shù)據(jù)庫存儲層次結構。合成DNA的存儲需要額外的措施,對于普通的設備來說,基于DNA的存儲是否有效還值得懷疑。但無論如何,數(shù)據(jù)和數(shù)據(jù)庫都將進入云端,只要你的數(shù)據(jù)安全地存儲在數(shù)據(jù)中心,對終端用戶來說,這都是一個黑匣子。

在DNA上運行SQL

Appuswamy和Heinis還指出,即使它仍然很慢,DNA存儲提供了很大的并行處理潛力。因為它很豐富、價格低廉 - 或者更確切地說,我們希望它最終會是這樣。按照目前的速度,存儲一分鐘的高質量立體聲將花費100,000美元。

盡管使用合成DNA進行大規(guī)模存儲仍然過于昂貴,但Appuswamy和Heinis表示,他們預計成本會下降,這是包括存儲技術在內(nèi)的每一項科技突破的典型方式。

如果合成寡核苷酸在經(jīng)濟上變得可行,那么擁有大量的合成寡核苷酸將是一個合理的預期。這意味著許多DNA存儲單元可以并行運行的巨大潛力。雖然不是每種算法的每一個方面都是可并行的,但對于那些算法來說,可以實現(xiàn)極大的加速。這就把我們帶到了一個關鍵點。

直到今天,DNA一直被用于存儲非結構化文件,無論是文本還是視頻,或者其他什么。Appuswamy和Heinis所做的是將DNA存儲整合到關系數(shù)據(jù)庫中。他們采用了標準數(shù)據(jù)庫基準測試TPC-H中包含的數(shù)據(jù)和查詢,并在PostgreSQL實例上運行了TPC-H。不是串行訪問,而是隨意選擇數(shù)據(jù)。

使用后端的DNA在數(shù)據(jù)庫系統(tǒng)中存儲結構化數(shù)據(jù),并通過SQL查詢,這在今天已成為現(xiàn)實。

研究人員為PostgreSQL構建了歸檔和恢復工具(pg_oligo_dump和pg_oligo_restore),對DNA上的關系數(shù)據(jù)執(zhí)行模式感知編碼和解碼,并使用這些工具將12KB TPC-H數(shù)據(jù)庫歸檔到DNA,執(zhí)行in-vitro計算,以及再次恢復它。

這是巨大的。這意味著現(xiàn)在DNA存儲還可以支持SQL操作,來有選擇地訪問和處理部分數(shù)據(jù)。請注意,數(shù)據(jù)不會被提取到數(shù)據(jù)庫來執(zhí)行操作。Appuswamy和Heinis找到了一種方法來處理寡核苷酸中的SQL連接。這超出了生化儲存的范圍——它還需要生物化學計算。

然而,要做到這一點,研究人員必須處理一系列與用于編碼和解碼DNA信息的技術缺陷有關的問題。對DNA進行操作需要專門的編碼技術,這些技術可以產(chǎn)生適合生化操作的寡核苷酸。讀取DNA數(shù)據(jù)目前非常容易出錯,以前的工作依賴于數(shù)據(jù)過度表示(over-representation):數(shù)據(jù)被寫在許多副本中,因此如果原始數(shù)據(jù)被破壞,備份還在。

相比之下,Appuswamy和Heinis依賴于元數(shù)據(jù)。他們利用數(shù)據(jù)庫模式感知,在編寫的塊中添加一些額外的數(shù)據(jù)位。研究表明,這可以在編碼(寫入)過程中提高密度,并有助于在解碼(讀取)過程中識別錯誤。他們注意到這比預期效果更好。

DNA是數(shù)據(jù)的未來嗎?

盡管部分技術還不成熟,但這是一個重大突破。擁有足夠的數(shù)據(jù)中心存儲空間已經(jīng)成為一個game changer。但是,將像DNA這樣豐富的東西作為一種可行的存儲和計算介質的意義可能會超出我們的想象。

這可能只是朝這個方向邁出的第一步,但每一個旅程都從第一步開始,Appuswamy和Heinis并不是獨行者。

Eurecom,CNRSICL,UCA以及DNA合成初創(chuàng)企業(yè)Helixworks已獲得歐盟資助,以進一步開展DNA儲存研究。該系統(tǒng)將被設計成支持數(shù)據(jù)編碼的全自動循環(huán),將其合成為DNA,并通過序列讀取數(shù)據(jù)。它將存儲各種不同的數(shù)據(jù)類型,并在存儲和精確檢索數(shù)據(jù)時實現(xiàn)近距離數(shù)據(jù)處理。

將數(shù)據(jù)存儲在DNA中的進一步研究將由歐盟資助

Appuswamy和Heinis提到,到目前為止,主要是其他研究人員對這個感興趣,至于說公司,微軟似乎比任何公司都表現(xiàn)出了更多的興趣。

掌握這項技術可能意味著擁有未來,因為這一領域的突破將產(chǎn)生巨大的影響。Appuswamy和Heinis指出,這表明了人們的態(tài)度:

“幾年前,人們會認為這太離譜了。今天,當我們告訴他們我們正在做什么時,他們會說——多告訴我們一些”。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 存儲
    +關注

    關注

    13

    文章

    4355

    瀏覽量

    86177
  • DNA
    DNA
    +關注

    關注

    0

    文章

    243

    瀏覽量

    31136

原文標題:存儲1分鐘聲音花10萬美元,DNA存儲真的有未來嗎?

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    數(shù)據(jù)怎么云存儲電腦,數(shù)據(jù)怎么操作才能云存儲電腦

    怎么操作才能云存儲電腦。 ? ?在數(shù)字化時代,云存儲成為了一種高效、靈活的數(shù)據(jù)管理方式。通過將數(shù)據(jù)存儲
    的頭像 發(fā)表于 01-14 10:10 ?116次閱讀
    <b class='flag-5'>數(shù)據(jù)</b>怎么云<b class='flag-5'>存儲</b><b class='flag-5'>在</b>電腦,<b class='flag-5'>數(shù)據(jù)</b>怎么操作才能云<b class='flag-5'>存儲</b><b class='flag-5'>在</b>電腦

    【「具身智能機器人系統(tǒng)」閱讀體驗】+數(shù)據(jù)具身人工智能的價值

    嵌入式人工智能(EAI)將人工智能集成到機器人等物理實體,使它們能夠感知、學習環(huán)境并與之動態(tài)交互。這種能力使此類機器人能夠人類社會中有效地提供商品及服務。 數(shù)據(jù)是一種貨幣化工具 數(shù)據(jù)
    發(fā)表于 12-24 00:33

    SFTP存儲的應用

    ,并且支持用戶身份驗證。 2. SFTP存儲的應用 2.1 數(shù)據(jù)安全 存儲環(huán)境
    的頭像 發(fā)表于 11-13 14:16 ?332次閱讀

    ar與虛擬現(xiàn)實的區(qū)別 如何優(yōu)化ar應用的用戶界面

    可以通過智能手機、平板電腦或專門的AR眼鏡看到現(xiàn)實世界和虛擬信息的結合。AR不會完全取代現(xiàn)實世界,而是增強用戶的現(xiàn)實體驗。 虛擬
    的頭像 發(fā)表于 11-11 10:05 ?782次閱讀

    dp接口虛擬現(xiàn)實的作用

    虛擬現(xiàn)實(VR)技術的發(fā)展為用戶帶來了沉浸式的體驗,使得人們能夠以前所未有的方式探索虛擬世界。在這一過程,DP接口(DisplayPort)扮演了至關重要的角色。 一、DP接口簡介
    的頭像 發(fā)表于 10-30 14:07 ?363次閱讀

    存儲數(shù)據(jù)會因為斷電而丟失嗎

    存儲數(shù)據(jù)是否會因為斷電而丟失,取決于存儲器的類型及其工作原理。深入探討這個問題之前,我們首先需要了解
    的頭像 發(fā)表于 09-26 15:23 ?2853次閱讀

    DNA計算機研究取得突破性進展:PB級數(shù)據(jù)存儲與高效處理

    8月29日,科學界傳來振奮人心的消息,一項革命性的研究成果為實現(xiàn)全功能DNA計算機奠定了堅實基礎。研究團隊成功開發(fā)出一種創(chuàng)新技術,該技術不僅能在DNA存儲驚人的PB級
    的頭像 發(fā)表于 08-29 16:29 ?574次閱讀

    ram存儲數(shù)據(jù)斷電后會丟失嗎

    后,存儲RAM數(shù)據(jù)會丟失。 一、RAM的工作原理 RAM的基本概念 RAM是一種半導體存儲器,由大量的
    的頭像 發(fā)表于 08-06 09:19 ?2369次閱讀

    增強現(xiàn)實和虛擬現(xiàn)實的聯(lián)系和區(qū)別

    信息疊加到現(xiàn)實世界的技術。用戶可以通過頭戴式顯示器、智能手機或平板電腦等設備,看到現(xiàn)實世界與虛擬信息的結合。 虛擬
    的頭像 發(fā)表于 07-08 11:00 ?2553次閱讀

    增強現(xiàn)實是虛實結合嗎為什么

    們提供了一種全新的交互方式,使得虛擬世界現(xiàn)實世界之間的界限變得模糊,實現(xiàn)了虛實結合。 增強現(xiàn)實技術是一種將計算機生成的虛擬信息與現(xiàn)實
    的頭像 發(fā)表于 07-08 10:58 ?561次閱讀

    XR與AR和VR的區(qū)別 如何使用人工智能開發(fā)更小、更輕的擴展現(xiàn)實眼鏡

    現(xiàn)實世界中看到虛擬物體,或者虛擬環(huán)境感受到現(xiàn)實世界的物體。XR技術包括了AR、VR、MR(M
    的頭像 發(fā)表于 07-05 18:23 ?1.2w次閱讀
    XR與AR和VR的區(qū)別 如何使用人工智能開發(fā)更小、更輕的擴展<b class='flag-5'>現(xiàn)實</b>眼鏡

    虛擬現(xiàn)實技術和增強現(xiàn)實技術區(qū)別與聯(lián)系

    是一種通過計算機生成的三維環(huán)境,使用戶能夠沉浸在一個虛擬世界,實現(xiàn)與虛擬環(huán)境的交互。VR技術的核心原理是通過計算機圖形學、傳感器技術、人機交互技術等手段,模擬現(xiàn)實世界的環(huán)境和物體,讓
    的頭像 發(fā)表于 07-04 11:44 ?2554次閱讀

    數(shù)字孿生:當數(shù)字科技遇上現(xiàn)實世界

    數(shù)字孿生是指通過數(shù)字化技術,將物理世界的實體與虛擬數(shù)字模型相聯(lián)系,從而實現(xiàn)實時復制和仿真的技術。它的出現(xiàn),為我們打開了一扇通往未來的大門。數(shù)字孿生正在深刻改變著我們的生活和工作方式,帶來了前所未有
    的頭像 發(fā)表于 05-13 16:41 ?467次閱讀

    增強現(xiàn)實ar是什么

    增強現(xiàn)實(Augmented Reality,簡稱AR)是一種將虛擬信息融入到現(xiàn)實環(huán)境的技術,使用戶能夠現(xiàn)實
    的頭像 發(fā)表于 05-02 15:18 ?882次閱讀

    NetApp數(shù)據(jù)恢復—NetApp存儲的卷丟失的數(shù)據(jù)恢復案例

    。 NetApp存儲故障: 操作過程由于未知原因導致卷丟失,卷內(nèi)虛擬機無法訪問。管理員對該NetApp存儲進行檢查并試圖恢復數(shù)據(jù)但是沒有成功,于是聯(lián)系我們
    的頭像 發(fā)表于 03-07 15:42 ?453次閱讀
    NetApp<b class='flag-5'>數(shù)據(jù)</b>恢復—NetApp<b class='flag-5'>存儲</b><b class='flag-5'>中</b>的卷丟失的<b class='flag-5'>數(shù)據(jù)</b>恢復案例
    主站蜘蛛池模板: аⅴ天堂中文在线网 | 中文字幕一区在线观看视频 | 奇米影视四色首页手机在线 | 欧美性网站 | 欧美日韩国产成人高清视频 | 青草91 | 大学生一级特黄的免费大片视频 | 天天躁日日躁狠狠躁一级毛片 | 五月婷婷伊人网 | 日本三级香港三级三级人!妇久 | 婷婷六月天激情 | 日韩三级免费观看 | 国产图片综合 | 国产精选经典三级小泽玛利亚 | 亚洲综合精品成人啪啪 | 人人草在线| 女同国产| 五月婷婷六月合 | 色综合97天天综合网 | 男女交性特一级 | 久久国产精品亚洲综合 | 波多野结衣三个女人蕾丝边 | 色综合久久中文综合网 | h视频免费高清在线观看 | 欧美精品videosex极品 | 美女流白浆网站 | 日韩毛片 | 国产成人精品曰本亚洲77美色 | 五月天精品 | 色综合天天综合中文网 | 亚洲精品视频区 | 手机在线一区二区三区 | 亚洲国产精品综合久久久 | 色色色爱 | 禁h粗大太大好爽好涨受不了了 | 亚洲国产成人久久99精品 | 经典三级一区二区三区视频 | 国产色在线 | 亚洲 国产色综合天天综合网 | 六月丁香激情 | 边做边爱在线观看视频免费 | 毛片毛片 |