資料介紹
??基于高性能計(jì)算集群這樣的新一代測(cè)序器和快速演化分析平臺(tái),基因研究領(lǐng)域已經(jīng)被海量數(shù)據(jù)淹沒(méi)。眾多基因、癌癥、醫(yī)學(xué)研究機(jī)構(gòu)和制藥公司不斷產(chǎn)生的海量數(shù)據(jù),已不再能被及時(shí)的處理并恰當(dāng)?shù)拇鎯?chǔ),甚至通過(guò)常規(guī)通訊線(xiàn)路進(jìn)行傳輸都變得困難。而通常情況下,這些數(shù)據(jù)必須能被快速存儲(chǔ)、分析、共享和歸檔,以適應(yīng)基因研究的需要。于是他們不得不訴諸于磁盤(pán)驅(qū)動(dòng)器及運(yùn)輸公司,來(lái)轉(zhuǎn)移原始數(shù)據(jù)到國(guó)外的計(jì)算中心,這為快速訪(fǎng)問(wèn)和分析數(shù)據(jù)帶來(lái)了巨大障礙。與規(guī)模和速度同等重要的是,所有基因組信息都能基于數(shù)據(jù)模型和類(lèi)別被鏈接,并以機(jī)器或人類(lèi)語(yǔ)言進(jìn)行標(biāo)注,這樣智能化的數(shù)據(jù)就能被分解成方程式,在處理基因、臨床和環(huán)境數(shù)據(jù)時(shí)應(yīng)用于普通分析平臺(tái)。
概述
機(jī)遇與挑戰(zhàn)并存的基因組醫(yī)學(xué)革命
自人類(lèi)啟動(dòng)基因組計(jì)劃以來(lái),各項(xiàng)工程已逐步開(kāi)始揭示人類(lèi)基因組與疾病間關(guān)聯(lián)的奧秘。隨著測(cè)序技術(shù)的不斷進(jìn)步,僅用1000美元即可識(shí)別出基因組。

圖1 基因組醫(yī)學(xué)技術(shù)進(jìn)步的十年
人類(lèi)基因組計(jì)劃是首個(gè)用來(lái)確定人類(lèi)基因組序列的科研項(xiàng)目。該項(xiàng)目歷時(shí)13年,耗費(fèi)近30億美元,于2003年完成,是目前為止最大的生物學(xué)合作項(xiàng)目。從那時(shí)起,一系列的技術(shù)進(jìn)步在DNA測(cè)序和大規(guī)模基因組數(shù)據(jù)分析中展露頭腳,對(duì)單個(gè)人類(lèi)全基因組進(jìn)行測(cè)序的時(shí)間和成本隨之急劇下降,下降速度甚至超過(guò)了摩爾定律。

圖2 DNA測(cè)序成本的快速下降
(自2001年以來(lái),美國(guó)國(guó)家人類(lèi)基因組研究所(NHGRI)對(duì)由美國(guó)國(guó)立衛(wèi)生研究院(NIH)資助的測(cè)序中心所進(jìn)行的所有DNA測(cè)序工作進(jìn)行了跟蹤,并統(tǒng)計(jì)了相關(guān)費(fèi)用,這些信息已作為DNA測(cè)序的重要改進(jìn)評(píng)估基準(zhǔn)。圖中展現(xiàn)出近年來(lái)DNA測(cè)序技術(shù)和數(shù)據(jù)產(chǎn)生流程的顯著改善。來(lái)源:NHGRI,http://www.genome.gov/sequencingcosts/)
作為測(cè)序技術(shù)進(jìn)步的一個(gè)例子,Illumina公司在2014年發(fā)布了新一代測(cè)序器HiSeq X10,它以每個(gè)基因組僅1000美元的成本,一年可解密18000個(gè)人類(lèi)全基因組。這個(gè)所謂的“千元基因組技術(shù)”使人類(lèi)全基因組測(cè)序比以往任何時(shí)候更廉價(jià)可行,并有望對(duì)醫(yī)療保健和生命科學(xué)行業(yè)產(chǎn)生巨大影響。
新技術(shù)和研究方法的成功同樣帶來(lái)了相當(dāng)大的成本,海量數(shù)據(jù)成為亟待解決的難題:
基因組數(shù)據(jù)在過(guò)去的8年中,每5個(gè)月翻一番。基因編碼項(xiàng)目為80%的基因組賦予了明確的含義,所以獲取全基因組序列變得尤為重要。癌癥基因組研究揭示了一組不同的癌細(xì)胞基因變體,通過(guò)全基因組測(cè)序的跟蹤和監(jiān)控,每次分析都會(huì)產(chǎn)生約1TB的數(shù)據(jù)。已有越來(lái)越多的國(guó)家啟動(dòng)了基因組測(cè)序項(xiàng)目,如美國(guó)、英國(guó)、中國(guó)和卡塔爾。這些項(xiàng)目動(dòng)輒就會(huì)產(chǎn)生數(shù)以百PB級(jí)的測(cè)序數(shù)據(jù)。
對(duì)端到端架構(gòu)的要求
為了滿(mǎn)足基因醫(yī)藥研究對(duì)于速度、規(guī)模和智能化的苛刻要求,需要端到端參考架構(gòu)涵蓋基因計(jì)算的關(guān)鍵功能,如數(shù)據(jù)管理(數(shù)據(jù)集線(xiàn)器),負(fù)載編排(負(fù)載編排器)和企業(yè)接入(應(yīng)用中心)等。為了確定參考架構(gòu)(能力與功能)和映射解決方案(硬件與軟件)的內(nèi)容和優(yōu)先級(jí),需要遵循以下三個(gè)主要原則:
軟件定義:即基于軟件的抽象層進(jìn)行計(jì)算、存儲(chǔ)和云服務(wù),以此定義基礎(chǔ)架構(gòu)和部署模式,以便在未來(lái)通過(guò)數(shù)據(jù)量和計(jì)算負(fù)載的積累進(jìn)行基因組基礎(chǔ)設(shè)施的增長(zhǎng)和擴(kuò)展。數(shù)據(jù)中心:以數(shù)據(jù)管理功能面向基因組研究、成像和臨床數(shù)據(jù)的爆炸式增長(zhǎng)。應(yīng)用就緒:整合多種應(yīng)用到一致的環(huán)境,提供數(shù)據(jù)管理、版本控制、負(fù)載管理、工作流編排,以及通過(guò)訪(fǎng)問(wèn)執(zhí)行和監(jiān)控等多種功能。
概述
機(jī)遇與挑戰(zhàn)并存的基因組醫(yī)學(xué)革命
自人類(lèi)啟動(dòng)基因組計(jì)劃以來(lái),各項(xiàng)工程已逐步開(kāi)始揭示人類(lèi)基因組與疾病間關(guān)聯(lián)的奧秘。隨著測(cè)序技術(shù)的不斷進(jìn)步,僅用1000美元即可識(shí)別出基因組。

圖1 基因組醫(yī)學(xué)技術(shù)進(jìn)步的十年
人類(lèi)基因組計(jì)劃是首個(gè)用來(lái)確定人類(lèi)基因組序列的科研項(xiàng)目。該項(xiàng)目歷時(shí)13年,耗費(fèi)近30億美元,于2003年完成,是目前為止最大的生物學(xué)合作項(xiàng)目。從那時(shí)起,一系列的技術(shù)進(jìn)步在DNA測(cè)序和大規(guī)模基因組數(shù)據(jù)分析中展露頭腳,對(duì)單個(gè)人類(lèi)全基因組進(jìn)行測(cè)序的時(shí)間和成本隨之急劇下降,下降速度甚至超過(guò)了摩爾定律。

圖2 DNA測(cè)序成本的快速下降
(自2001年以來(lái),美國(guó)國(guó)家人類(lèi)基因組研究所(NHGRI)對(duì)由美國(guó)國(guó)立衛(wèi)生研究院(NIH)資助的測(cè)序中心所進(jìn)行的所有DNA測(cè)序工作進(jìn)行了跟蹤,并統(tǒng)計(jì)了相關(guān)費(fèi)用,這些信息已作為DNA測(cè)序的重要改進(jìn)評(píng)估基準(zhǔn)。圖中展現(xiàn)出近年來(lái)DNA測(cè)序技術(shù)和數(shù)據(jù)產(chǎn)生流程的顯著改善。來(lái)源:NHGRI,http://www.genome.gov/sequencingcosts/)
作為測(cè)序技術(shù)進(jìn)步的一個(gè)例子,Illumina公司在2014年發(fā)布了新一代測(cè)序器HiSeq X10,它以每個(gè)基因組僅1000美元的成本,一年可解密18000個(gè)人類(lèi)全基因組。這個(gè)所謂的“千元基因組技術(shù)”使人類(lèi)全基因組測(cè)序比以往任何時(shí)候更廉價(jià)可行,并有望對(duì)醫(yī)療保健和生命科學(xué)行業(yè)產(chǎn)生巨大影響。
新技術(shù)和研究方法的成功同樣帶來(lái)了相當(dāng)大的成本,海量數(shù)據(jù)成為亟待解決的難題:
基因組數(shù)據(jù)在過(guò)去的8年中,每5個(gè)月翻一番。基因編碼項(xiàng)目為80%的基因組賦予了明確的含義,所以獲取全基因組序列變得尤為重要。癌癥基因組研究揭示了一組不同的癌細(xì)胞基因變體,通過(guò)全基因組測(cè)序的跟蹤和監(jiān)控,每次分析都會(huì)產(chǎn)生約1TB的數(shù)據(jù)。已有越來(lái)越多的國(guó)家啟動(dòng)了基因組測(cè)序項(xiàng)目,如美國(guó)、英國(guó)、中國(guó)和卡塔爾。這些項(xiàng)目動(dòng)輒就會(huì)產(chǎn)生數(shù)以百PB級(jí)的測(cè)序數(shù)據(jù)。
對(duì)端到端架構(gòu)的要求
為了滿(mǎn)足基因醫(yī)藥研究對(duì)于速度、規(guī)模和智能化的苛刻要求,需要端到端參考架構(gòu)涵蓋基因計(jì)算的關(guān)鍵功能,如數(shù)據(jù)管理(數(shù)據(jù)集線(xiàn)器),負(fù)載編排(負(fù)載編排器)和企業(yè)接入(應(yīng)用中心)等。為了確定參考架構(gòu)(能力與功能)和映射解決方案(硬件與軟件)的內(nèi)容和優(yōu)先級(jí),需要遵循以下三個(gè)主要原則:
軟件定義:即基于軟件的抽象層進(jìn)行計(jì)算、存儲(chǔ)和云服務(wù),以此定義基礎(chǔ)架構(gòu)和部署模式,以便在未來(lái)通過(guò)數(shù)據(jù)量和計(jì)算負(fù)載的積累進(jìn)行基因組基礎(chǔ)設(shè)施的增長(zhǎng)和擴(kuò)展。數(shù)據(jù)中心:以數(shù)據(jù)管理功能面向基因組研究、成像和臨床數(shù)據(jù)的爆炸式增長(zhǎng)。應(yīng)用就緒:整合多種應(yīng)用到一致的環(huán)境,提供數(shù)據(jù)管理、版本控制、負(fù)載管理、工作流編排,以及通過(guò)訪(fǎng)問(wèn)執(zhí)行和監(jiān)控等多種功能。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 數(shù)據(jù)分析工具下載 5次下載
- 基于大數(shù)據(jù)分析LTE下行速率影響因素研究案例 15次下載
- 工程大數(shù)據(jù)分析——汽車(chē)傳感器數(shù)據(jù)應(yīng)用 11次下載
- 基于計(jì)算分析的高可用彈性宏基因組學(xué)計(jì)算平臺(tái) 6次下載
- 大數(shù)據(jù)分析如何解決汽車(chē)?yán)^電器異常資料下載
- 基于異質(zhì)網(wǎng)絡(luò)層次的基因節(jié)點(diǎn)表示學(xué)習(xí)方法 5次下載
- 教育大數(shù)據(jù)可視化分析研究的綜合分析 108次下載
- 如何使用大數(shù)據(jù)進(jìn)行用戶(hù)用電行為分析平臺(tái)的研究資料說(shuō)明 3次下載
- 如何使用大數(shù)據(jù)技術(shù)進(jìn)行居民在夜間的情感變化研究資料分析 5次下載
- 大數(shù)據(jù)與推薦系統(tǒng) 18次下載
- 一種輕量級(jí)的大數(shù)據(jù)分析系統(tǒng) 10次下載
- GUIDE-seq和Digenome-seq等全基因組CRISPR 檢測(cè)的關(guān)鍵技術(shù)介紹 24次下載
- 設(shè)計(jì)多網(wǎng)絡(luò)協(xié)議的Python網(wǎng)絡(luò)編程的探索性指南 5次下載
- 神經(jīng)網(wǎng)絡(luò)在基因序列預(yù)測(cè)中的應(yīng)用研究
- Agent在數(shù)據(jù)分析平臺(tái)中的應(yīng)用研究
- GPU助力基因組重測(cè)序分析 1899次閱讀
- 數(shù)據(jù)分析有哪些工具 8793次閱讀
- 大數(shù)據(jù)分析所面臨的機(jī)遇與挑戰(zhàn) 6042次閱讀
- 大數(shù)據(jù)分析如何來(lái)增強(qiáng) 1239次閱讀
- 如何同時(shí)使用Nucleus與TensorFlow解決基因組學(xué)領(lǐng)域的機(jī)器學(xué)習(xí)問(wèn)題 3920次閱讀
- 如何看懂R中的探索性數(shù)據(jù)分析(附R代碼) 3602次閱讀
- 什么是大數(shù)據(jù)分析?大數(shù)據(jù)分析的含義與目前形式 1.6w次閱讀
- 你去將你的基因組測(cè)序了嗎?面臨挑戰(zhàn)的基因組數(shù)據(jù)壓縮技術(shù) 4698次閱讀
- 材料基因組方法如何促進(jìn)鋰電池材料研發(fā) 4259次閱讀
- 介紹幾種用于機(jī)器學(xué)習(xí)探索性數(shù)據(jù)分析的數(shù)據(jù)類(lèi)型 4982次閱讀
- EDA實(shí)際應(yīng)用的典型小案例 4416次閱讀
- 高通量測(cè)序生物信息學(xué)分析 1.6w次閱讀
- 大數(shù)據(jù)分析到底需要多少種工具_(dá)大數(shù)據(jù)分析總結(jié) 1.1w次閱讀
- 常用的數(shù)據(jù)分析方法有哪些 1.8w次閱讀
- 醫(yī)療大數(shù)據(jù)分析深入淺出 9382次閱讀
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1491次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 95次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說(shuō)明
- 4.28 MB | 18次下載 | 4 積分
- 5開(kāi)關(guān)電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費(fèi)
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于單片機(jī)和 SG3525的程控開(kāi)關(guān)電源設(shè)計(jì)
- 0.23 MB | 4次下載 | 免費(fèi)
- 8基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專(zhuān)業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537793次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論