因分析、基因診斷、白血病分型、指導(dǎo)治療、判斷預(yù)后等領(lǐng)域已經(jīng)有了成熟應(yīng)用,而其中血液學(xué)已成為了此類現(xiàn)代生命科學(xué)技術(shù)發(fā)展最為活躍的領(lǐng)域之一。
通過加強(qiáng)技術(shù)創(chuàng)新,中國血液學(xué)研究在基礎(chǔ)理論研究以及臨床轉(zhuǎn)化和實踐等方面已躋身世界前列。基因測序作為一種新型的基因檢測技術(shù),在生命科學(xué)研究中扮演著十分重要的角色,隨著測序技術(shù)的飛速發(fā)展,人類發(fā)現(xiàn)的基因序列數(shù)目以指數(shù)級增長,對于如此數(shù)量龐大的基因進(jìn)行同源性搜尋、比對、遺傳發(fā)育分析等等,往往伴隨著巨大的數(shù)據(jù)處理量和并行計算量。
江蘇省血液研究所(以下簡稱血研所) 采用浪潮分布式存儲AS13000搭建了血液病檢測平臺,支撐了前端的基因檢測業(yè)務(wù),并依靠方案的高可靠、高可用、易擴(kuò)容等特點,保障血研所業(yè)務(wù)高效運(yùn)行并滿足后續(xù)業(yè)務(wù)持續(xù)增長需求。
血研所主要研究方向為血栓與止血、惡性血液病和造血干細(xì)胞移植,本次搭建的科研平臺主攻血液病的基因檢測場景,基因測序是一種新型基因檢測技術(shù),能夠從血液或唾液中分析測定基因全序列,預(yù)測罹患多種疾病的可能性,過程中將會產(chǎn)生大量的數(shù)據(jù),對存儲系統(tǒng)帶來了較大規(guī)模的挑戰(zhàn)。
血研所也是國內(nèi)第一個血栓與止血研究室,需要對大量的樣品進(jìn)行數(shù)據(jù)的采集、分析和計算,且對數(shù)據(jù)的持續(xù)讀取性能、安全性要求很高,隨著血液檢測的技術(shù)創(chuàng)新與精確度的提升,預(yù)計未來每年的數(shù)據(jù)增長量在100TB左右。
浪潮分布式存儲支撐血液病檢測平臺
結(jié)合檢測平臺數(shù)據(jù)特點及需求,血研所采用了浪潮分布式存儲AS13000系列,在基因測序過程中滿足了海量空間、高IO并發(fā)性能、業(yè)務(wù)連續(xù)性等需求,高效支持了血研所臨床與多課題組同時在線使用的業(yè)務(wù)。
面對基因測序業(yè)務(wù)增長的性能和容量需求,浪潮分布式存儲AS13000通過文件方面的智能條帶化(Stripe)技術(shù),單個文件跨節(jié)點分布,提高前端計算節(jié)點對數(shù)據(jù)并發(fā)訪問性能。若后續(xù)規(guī)模的不斷增長,業(yè)務(wù)負(fù)載壓力變大,AS13000支持通過整合SSD資源作為高速數(shù)據(jù)緩沖區(qū),可進(jìn)一步提升系統(tǒng)IO性能;平臺一期建設(shè)配置300余TB可用空間,滿足血研所未來2年的數(shù)據(jù)增長需求,隨著血研所科研數(shù)據(jù)量的增加,可通過節(jié)點在線橫向擴(kuò)展的模式,系統(tǒng)容量和性能呈線性增長,總?cè)萘靠蛇_(dá)EB級,可滿足基因測序數(shù)據(jù)每年100TB的增長量。
整個基因測序的業(yè)務(wù)是在高壓力下7*24運(yùn)行,一旦出現(xiàn)業(yè)務(wù)中斷整個基因測序的工程就要中斷,甚至于整個的基因測序要重新進(jìn)行。因此,連續(xù)性就是基因測序的根本生產(chǎn)力保證,因此對文件系統(tǒng)存儲的業(yè)務(wù)連續(xù)性保證有極高的要求。
分布式存儲在設(shè)計方面保證所有的關(guān)鍵系統(tǒng)服務(wù)都分布在多個硬件上,避免系統(tǒng)資源單點故障,消除系統(tǒng)瓶頸;糾刪碼策略在保障最大可達(dá)94%空間利用率時,允許集群內(nèi)同時故障2個節(jié)點,數(shù)據(jù)不丟失,保障基因測序的業(yè)務(wù)連續(xù)。
江蘇省血液研究所血液病生物樣本庫經(jīng)過發(fā)展,建成包括生物樣本庫、臨床數(shù)據(jù)庫和質(zhì)量控制實驗室三個部門的血液病生物資源庫,涵蓋樣本及信息收集、儲存、利用全環(huán)節(jié)的生物資源管理體系。截至目前,共收集了103910例各類血液疾病患者的樣本共計578331份,樣本類型涵蓋凍存細(xì)胞、骨髓組織、骨髓細(xì)胞玻片、血漿、血清、DNA和RNA等,出庫樣本量達(dá)59522份;臨床數(shù)據(jù)庫建立造血干細(xì)胞移植患者檔案3000余例。
血液病生物資源庫現(xiàn)為國內(nèi)規(guī)模較大的血液疾病生物資源庫之一,建立了國內(nèi)最大的造血干細(xì)胞移植、骨髓增生異常綜合征和急性混合細(xì)胞白血病的生物樣本研究隊列,為血液病基礎(chǔ)和臨床研究提供高質(zhì)量的樣本和數(shù)據(jù)支持。
江蘇省血液研究所將繼續(xù)堅持科研與臨床相結(jié)合的理念,協(xié)力發(fā)展、不斷創(chuàng)新,建設(shè)成為具有國際一流水平的血液病臨床診療和轉(zhuǎn)化研究中心,為血液學(xué)領(lǐng)域做出新的貢獻(xiàn)。
-
存儲
+關(guān)注
關(guān)注
13文章
4357瀏覽量
86189 -
硬件
+關(guān)注
關(guān)注
11文章
3391瀏覽量
66473 -
浪潮
+關(guān)注
關(guān)注
1文章
469瀏覽量
23950 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3851瀏覽量
64698
發(fā)布評論請先 登錄
相關(guān)推薦
分布式云化數(shù)據(jù)庫有哪些類型
浪潮信息AS13000G7榮獲MLPerf? AI存儲基準(zhǔn)測試五項性能全球第一
![<b class='flag-5'>浪潮</b>信息AS<b class='flag-5'>13000</b>G7榮獲MLPerf? AI<b class='flag-5'>存儲</b>基準(zhǔn)測試五項性能全球第一](https://file1.elecfans.com//web2/M00/09/5A/wKgaomb3wmGAImpdAACRqto4p7Q087.jpg)
分布式存儲費(fèi)用高嗎?大概需要多少錢
浪潮信息推出AIGC存儲解決方案
浪潮信息分布式存儲AS13000完成英特爾至強(qiáng)6能效核處理器適配
![<b class='flag-5'>浪潮</b>信息<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b><b class='flag-5'>AS13000</b>完成英特爾至強(qiáng)6能效核處理器適配](https://file1.elecfans.com/web2/M00/F1/2E/wKgaomZyPRWAZ-ZtAAATAuwWalE093.jpg)
浪潮信息發(fā)布AS13000G7-N系列分布式全閃存儲
為大模型專門優(yōu)化 浪潮信息發(fā)布分布式全閃存儲AS13000G7-N系列
![為大模型專門優(yōu)化 <b class='flag-5'>浪潮</b>信息發(fā)布<b class='flag-5'>分布式</b>全閃<b class='flag-5'>存儲</b>AS<b class='flag-5'>13000</b>G7-N系列](https://file1.elecfans.com//web2/M00/E3/EB/wKgZomY93LqAB0zmAACk7cG7-Us233.jpg)
浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列
![<b class='flag-5'>浪潮</b>信息發(fā)布為大模型專門優(yōu)化的<b class='flag-5'>分布式</b>全閃<b class='flag-5'>存儲</b>AS<b class='flag-5'>13000</b>G7-N系列](https://file1.elecfans.com/web2/M00/E2/15/wKgZomY61--ATpyVAAALqqPGbD8415.jpg)
評論