在NVIDIA和Scripps Research的幫助下,橡樹嶺國家實驗室研究人員使用Summit超級計算機將搜索時間從數年縮短至數小時。
正在家中遠程辦公的Ada Sedova,有時甚至穿著睡衣。她利用世界上功能最強大的超級計算機來尋找一個微小的分子,這種分子可以阻止人們感染新型冠狀病毒。
橡樹嶺國家實驗室(Oak Ridge National Laboratory)的生物物理學研究員Sedova表示:“我比以往任何時候都做得更多。出于對大流行的擔憂,我將許多私人時間投入到這項工作中。”
通過她的辛勤付出,團隊最終在短短24小時內執行了20億次分子測試。
Sedova在尋求一個配位體,它是一種體積小于幾十個原子的有機分子。合適的配位體會將自身與冠狀病毒的蛋白質結合,從而阻止其感染健康細胞。
但問題在于,要檢查的配位體和蛋白質數量非常龐大,且它們的形狀會隨著原子力的變化不斷改變。在數十億種可能的化合物中找到合適的配位體仿佛大海撈針。
在濕實驗室(用于開展基于實驗藥劑的傳統實驗的實驗室)中將全部可能性嘗試一遍需要若干年的時間, 即使通過ORNL的超級計算機Summit上的9,216個CPU上將它們全部仿真,也需要四年時間才能完成。因此Sedova和她的同事們選擇裝備了27,648組NVIDIA GPU的 Summit超級計算機來加快工作速度。
他們最初使用的是AutoDock的OpenCL版本,這是一個用來模擬蛋白質和配體如何結合的開源程序,由斯克里普斯研究所和達姆施塔特大學合作開發。與CPU相比,運行在GPU上的OpenCL版本的處理速度提高了50倍。
CUDA切入正題
在NVIDIA和Scripps Research的幫助下,該團隊將代碼移植到CUDA,使其可以在Summit上運行,由此在原有50倍加速的基礎上,處理速度再次提升2.8倍。Jubilee Development的另一位研究人員Aaron Scheinberg發現,在使用OpenMP加速向GPU提供數據時,這項工作又實現了3倍增速。
對抗某一特定蛋白質的化合物數量可達14億種,另一項測試結果表明,他們可以在短短12小時內完成對這些化合物的高精度篩選。與運行在CPU上的程序相比,該速度提高了33倍以上。
GPU將處理包含14億個配位體的數據庫所需的時間減少了一個數量級以上, 他們還縮小了結果間差異,由此解決了在超級計算機的CPU上的進程安排問題。
她說:“GPU與Summit規模和體系結構的結合,將化合物對接能力擴充了數十億個?!?/p>
團隊的另一位成員,生物物理學家Josh Vermaas特別對NVIDIA團隊的Scott Le Grand幫助他們將AutoDock移植到CUDA表示感謝。Vermaas在關于工作開端的博客中寫到, “以前的平臺只支持OpenCL代碼,他的幫助對實現平臺性能提升至關重要?!?/p>
在24小時內模擬20億種化合物
Sedova相信,通過進一步改進,團隊可以實現將化合物檢測能力提升至24小時內20億種。對于數目如此龐大的數據,這將是在高分辨率下完成的首次模擬。
研究人員在實現這一里程碑式的成就過程中仍然面臨一些挑戰。
蛋白質-配位體對接的標準工作流程是一個緩慢的基于文件的流程。它可以在筆記本電腦上完成對數百種化合物的測試,但如此龐大的數據量即使交由世界上最大的超級計算機處理,計算機也會出現宕機的情況。
這是對那些希望幫助加速科學發展的開源開發者的號召。
Sedova的團隊正在領導這項工作,組建了一個新的工作流程,該工作流程有望安全地在Summit上啟動大量工作。她正在咨詢系統的I / O專家,并試圖建立一個數據庫來容納所有配體。
下一步是在Summit的4,608個節點中的108個上啟動約100萬種化合物的實驗。她說:“如果行得通,我們將在Summit的所有節點上啟動14億個化合物的大規模生產?!?/p>
聚焦搜索有希望成功的分子
如果該團隊成功,他們將向孟菲斯的研究人員發送一份約9000種最有希望成功的化合物清單,以便在濕實驗室中對真實的病毒開展測試。搜索范圍的縮小大大增加了配位成功的希望。
這個項目于今年開始,當時ORNL的頂級研究人員Jeremy C. Smith展示了使用Summit超級計算機進行藥物研究以對抗冠狀病毒的首個研究。目前項目仍處于初期階段。
展望未來,Sedova就橋接蛋白質-配位體領域與高性能計算的典型方法提出了更多想法,她也有足夠的精力去進一步探索。
責任編輯:pj
-
gpu
+關注
關注
28文章
4806瀏覽量
129591 -
超級計算機
+關注
關注
2文章
464瀏覽量
42064 -
數據庫
+關注
關注
7文章
3860瀏覽量
64841
發布評論請先 登錄
相關推薦
數據庫數據恢復—Windows無法啟動MongoDB服務的數據恢復案例

數據庫數據恢復—通過拼接數據庫碎片恢復SQLserver數據庫

評論