下面的帖子將深入探討NVIDIA 在藥物發(fā)現(xiàn)和基因組學方面取得的一些成就和當前的工作重點。作為醫(yī)療保健和生命科學領域創(chuàng)新的領導者,NVIDIA 正在尋求加入人工智能、深度學習、模擬和藥物發(fā)現(xiàn) 研究人員和工程師 為球隊干杯。如果你讀到的內容與你的職業(yè)目標一致,請查看當前的工作公告。
NVIDIA 正在利用最新技術,將高性能計算( HPC )與基因組和藥物發(fā)現(xiàn)研究結合起來。隨著基因組測試變得越來越主流,需要分析的數(shù)據(jù)量也在增加。藥物發(fā)現(xiàn)也進入了一個新的研究時代,人工智能和深度學習為發(fā)現(xiàn)數(shù)千種新化合物打開了大門,這些化合物是藥物發(fā)現(xiàn)的基礎。
NVIDIA 的研究人員和工程師,如該組織的負責人約翰尼·伊斯雷爾,正在推動基因組學和藥物發(fā)現(xiàn)研究。開發(fā) NVIDIA Clara Parabricks 等軟件,這是一個 GPU 加速的計算基因組學應用框架,為全基因組、外顯子組、癌癥基因組和 RNA 測序數(shù)據(jù)提供端到端分析工作流。
作為NVIDIA 研究公司內容營銷部的負責人,我和約翰尼坐下來進一步了解他在團隊中的工作。
嘿,約翰尼,很高興終于和你聯(lián)系上了。讓我們直接跳進去。我想問,鑒于NVIDIA 是一家科技公司,在你們團隊工作與在生物科技公司工作有什么不同?
內特,謝謝你的幫助。有幾種方法可以考慮這些差異。在生物技術領域,往往有一個非常具體的技術目標或問題。你可以使用任何一種技術或技術組合來解決這個問題。你可能會與問題或目標結為夫妻,但不會與你可能使用的技術類型結為夫妻。在這里,我們追求的產(chǎn)品充分利用了我們在加速計算和人工智能技術方面的專業(yè)知識,并在產(chǎn)品目標方面具有更大的靈活性。
例如,幾年前我們致力于基因組學,但我們沒有為藥物發(fā)現(xiàn)制造任何產(chǎn)品。今天,我們正在為這一特定領域打造一款產(chǎn)品。原因是藥物發(fā)現(xiàn)作為一個領域正在發(fā)生變化。我們看到了一個追求新目標的機會。因此,我想說,我們在追求新機會方面有著良好的記錄,因為我們獨特的定位和獨特的技能可以提供這些機會。
你能給我舉一個獨特的機會的例子,讓你有別于傳統(tǒng)的生物技術公司嗎?
我想強調一下我們面向人工智能的藥物發(fā)現(xiàn)工作的強度。藥物發(fā)現(xiàn)領域有不少公司與人工智能合作,但投資的水平和重點可能有所不同。對于生物技術公司來說,人工智能是在更廣泛的技術庫中尋求藥物發(fā)現(xiàn)項目的幾種技術選項之一。
在NVIDIA ,我們知道我們在人工智能和加速計算方面有著獨特的優(yōu)勢。因此,由于我們的定位和規(guī)模,我們比大多數(shù)其他公司更有動力以更高的強度和專注度投資這項工作。因此,對人工智能和藥物發(fā)現(xiàn)以及并行計算的交叉感興趣的工程師和科學家會發(fā)現(xiàn)我們的工作領域很有趣。
你提到了你在基因組學方面的工作,你能告訴我你過去在基因組學方面的工作是如何影響你目前在藥物發(fā)現(xiàn)方面的工作的嗎?
藥物發(fā)現(xiàn)領域是多學科的,是一個漫長而復雜的過程。藥物發(fā)現(xiàn)過程的早期階段是目標識別階段。大多數(shù)藥物發(fā)現(xiàn)工作都是基于目標的藥物發(fā)現(xiàn)工作流程,在這里,你可以找出目標是什么,蛋白質目標是什么,然后開發(fā)一種藥物。
我們的基因組學工作極大地促進了目標識別問題。你可以在許多人身上建立這些全基因組的數(shù)據(jù)集,然后對它們進行分析,找出哪些突變與不同類型的疾病有關。通過識別和分析這些突變,我們可以找出與特定疾病相關的蛋白質靶點。然后從那里構建藥物發(fā)現(xiàn)工作流程的其余部分。
因此,我們使用名為 NVIDIA Clara Parabricks 的軟件來繪制基因組學儀器的數(shù)據(jù),識別基因組變異,并對它們進行注釋。通過將這些基因組學工作流程簡化為按鈕式軟件解決方案并加速該軟件,我們正在減少生成大規(guī)模基因組學數(shù)據(jù)集的時間和成本。這些跨多個個體的大規(guī)模基因組數(shù)據(jù)集隨后被用于確定可能影響疾病結果的蛋白質靶標,這些蛋白質的結構與我們的 NVIDIA Clara 發(fā)現(xiàn)軟件一起用于生成和模擬藥物化合物及其與這些蛋白質的相互作用。
所以你用 Clara Parabricks 來推動基因組學中的蛋白質鑒定,然后用 Clara 發(fā)現(xiàn)來模擬可能被用作藥物的化合物?
確切地說,在藥物發(fā)現(xiàn)的背景下,我們幫助找出特定藥物發(fā)現(xiàn)項目中最有希望的化合物,這是我們非常激動的事情。我們大約在一年半前開始研究藥物發(fā)現(xiàn)。我們在 GTC 上宣布——我相信是在 2020 年秋天——我們將開發(fā)這個名為 NVIDIA Clara 發(fā)現(xiàn) 它將成為一個 NVIDIA 框架,涵蓋所有與計算藥物發(fā)現(xiàn)有關的內容。這就是所有這些前沿工作發(fā)生的地方,也是我們目前真正想要招聘的地方。
你想深入研究一下嗎?如果我們正在尋找這一領域的工程師和研究人員,他們可能會發(fā)現(xiàn)了解更多關于你關注的工作很有趣。
當然,是的。藥物發(fā)現(xiàn)是一個漫長而復雜的過程,涉及多個學科。當你想到計算藥物發(fā)現(xiàn)時,有三種動態(tài)正在發(fā)生,它們可能會從計算的角度重塑這個行業(yè)。這三個動力學是你在計算藥物發(fā)現(xiàn)循環(huán)的核心所要做的。你有一種蛋白質——一個目標——你想影響它,你有一種化合物,它可能是一種有待開發(fā)的藥物。然后給定一種化合物和蛋白質結構,你可以進行各種模擬。你試圖預測這是否是一次有用的互動。
傳統(tǒng)上,你會有一個這些化合物的數(shù)據(jù)庫。各種各樣的公司都在對這些數(shù)據(jù)庫進行編目和生產(chǎn),如今有數(shù)十億種化合物。然后是蛋白質結構的世界,這是由一群從事結構生物學工作的小組產(chǎn)生的。
現(xiàn)在,有三件事正在發(fā)生,我們認為它們可能會改變一切。首先是 DeepMind 和其他團體以字母折疊等形式進行的突破性工作。我們現(xiàn)在使用深度學習來預測蛋白質結構。因此,如果這是真的,那么在未來幾年里,我們將有更多的蛋白質結構發(fā)揮作用,比我們到目前為止所擁有的要多得多。這是動態(tài)第一。
動態(tài)二號是通過我們在 Clara 發(fā)現(xiàn)中的工作,以及其他行業(yè)的工作,我們正在建立生成化合物的能力。想象一下,使用與 StyleGAN 和 Gaugan 沒有太大區(qū)別的深度學習,可以生成看似無限多的生成圖像。事實證明,你也可以生成各種化合物。我們有一個帶有圖形用戶界面的軟件,在這里你可以點擊并顯示化合物。這意味著在未來幾年,隨著這種能力的成熟,我們將擁有比以前多 100 萬個化合物。在我們有 10 億之前,再過幾年,我們將有 100 億種化合物需要處理。這仍然是表面現(xiàn)象,因為宇宙中潛在化合物的數(shù)量可能是 10 到 60 。 這是第二個動態(tài)數(shù)字。
因此,行業(yè)內的第一個動態(tài)正在發(fā)生,NVIDIA 正在促成這一動態(tài)。對于動態(tài)二號,我們正在為此打造一款產(chǎn)品。我們有 Clara 發(fā)現(xiàn),我們有一個特定的工作流程和一種叫做 MegaMolBART 的技術。
MegaMolBART 采用了 Megatron ,它最初是為大規(guī)模自然語言處理( NLP )而開發(fā)的,我們將 Megatron 重新用于化學語言,因為有一種方法可以使用字符串格式表示分子。因此,你可以重新利用所有這些 NLP 技術,而將 Megatron 推向市場的技術正是為我們藥物發(fā)現(xiàn)工作的這一部分提供動力的技術。這是同一個名為 NeMoMegatron 的軟件。
第三個動態(tài)數(shù)字是,如果你比以前多了一百萬個化合物,你比以前多了幾十個蛋白質結構,那么你想要模擬的組合比以前多了數(shù)百萬個。
現(xiàn)在,模擬,正如我們在計算上所知道的,可能是一個非常密集的問題。事實上, CUDA 的早期使用案例之一是在這種模擬中的分子動力學和科學計算中。但問題是,你如何,如何讓更多的人參與其中?我們正在組建一個團隊來研究這種模擬能力,我們正在聘請分子動力學、力場開發(fā)、高性能計算和深度學習應用程序方面的專家來模擬。我們還聘請了化學信息學專家、深度學習研究人員和工程師,以推進我們利用人工智能生成化合物和與蛋白質相互作用的技術。
我想這就是我們在這里所做的。這是一個獨特的群體,因為我們推出產(chǎn)品,也有產(chǎn)品驅動研究的空間。我們與整個公司的工程團隊廣泛合作,利用能夠推進這些產(chǎn)品的技術,并與各種研究團隊合作,利用整個公司的人工智能突破。
你能詳述一下你剛才說的嗎?你說它與NVIDIA 的其他研究領域有什么不同?
我想說的是,就我們正在進行的研究而言,大多數(shù)研究實驗室比我們有更多的靈活性。我們的組織在工程和研究之間保持健康的平衡,這樣我們既可以運送產(chǎn)品,又有足夠的帶寬來追求創(chuàng)新機會。但這確實意味著我們的研究目標或研究議程可能在某種程度上受到產(chǎn)品目標的限制,而典型的研究實驗室可能不會受到限制。在一個典型的學術實驗室,甚至是一個行業(yè)研究小組,我希望有更多的靈活性,但這是一個權衡。這是靈活性和交付軟件產(chǎn)品所需的高度關注之間的權衡。
這就是我要問的。那么,研究人員想要加入你們的團隊有什么價值呢?
問得好。我想說的是,我們傾向于吸引那些對創(chuàng)新研究感興趣并熱衷于確保其研究具有商業(yè)影響力的研究人員。對于這些人來說,這種權衡是有意義的。他們愿意根據(jù)需要限制和集中研究,以產(chǎn)生他們想要的那種商業(yè)影響。
所以他們的研究更側重于改善 Clara 發(fā)現(xiàn)和 Clara 巨摩爾巴特?
沒錯。因此,我們需要使研究活動與產(chǎn)品目標保持一致。
你提到,你的大部分工作都涉及工程師,你認為這些工程師在生物技術方面需要有多淵博的知識?
一個很好的問題。我發(fā)現(xiàn)很多有工程背景的人在工作中都學到了這一點。更重要的不是行業(yè)知識,而是真正的興趣。我們這里有很多工程師的例子,他們可能在大學里學習過一些這方面的知識,或者他們只是讀了一些這方面的知識,他們有正確的工程背景。
你知道,在一年或兩年的時間里,他們非常了解自己的行業(yè),因為他們與我們的合作伙伴和合作伙伴合作。所以我想說興趣是最重要的。
我記得你一開始提到,任何對人工智能、模擬和藥物發(fā)現(xiàn)交叉感興趣的人都會覺得這項工作很有趣。
確切地這是一項激動人心且極具挑戰(zhàn)性的工作,我們只是觸及表面。我期待著未來幾年,隨著我們對NVIDIA Clara 及其為生物技術界做出貢獻的潛力的深入了解,將會帶來什么。
關于作者
Nathan Horrocks 是 NVIDIA Research 的內容營銷經(jīng)理。他重點強調了 NVIDIA 實驗室在世界各地進行的驚人研究
審核編輯:郭婷
-
NVIDIA
+關注
關注
14文章
5083瀏覽量
103864 -
gpu
+關注
關注
28文章
4791瀏覽量
129462
發(fā)布評論請先 登錄
相關推薦
NVIDIA RTX賦能AI工作站加速數(shù)據(jù)科學工作流程
![<b class='flag-5'>NVIDIA</b> RTX賦能AI工作站加速數(shù)據(jù)科學工作流程](https://file1.elecfans.com/web3/M00/07/84/wKgZO2emvFeAfu5RAAAP1IeVhsY635.png)
NVIDIA攜手行業(yè)巨頭,共促醫(yī)療健康產(chǎn)業(yè)變革
NVIDIA AI Foundry服務助力藥物和醫(yī)療設備開發(fā)
NVIDIA攜手多家機構推動醫(yī)療健康產(chǎn)業(yè)變革
NVIDIA 攜手行業(yè)領先機構推動基因組學、藥物發(fā)現(xiàn)及醫(yī)療健康行業(yè)發(fā)展
![<b class='flag-5'>NVIDIA</b> 攜手行業(yè)領先機構<b class='flag-5'>推動</b><b class='flag-5'>基因組學</b>、<b class='flag-5'>藥物</b><b class='flag-5'>發(fā)現(xiàn)</b>及醫(yī)療健康行業(yè)發(fā)展](https://file1.elecfans.com/web3/M00/05/EF/wKgZO2eF-LOAF2QmAAWYagCB324004.png)
NVIDIA AI正加速推進藥物研發(fā)
NVIDIA AI助力日本制藥公司推進藥物研發(fā)
使用原代腫瘤細胞進行藥物篩選的數(shù)字微流控系統(tǒng)
![使用原代腫瘤細胞進行<b class='flag-5'>藥物</b>篩選的數(shù)字微流控系統(tǒng)](https://file1.elecfans.com/web2/M00/0B/D3/wKgZomc6oXCAcdf2AAATzxg2O5Q300.jpg)
NVIDIA加速計算技術助力癌癥研究
AI for Science:人工智能驅動科學創(chuàng)新》第4章-AI與生命科學讀后感
NVIDIA Parabricks v4.3.1版本的新功能
![<b class='flag-5'>NVIDIA</b> Parabricks v4.3.1版本的新功能](https://file1.elecfans.com/web2/M00/06/C8/wKgaombfrZiAVsXAAAGF-ITxADk520.png)
評論