科學(xué)家使用 NVIDIA BioNeMo 創(chuàng)建出能夠生成高質(zhì)量蛋白質(zhì)的大型語(yǔ)言模型,以此加快藥物研發(fā)并助力創(chuàng)造更具可持續(xù)性的環(huán)境。
初創(chuàng)企業(yè) Evozyne 使用 NVIDIA 提供的預(yù)訓(xùn)練 AI 模型,創(chuàng)造了兩種在醫(yī)療和清潔能源領(lǐng)域具有重大潛力的蛋白質(zhì)。
今日發(fā)布的一篇聯(lián)合論文描述了這一過(guò)程及產(chǎn)出的蛋白質(zhì)氨基酸序列。其中一種蛋白質(zhì)用于治療一種先天性疾病,另一種用于消耗二氧化碳以減少全球變暖。
初步研究結(jié)果展示了一種加速藥物研發(fā)的新方法。
Evozyne 聯(lián)合創(chuàng)始人、論文共同作者 Andrew Ferguson 表示:“令人欣喜的是,這個(gè) AI 模型第一輪產(chǎn)出的合成蛋白質(zhì)就像自然生成的蛋白質(zhì)一樣,表示該模型已經(jīng)學(xué)會(huì)了自然界的設(shè)計(jì)規(guī)則。”
革命性的 AI 模型
Evozyne 使用了 NVIDIA 的 ProtT5。ProtT5 是一個(gè) Transformer 模型,是用于創(chuàng)建醫(yī)療AI模型的軟件框架和服務(wù)——NVIDIA BioNeMo 的一部分。
分子工程師 Ferguson 的研究領(lǐng)域涵蓋化學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域,他表示:“BioNeMo 非常強(qiáng)大,讓我們能夠訓(xùn)練模型,然后以非常低的成本使用該模型來(lái)運(yùn)行工作任務(wù),在幾秒鐘內(nèi)就能生成數(shù)百萬(wàn)個(gè)序列。”
該模型是 Evovyne ProT-VAE 流程的核心。ProT-VAE 是一個(gè)工作流,其將 BioNeMo 與作為過(guò)濾器的變分自編碼器(VAE)相結(jié)合。
他表示:“幾年前,還沒(méi)有人注意到可以使用大型語(yǔ)言模型與變分自編碼器相結(jié)合的方式來(lái)設(shè)計(jì)蛋白質(zhì)。”
讓模型向大自然學(xué)習(xí)
就如同人讀萬(wàn)卷書,NVIDIA 的 Transformer 模型會(huì)讀取數(shù)百萬(wàn)種蛋白質(zhì)中的氨基酸序列。該模型運(yùn)用神經(jīng)網(wǎng)絡(luò)用來(lái)理解文本的技術(shù),學(xué)會(huì)了大自然如何構(gòu)建蛋白質(zhì)氨基酸序列。
然后,該模型預(yù)測(cè)了如何組裝出能夠滿足 Evozyne 需求的新蛋白質(zhì)。
他表示:“這項(xiàng)技術(shù)正在助力我們開(kāi)展工作,以實(shí)現(xiàn)十年前無(wú)法實(shí)現(xiàn)的夢(mèng)想。”
無(wú)限的可能性
機(jī)器學(xué)習(xí)有助于研究海量可能的氨基酸組合,然后有效地識(shí)別最有用的序列。
傳統(tǒng)的蛋白質(zhì)工程設(shè)計(jì)方法,即定向進(jìn)化,采用的是一種緩慢、無(wú)計(jì)劃的方法,通常一次只改變幾個(gè)氨基酸的序列。

vozyne 的 ProT-VAE 流程采用了 NVIDIA BioNeMo 中強(qiáng)大的 Transformer 模型,生成有用的蛋白質(zhì),進(jìn)而助力藥物研發(fā)和能源領(lǐng)域?qū)崿F(xiàn)可持續(xù)性。
相比之下,Evozyne 的方法只通過(guò)一輪,就能改變一個(gè)蛋白質(zhì)中半數(shù)乃至以上的氨基酸。這相當(dāng)于進(jìn)行了數(shù)百次的突變。
他表示:“我們正在實(shí)現(xiàn)技術(shù)上的飛躍,這使我們能夠探索以前從未見(jiàn)過(guò)的、具有有用的新功能的蛋白質(zhì)。”
Evozyne 計(jì)劃使用新的工藝來(lái)構(gòu)建各種能夠?qū)辜膊『蜌夂蜃兓牡鞍踪|(zhì)。
縮短訓(xùn)練時(shí)間,擴(kuò)大模型規(guī)模
Ferguson 表示:“NVIDIA 在此方面是一家非常出色的合作伙伴。”
Evozyne 數(shù)據(jù)科學(xué)家 Joshua Moller 表示:“他們通過(guò)將工作擴(kuò)展到多個(gè) GPU 來(lái)加快訓(xùn)練速度。
這將訓(xùn)練大型 AI 模型的時(shí)間從幾個(gè)月縮短到一個(gè)星期。Ferguson 表示:“所以我們能夠訓(xùn)練出原本不可能訓(xùn)練出的模型,比如一些有數(shù)十億可訓(xùn)練參數(shù)的模型。”
未來(lái)將更加令人期待
使用 AI 加速蛋白質(zhì)工程的前景十分廣闊。
Ferguson 注意到了擴(kuò)散模型近期的發(fā)展:“這個(gè)領(lǐng)域的發(fā)展速度快得令人難以置信,我真的很期待日后的進(jìn)一步發(fā)展。”
“沒(méi)人知道我們五年后將能夠走多遠(yuǎn)。”
原文標(biāo)題:NVIDIA 和 Evozyne 創(chuàng)建用于生成蛋白質(zhì)的生成式 AI 模型
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3900瀏覽量
92870
原文標(biāo)題:NVIDIA 和 Evozyne 創(chuàng)建用于生成蛋白質(zhì)的生成式 AI 模型
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
華為依托昇騰AI打造蛋白結(jié)構(gòu)預(yù)測(cè)工具
Evo 2 AI模型可通過(guò)NVIDIA BioNeMo平臺(tái)使用
NVIDIA推出多個(gè)生成式AI模型和藍(lán)圖
NVIDIA 推出高性價(jià)比的生成式 AI 超級(jí)計(jì)算機(jī)

NVIDIA推出全新生成式AI模型Fugatto
NVIDIA助力Amdocs打造生成式AI智能體
創(chuàng)客中國(guó)AIGC專題賽冠軍天鶩科技:AI蛋白質(zhì)設(shè)計(jì)引領(lǐng)者

NVIDIA AI助力SAP生成式AI助手Joule加速發(fā)展
NVIDIA Nemotron-4 340B模型幫助開(kāi)發(fā)者生成合成訓(xùn)練數(shù)據(jù)

EvolutionaryScale推出基于NVIDIA GPU模型的新型蛋白質(zhì)研究方案
全新NVIDIA NIM微服務(wù)將生成式AI引入數(shù)字環(huán)境
NVIDIA攜手Meta推出AI服務(wù),為企業(yè)提供生成式AI服務(wù)
NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

評(píng)論