由 NVIDIA 等企業(yè)賦能的一家初創(chuàng)公司推出了基于 NVIDIA GPU 模型的新型蛋白質(zhì)研究方案。
基于提示的代碼生成技術(shù)讓生成式 AI 徹底革新了軟件開發(fā)領(lǐng)域,接下來蛋白質(zhì)設(shè)計(jì)領(lǐng)域也將迎來變革。
EvolutionaryScale 于 6 月 25 日發(fā)布了第三代 ESM 模型 ESM3,該模型可同時(shí)對(duì)蛋白質(zhì)的序列、結(jié)構(gòu)和功能進(jìn)行推理,為蛋白質(zhì)研發(fā)工程師提供了一個(gè)可編程的平臺(tái)。
這家初創(chuàng)公司源自 Meta 公司的基礎(chǔ) AI 研究(FAIR)部門,最近獲得了由 Lux Capital、Nat Friedman 和 Daniel Gross 領(lǐng)投以及 NVIDIA 和亞馬遜參投的融資。
EvolutionaryScale 處于可編程生物學(xué)的最前沿,可以幫助研究人員設(shè)計(jì)蛋白質(zhì),從而幫助找到癌細(xì)胞的靶點(diǎn)、尋找有害塑料的替代品、推動(dòng)環(huán)境保護(hù)等等。
通過 ESM3 模型的規(guī)?;_發(fā),EvolutionaryScale 開拓了可編程生物學(xué)的前沿,讓 ESM3 成為有史以來算力最高的生物基礎(chǔ)模型。980 億參數(shù)的 ESM3 模型比其前身 ESM2 多使用了大約 25 倍的浮點(diǎn)運(yùn)算和 60 倍的數(shù)據(jù)。
EvolutionaryScale 整理了一個(gè)包含 20 多億個(gè)蛋白質(zhì)序列的數(shù)據(jù)庫用于訓(xùn)練 AI 模型,它提供的技術(shù)可以為藥物開發(fā)、疾病根除以及藥物研發(fā)人員服務(wù)。
通過 ESM3 加速計(jì)算機(jī)生物學(xué)研究
借助大量訓(xùn)練數(shù)據(jù),EvolutionaryScale 希望通過 ESM3 加速蛋白質(zhì)研發(fā)。
該模型采用了從生物體和生物群落中采樣的近 28 億個(gè)蛋白質(zhì)序列進(jìn)行訓(xùn)練,使科學(xué)家能夠提示該模型識(shí)別和驗(yàn)證新的蛋白質(zhì),并不斷提升精度。
與之前的版本相比,ESM3 帶來了重大更新。這是一個(gè)原生的生成式模型,也是一個(gè) “all to all” 模型,意味著結(jié)構(gòu)和功能注解可以作為輸入信息,而不僅僅是輸出信息。
該模型公開上線后,科學(xué)家們就可以對(duì)其進(jìn)行微調(diào),基于自己的專有數(shù)據(jù)構(gòu)建專用模型。ESM3 通過大量數(shù)據(jù)進(jìn)行大規(guī)模生成式訓(xùn)練,加強(qiáng)了蛋白質(zhì)設(shè)計(jì)能力,為計(jì)算機(jī)生物研究提供了一臺(tái)時(shí)光機(jī)。
通過 NVIDIA BioNeMo
推動(dòng)下一個(gè)重大突破
ESM3 為生物學(xué)家和蛋白質(zhì)設(shè)計(jì)師提供了增強(qiáng)的生成式 AI,幫助他們更好地設(shè)計(jì)和理解蛋白質(zhì)。通過簡單的提示,它可以根據(jù)提供的蛋白質(zhì)骨架生成新的蛋白質(zhì),根據(jù)反饋?zhàn)晕腋倪M(jìn)蛋白質(zhì)設(shè)計(jì),以及根據(jù)用戶指定的功能設(shè)計(jì)蛋白質(zhì)。這些功能能夠以任意組合串聯(lián)使用,以提供思維鏈蛋白質(zhì)設(shè)計(jì),就好像用戶在給一位“研究人員”發(fā)信息一樣,而這位“研究人員”已經(jīng)記住了人類已知的每一個(gè)蛋白質(zhì)序列的復(fù)雜三維含義,并且已經(jīng)流利地掌握了這種語言,使用戶能夠來回迭代。
EvolutionaryScale 聯(lián)合創(chuàng)始人兼工程副總裁 Tom Sercu 表示:“在我們的內(nèi)部測試中,ESM3 能夠創(chuàng)造性地響應(yīng)各種復(fù)雜提示,這給我們留下了深刻的印象。它曾解決了一個(gè)極其困難的蛋白質(zhì)設(shè)計(jì)問題,創(chuàng)造出一種新型的綠色熒光蛋白。我們希望 ESM3 幫助科學(xué)家加快工作進(jìn)展,開辟新的可能性——期待著看到它為未來的生命科學(xué)研究做出重要貢獻(xiàn)。”
EvolutionaryScale 已于 6 月 25 日開放 API 接口進(jìn)行封閉測試,提供小型 ESM3 開放版本的代碼和權(quán)重,供非商業(yè)用途使用。這個(gè)版本即將在NVIDIA BioNeMo上發(fā)布,后者是一個(gè)用于藥物發(fā)現(xiàn)的生成式 AI 平臺(tái)。完整的 ESM3 系列模型將很快以NVIDIA NIM微服務(wù)的形式提供給指定客戶,該服務(wù)在與 NVIDIA 合作下進(jìn)行了運(yùn)行時(shí)優(yōu)化,并由 NVIDIA AI Enterprise 軟件許可證支持,可在 ai.nvidia.com 上進(jìn)行測試。
訓(xùn)練這些模型所需的算力呈指數(shù)級(jí)增長。ESM3 使用 Andromeda 集群進(jìn)行訓(xùn)練,該集群配備了NVIDIA Quantum-2 InfiniBand網(wǎng)絡(luò)。
ESM3 模型將在指定合作伙伴的平臺(tái)上提供,包括 Amazon Bedrock、Amazon Sagemaker、AWS HealthOMICs 和 NVIDIA BioNeMo。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5282瀏覽量
106030 -
gpu
+關(guān)注
關(guān)注
28文章
4925瀏覽量
130890 -
AI
+關(guān)注
關(guān)注
88文章
34747瀏覽量
276850 -
模型
+關(guān)注
關(guān)注
1文章
3504瀏覽量
50184
原文標(biāo)題:NVIDIA 為用于蛋白質(zhì)設(shè)計(jì)的生成式 AI 模型 ESM3 提供支持
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)
IBM Spectrum LSF在生命科學(xué)和生物制藥領(lǐng)域的應(yīng)用
華為依托昇騰AI打造蛋白結(jié)構(gòu)預(yù)測工具
Evo 2 AI模型可通過NVIDIA BioNeMo平臺(tái)使用
0xmd公司通過NVIDIA GPU打造醫(yī)療AI解決方案
NVIDIA推出GeForce RTX 50系列臺(tái)式機(jī)和筆記本電腦GPU
差示掃描量熱儀在食品行業(yè)的應(yīng)用

AI先驅(qū)榮獲諾貝爾物理學(xué)獎(jiǎng)和化學(xué)獎(jiǎng)
《CST Studio Suite 2024 GPU加速計(jì)算指南》
Supermicro推出直接液冷優(yōu)化的NVIDIA Blackwell解決方案

AMD與NVIDIA GPU優(yōu)缺點(diǎn)
AI實(shí)火!諾貝爾又把化學(xué)獎(jiǎng)?lì)C給AI大模型
差示掃描量熱儀測試蛋白質(zhì)的應(yīng)用案例

創(chuàng)客中國AIGC專題賽冠軍天鶩科技:AI蛋白質(zhì)設(shè)計(jì)引領(lǐng)者

評(píng)論