在生物醫(yī)學(xué)領(lǐng)域,DeepMind 又做出了具有里程碑意義的產(chǎn)品。
兩年一度的國(guó)際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽(CASP)的在周末正式公布最終結(jié)果。這個(gè)已經(jīng)進(jìn)行了 25 年的比賽項(xiàng)目,每屆都有來(lái)自世界各地的數(shù)百支團(tuán)隊(duì)參與,以促進(jìn)研究和衡量最新方法在提高預(yù)測(cè)準(zhǔn)確性方面的進(jìn)展。
據(jù)《衛(wèi)報(bào)》報(bào)道,DeepMind 花了兩年的時(shí)間做出來(lái)的“新生兒”AlphaFold 這次在 98 名參賽者中排名第一,它獲得了預(yù)測(cè) 43 種蛋白中的 25 種蛋白結(jié)構(gòu)的最高分,排名第二的隊(duì)伍只有其中 3 個(gè)獲得了預(yù)測(cè)最高分。CASP 的組織者稱 DeepMind “用計(jì)算方法在預(yù)測(cè)蛋白結(jié)構(gòu)中取得了前所未有的進(jìn)步”。
實(shí)際上,早在 2017 年 10 月,DeepMind 就表示他們對(duì)人工智能在藥物開(kāi)發(fā)中的應(yīng)用感興趣,而新藥開(kāi)發(fā)的重要一步就是對(duì)靶點(diǎn)蛋白質(zhì)三維結(jié)構(gòu)的精準(zhǔn)測(cè)算。
DeepMind 近日在博客中介紹了背后的技術(shù)原理。DeepMind 稱,通過(guò)采用跨學(xué)科方法,DeepMind 匯集了來(lái)自結(jié)構(gòu)生物學(xué)、物理學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域的專家,使用前沿技術(shù)在僅基于基因序列的基礎(chǔ)上預(yù)測(cè)蛋白質(zhì)的 3D 結(jié)構(gòu)。
蛋白折疊難題
眾所周知,蛋白質(zhì)是維持生命所必需的分子,帶有蛋白質(zhì)編碼的 DNA 片段則稱為基因,而蛋白質(zhì)的功能一般取決于其獨(dú)特的 3D 結(jié)構(gòu)。
例如,構(gòu)成人體免疫系統(tǒng)的抗體蛋白是“Y 形”的,形狀類似于獨(dú)特的鉤。通過(guò)鎖定病毒和細(xì)菌,抗體蛋白能夠檢測(cè)和標(biāo)記這些引發(fā)疾病的微生物并最終消滅它們。其他類型的蛋白質(zhì)包括 CRISPR 和 Cas9,它們會(huì)像剪刀一樣剪切并粘貼 DNA。
但純粹從蛋白質(zhì)的基因序列中找出三維形狀并不容易,其挑戰(zhàn)在于 DNA 僅包含有關(guān)蛋白質(zhì)構(gòu)建塊序列的信息——氨基酸殘基,它形成了長(zhǎng)鏈,預(yù)測(cè)這些鏈如何折疊成蛋白質(zhì)的復(fù)雜 3D 結(jié)構(gòu)也就是所謂的“蛋白折疊問(wèn)題”,是科學(xué)家們幾十年來(lái)都未曾解決的難題。
而預(yù)測(cè)蛋白質(zhì)的形狀有助于科學(xué)家了解它在體內(nèi)的作用,這也是診斷和治療由錯(cuò)誤折疊的蛋白質(zhì)所引發(fā)疾病的基礎(chǔ),如阿爾茨海默氏癥、帕金森氏癥、亨丁頓氏舞蹈癥和囊腫性纖維化。
隨著科學(xué)家們通過(guò)模擬和模型獲得更多關(guān)于蛋白質(zhì)形狀及其運(yùn)作方式的知識(shí),它會(huì)在藥物發(fā)現(xiàn)中發(fā)揮作用,同時(shí)也能降低相關(guān)實(shí)驗(yàn)成本,這將造福全世界數(shù)百萬(wàn)患者。此外,對(duì)蛋白折疊的理解也將有助于生物可降解酶的發(fā)展,以此更容易分解廢物。
AI 能做什么?
在過(guò)去的五十年中,科學(xué)家們已經(jīng)能夠使用冷凍電子顯微鏡、核磁共振等技術(shù)來(lái)確定實(shí)驗(yàn)室中的蛋白質(zhì)形狀,但這些方法的成本高達(dá)成千上萬(wàn)美元,而人工智能方法恰是很好的替代方案。
過(guò)去幾年中,由于基因測(cè)序成本的快速降低以及基因組學(xué)領(lǐng)域豐富的大數(shù)據(jù),依賴于基因組數(shù)據(jù)預(yù)測(cè)問(wèn)題的深度學(xué)習(xí)方法變得越來(lái)越流行。
DeepMind 的團(tuán)隊(duì)專注于從頭開(kāi)始建模目標(biāo)形狀的難題,而不是使用先前解析的蛋白質(zhì)作為模板。總體而言,他們使用了兩種不同的方法來(lái)預(yù)測(cè)完整的蛋白質(zhì)結(jié)構(gòu)。
使用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)物理特性
這兩種方法都依賴于深度神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)經(jīng)過(guò)訓(xùn)練可以從基因序列中預(yù)測(cè)蛋白質(zhì)的特性。
他們的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的特性包括:(a)氨基酸對(duì)之間的距離和(b)連接這些氨基酸的化學(xué)鍵之間的角度。這是在常用技術(shù)基礎(chǔ)上的一大進(jìn)步,這些技術(shù)估計(jì)氨基酸對(duì)是否彼此接近。
他們訓(xùn)練了一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)蛋白質(zhì)中每對(duì)殘基之間的距離分布,然后將這些概率組合成評(píng)估蛋白質(zhì)結(jié)構(gòu)準(zhǔn)確度的分?jǐn)?shù)。他們還訓(xùn)練了一個(gè)單獨(dú)的神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)使用匯總了的所有距離分布來(lái)評(píng)估預(yù)測(cè)結(jié)構(gòu)與標(biāo)準(zhǔn)結(jié)構(gòu)的接近程度。
構(gòu)建蛋白結(jié)構(gòu)預(yù)測(cè)的新方法
使用這些評(píng)分函數(shù),能夠找到與他們的預(yù)測(cè)相匹配的結(jié)構(gòu)。他們的第一種方法建立在結(jié)構(gòu)生物學(xué)常用的技術(shù)上,并用新的蛋白質(zhì)片段反復(fù)替換蛋白質(zhì)結(jié)構(gòu)的片段。他們訓(xùn)練出了一種生成神經(jīng)網(wǎng)絡(luò)來(lái)構(gòu)建新片段,以此來(lái)不斷提升預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確度。
第二種方法是通過(guò)梯度下降方法來(lái)優(yōu)化準(zhǔn)確度,這種技術(shù)應(yīng)用在了整個(gè)蛋白鏈而不是在組合之前單獨(dú)折疊的片段中,這也降低了預(yù)測(cè)處理的復(fù)雜性。
“預(yù)測(cè)蛋白折疊形狀對(duì)解決很多世紀(jì)性難題有重要意義。它可以影響健康、生態(tài)、環(huán)境等任何涉及生命系統(tǒng)的問(wèn)題。”在表達(dá)了對(duì)人工智能的信心后,雷丁大學(xué)的研究人員 Liam McGuffin 也理性表示,蛋白折疊問(wèn)題目前只是邁出了第一步,這是一個(gè)極具挑戰(zhàn)性的問(wèn)題,還有很多好想法沒(méi)能實(shí)施。
盡管 AlphaFold 沒(méi)有像“大哥”AlphaGo 橫空出世時(shí)那樣的熱度,但這并不能忽視 AlphaFold 對(duì)業(yè)界所具有的重要意義。
在 DeepMind 團(tuán)隊(duì)看來(lái),AlphaFold 的初步成就表明了 AI 在科學(xué)發(fā)現(xiàn)中的實(shí)用性,機(jī)器學(xué)習(xí)系統(tǒng)能整合各種信息來(lái)源,以幫助科學(xué)家快速找到解決復(fù)雜問(wèn)題的創(chuàng)造性解決方案。正如我們已經(jīng)看到 AI 如何通過(guò) AlphaGo 和 AlphaZero 等系統(tǒng)幫助人們掌握復(fù)雜游戲。他們希望,AI 技術(shù)的突破有一天會(huì)幫助人類掌握基本的科學(xué)問(wèn)題。
近來(lái)在 AI 在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用,包括語(yǔ)音錄入病歷、醫(yī)療影像、健康管理等多領(lǐng)域已然取得了一些成績(jī),但總體而言任重道遠(yuǎn),我們需要更多像 DeepMind 這樣的團(tuán)隊(duì)不斷地進(jìn)行探索。
-
人工智能
+關(guān)注
關(guān)注
1804文章
48599瀏覽量
245923 -
DeepMind
+關(guān)注
關(guān)注
0文章
131瀏覽量
11319
原文標(biāo)題:AlphaGo“兄弟”AlphaFold出世,背后用了哪些技術(shù)?
文章出處:【微信號(hào):mcuworld,微信公眾號(hào):嵌入式資訊精選】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
VirutualLab Fusion應(yīng)用:結(jié)構(gòu)光照明的顯微鏡系統(tǒng)
華為依托昇騰AI打造蛋白結(jié)構(gòu)預(yù)測(cè)工具
石墨烯制備的新方法

大華股份榮獲中國(guó)創(chuàng)新方法大賽一等獎(jiǎng)
基于遺傳算法的QD-SOA設(shè)計(jì)新方法

一種降低VIO/VSLAM系統(tǒng)漂移的新方法

大華股份榮獲2024年中國(guó)創(chuàng)新方法大賽一等獎(jiǎng)
利用全息技術(shù)在硅晶圓內(nèi)部制造納米結(jié)構(gòu)的新方法
上海光機(jī)所提出強(qiáng)激光產(chǎn)生高能量子渦旋態(tài)電子新方法

差示掃描量熱儀測(cè)試蛋白質(zhì)的應(yīng)用案例

保護(hù)4-20 mA,±20-mA模擬輸入的新方法

實(shí)踐JLink 7.62手動(dòng)增加新MCU型號(hào)支持新方法

一種無(wú)透鏡成像的新方法

從“蓋房子”到“頂竹筍”:我國(guó)科學(xué)家首創(chuàng)晶體制備新方法

評(píng)論