蛋白質結構研究加速度
蛋白質是生命的基石,由氨基酸鏈組成,并折疊成復雜的形狀。蛋白質根據儲存在DNA中的指令產生復雜的生物分子,它們執行著至關重要的細胞任務,并完成各種機體功能。
一些蛋白質是有益的,例如那些參與消化食物的蛋白質;而另一些則是有害的,例如那些參與腫瘤生長的蛋白質。它們各自都有著非常復雜的形狀和結構。
由于蛋白質的形狀與其功能密切相關。了解蛋白質的結構可以更好地了解其作用和工作原理,這也是解決許多生命科學問題的關鍵。
以前,研究人員需要付出幾個月或幾年的時間和精力,才能弄清蛋白質的結構。
如今,憑借人工智能的力量,幾秒鐘內就能完成。
它不僅可被用于疾病研究、食物安全、疫苗開發、可持續發展等領域;
還幫助科學家深入了解體內復雜過程是如何工作的、以及哪些有機分子能被用于克服污染、生命起源于何處等那些為全人類所關注的重要問題。
AlphaFold蛋白質數據庫
AlphaFold蛋白質數據庫不僅實現了1000倍的擴容,成為[蛋白質宇宙],更能在幾分鐘破解漸凍人等不治之癥相關的世界級生物難題。
這些轉儲數據將在DeepMind和歐洲分子生物學實驗室歐洲生物信息研究所共同建立的一個數據庫中免費公開。
在這些逾 2.14 億個結構預測中,約35%的預測結果被認為準確度很高,即和實驗解析的結構一樣可靠。
另有45%的預測被認為置信度足夠高,在很多情況下都能使用。
AlphaFold預測的許多結構都很可靠,能在很多情況下替代實驗解析的結構。
其他情況下,研究人員會用AlphaFold的預測結果驗證和解讀實驗數據。
不可靠的預測結果一望即知,其中一些源于蛋白質固有的無序性質,這種無序意味著蛋白質本身沒有固定的形狀,至少在沒有其他分子的情況下是無序的。
AlphaFold的發展歷程
2016年,DeepMind公司開發的AlphaGo擊敗韓國傳奇圍棋選手李世石后,其先進性與潛力受到認可,DeepMind決定成立團隊開始研究[蛋白質折疊問題]。
2018年12月,AlphaFold在第13屆國際蛋白質結構預測競賽上預測出了43種蛋白質中25種蛋白質的最精確結構。
2020年,DeepMind 推出一個名為 AlphaFold的AI算法,它可以正確地完成蛋白質的結構測定。
2021年,與歐洲分子生物學實驗室EMBL合作,建立了一個公開發布 AlphaFold 預測結果的可搜索數據庫,即 AlphaFold DB,其公布的最初一組數據包含了 98% 的人類蛋白質。
2021年7月15日,DeepMind通過一篇Nature論文開源了其基于深度學習神經網絡的AlphaFold2模型;
7月22日,DeepMind再次發表Nature論文,推出AlphaFold蛋白質結構數據庫,向公眾免費開放人類蛋白質組以及另外20種模式生物的總共超過350000種結構,并且對98.5%的人類蛋白質結構進行了準確預測。
今年1月,DeepMind 宣布已經有超過30萬研究者使用了 AlphaFold數據庫,并且添加了超過27個蛋白質組,總計超過19萬條蛋白質結構預測數據。
這次添加的重要性在于其中17個蛋白質組都和被忽視熱帶疾病有關,影響全球十多億人。
今年7月,DeepMind 將 AlphaFold 數據庫從近100萬條擴展到2.14億條,覆蓋了人類已知的絕大多數蛋白質。
目前預測準確度尚待提升
人工智能有一個學習的過程,要通過大量的訓練來提升其準確性。
如果AlphaFold預測的蛋白質結構是不常見的結構,AI無法通過已有的知識學習到這個結構,預測時就容易產生偏差。
AI是一個能夠利用現有的知識預測將來的工具,如果連現有的知識都是缺失狀態,自然無法預測新結構。
除非把世界上所有的蛋白質結構都預測并驗證過了,否則是不可能達到100%的準確率。
雖然對部分蛋白質結構的預測不完全準確,但AlphaFold蛋白質結構數據庫在開放數據的同時也提供了相應結構預測的準確度報告,為使用者提供參考。
將開啟數字生物學新時代
過去幾十年來,確定蛋白質結構的主要方法是實驗室中的各種成像技術,包括X 射線晶體學、冷凍電鏡、微晶電子衍射等。
這些方式通常依賴昂貴的設備,耗時比較長,解析出一個蛋白質結構可能需要數月甚至數年時間。
與實驗室中的各種成像技術相比,基于氨基酸序列預測蛋白質結構是一種極具吸引力的方式,也是 AI 在生命科學領域的重要落腳點。
以 AlphaFold 為代表的蛋白結構預測模型可能是人工智能對科學界的最大貢獻。
DeepMind 在官方通稿中表示:以 AlphaFold 為代表的蛋白結構預測將生物學帶入了一個結構更為豐富的時代,并以數字化速度開啟科學探索。
結尾:
數量龐大的蛋白質結構為生命科學研究帶來的影響仍是毋庸置疑,尤其是在結構生物學的領域。
AlphaFold蛋白質結構數據庫中的結構雖然有不足之處,不能全部將其應用于研究中,但數量龐大的蛋白質結構對生命科學各個領域的研究,仍有著不可忽略的意義。
部分資料參考:雷鋒網:《AlphaFold 新成果再次引爆生命科學界》,ZAKER:《AlphaFold把幾乎所有已知蛋白質的結構預測完了》,硅星人:《DeepMind“順手”放的大招,要一舉攻克漸凍人癥》
編輯:黃飛
-
人工智能
+關注
關注
1799文章
47973瀏覽量
241406
原文標題:分析丨AlphaFold幾乎破解所有蛋白質,Deep Mind的下一步戰略?
文章出處:【微信號:World_2078,微信公眾號:AI芯天下】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
面向生物傳感器和電路的蛋白質納米線
蛋白質組學技術與藥物作用新靶點研究進展 精選資料分享
點成分享 | 蛋白質濃度測定之BCA法
基于PPI網絡與機器學習的蛋白質功能預測方法
DeepMind推出的AlphaFold可以僅根據基因「代碼」預測生成蛋白質的3D形狀
谷歌人工智能部門DeepMind解決蛋白質折疊問題,運算時間數月縮短至數小時
AlphaFold證明人工智能可以解決基本科學問題
基于衰減系數的動態蛋白質預測網絡模型
奶粉蛋白質檢測儀的特點及功能
人工智能+蛋白質組學或改變藥物研發模式
食品中蛋白質含量測定儀介紹
蛋白質測定儀工作原理是怎樣的
使用AlphaFold2進行蛋白質結構預測

評論