AlphaFold2 是 2021 年 AI for Science 領域最耀眼的一顆星。現在,有人在 PyTorch 中復現了它,并已在 GitHub 上開源。這一復現在性能上媲美原版 AlphaFold2,且在算力、存儲方面的要求對于大眾來說更加友好。
剛剛,哥倫比亞大學系統生物學助理教授 Mohammed AlQuraishi 在推特上宣布,他們從頭訓練了一個名為 OpenFold 的模型,該模型是 AlphaFold2 的可訓練 PyTorch 復現版本。Mohammed AlQuraishi 還表示,這是第一個大眾可用的 AlphaFold2 復現。
- 短序列推理:加快了在 GPU 上推理少于 1500 個氨基酸殘基的鏈的速度;
- 長序列推理:通過該研究實現的低記憶注意力(low-memory attention)對極長鏈進行推理,OpenFold 可以在單個 A100 上預測 超過 4000 個殘基的序列結構,借助 CPU offload 甚至可以預測更長的序列;
- 內存高效在訓練和推理期間,在 FastFold 內核基礎上修改的自定義 CUDA 注意力內核,使用的 GPU 內存分別比等效的 FastFold 和現有的 PyTorch 實現少 4 倍和 5 倍;
- 高效對齊腳本:該團隊使用原始 AlphaFold HHblits/JackHMMER pipeline 或帶有 MMseqs2 的 ColabFold,已經生成了數百萬個對齊。
scripts/install_third_party_dependencies.sh
使用如下命令激活環境:
sourcescripts/activate_conda_env.sh
停用命令:
sourcescripts/deactivate_conda_env.sh
在激活環境下,編譯 OpenFold 的 CUDA 內核
python3setup.pyinstall
在 / usr/bin 路徑下安裝 HH-suite:
#scripts/install_hh_suite.sh
使用如下命令可以下載用于訓練 OpenFold 和 AlphaFold 的數據庫:
bashscripts/download_data.shdata/
如果要使用一組 DeepMind 的預訓練參數對一個或多個序列進行推理,可以運行如下代碼:
python3run_pretrained_openfold.py
fasta_dir
data/pdb_mmcif/mmcif_files/
--uniref90_database_pathdata/uniref90/uniref90.fasta
--mgnify_database_pathdata/mgnify/mgy_clusters_2018_12.fa
--pdb70_database_pathdata/pdb70/pdb70
--uniclust30_database_pathdata/uniclust30/uniclust30_2018_08/uniclust30_2018_08
--output_dir./
--bfd_database_pathdata/bfd/bfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt
--model_device"cuda:0"
--jackhmmer_binary_pathlib/conda/envs/openfold_venv/bin/jackhmmer
--hhblits_binary_pathlib/conda/envs/openfold_venv/bin/hhblits
--hhsearch_binary_pathlib/conda/envs/openfold_venv/bin/hhsearch
--kalign_binary_pathlib/conda/envs/openfold_venv/bin/kalign
--config_preset"model_1_ptm"
--openfold_checkpoint_pathopenfold/resources/openfold_params/finetuning_2_ptm.pt
更多細節請參見 GitHub:https://github.com/aqlaboratory/openfold
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
算法
+關注
關注
23文章
4625瀏覽量
93129 -
開源
+關注
關注
3文章
3386瀏覽量
42612 -
深度學習
+關注
關注
73文章
5511瀏覽量
121356
原文標題:首個大眾可用PyTorch版AlphaFold2復現,哥大開源OpenFold,star量破千
文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
求教:樹莓派和arduino的通信
想讓樹莓派做arduino的上位機。 用的是樹莓派2B 和arduino UNO。第一步:在樹莓派linux系統下安裝arduino ide(失敗了)在樹莓派
發表于 09-23 10:01
【NanoPi M2試用體驗】NanoPi M2 debian簡單認識和疑問
聯網就成了一項極難的任務,即使現在,我依然沒有一個合理的解決方案。當然這也是我發表這篇帖子的初衷,學習之樂趣和水平的提高亦在交流(有點兒裝啊)。 目前我能想到的方法為,在Linux系統下安裝
發表于 05-03 22:22
【從0教學嵌入式Linux】第十七集
開發板的IP地址為:192.168.1.1013.開發板ping一下PC的Linux系統,確保網絡暢通4.在PC端的Linux系統
發表于 06-02 17:20
【從0教學嵌入式Linux】第三十二集
第32課:QT應用程序開發 (一)Linux系統下安裝QT Creator集成開發環境1、打開Software Center2、搜索QT Creator(二)應用開發1、
發表于 06-27 10:42
Linux系統下安裝ISO文件
路徑名) /mnt/cd1
3、此時,在/mnt/cd1目錄下,就有相應的安裝文件了,接下來安裝就可以了。
注:以上操作在su root 后進行,需要root權限。
發表于 07-04 08:21
最新版CCS7.3.0_官方軟件下載
CCSv6[6.2] 開始 Linux 版本只提供64位版本,只能在64位 Linux 系統下安裝及運行。 從 CCSv7 開始不支持 W
發表于 04-19 17:02
?0次下載

安裝Linux系統對硬件有什么要求
很多初學者在安裝 Linux 系統時,都對自己的電腦配置存在質疑,擔心其是否能夠滿足安裝 Linux 的要求。本節就從 CPU、內存、硬盤、
發表于 07-15 16:12
?2135次閱讀

在Linux下如何安裝和卸載rpm工具
在Windows系統下安裝軟件很簡單,只要雙擊后綴為.exe的文件,然后根據提示連續單擊“下一步”按鈕即可。然而在Linux系統
評論