在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習是許多生物學家用來分析數據的計算工具

姚小熊27 ? 來源:AI人工智能網 ? 作者:AI人工智能網 ? 2020-10-19 15:09 ? 次閱讀

機器學習是許多生物學家用來分析大量數據的計算工具,幫助他們識別潛在的新藥。麻省理工學院的研究人員現在已經在這些類型的機器學習算法中加入了一個新的特性,從而提高了他們的預測能力。

利用這種新的方法,計算機模型可以解釋他們分析數據的不確定性,麻省理工學院的研究小組發現了幾種有希望的化合物,這些化合物的目標是導致結核病的細菌所需的一種蛋白質。

這種方法以前曾被計算機科學家使用過,但尚未在生物學上得到應用,也可能在蛋白質設計和許多其他生物學領域有用,西蒙斯數學系教授、麻省理工學院計算機科學和人工智能實驗室(CSAIL)計算和生物學小組負責人邦尼·伯杰(Bonnie Berger)說。

“這項技術是已知的機器學習子領域的一部分,但人們還沒有把它引入生物學,”Berger說。“這是一個范式的轉變,絕對是生物探索的方式。”

Berger和Bryan Bryson是麻省理工學院的生物工程助理教授,也是MGH、MIT和哈佛的拉根研究所的成員,他們是這項研究的高級作者。細胞系統。麻省理工學院研究生BrianHie是論文的主要作者。

更好的預測

機器學習是一種計算機建模,在這種模型中,算法學習根據已經看到的數據進行預測。近年來,生物學家開始利用機器學習來搜索潛在藥物化合物的龐大數據庫,以找到與特定目標相互作用的分子。

這種方法的一個局限性是,當他們分析的數據與他們接受訓練的數據相似時,這些算法表現得很好,但它們并不擅長評估那些與他們已經看到的分子有很大不同的分子。

為了克服這一問題,研究人員使用了一種叫做高斯過程的技術,將不確定性值分配給算法所訓練的數據。這樣,當模型分析訓練數據時,他們也會考慮到這些預測的可靠性。

例如,如果進入模型的數據預測某一特定分子與目標蛋白質的結合程度,以及這些預測的不確定性,該模型可以利用這些信息對蛋白質-目標相互作用進行預測,這是它以前從未見過的。該模型還估計了自己預測的確定性。在分析新的數據時,模型的預測對于與訓練數據有很大不同的分子來說,其確定性可能較低。研究人員可以利用這些信息來幫助他們決定實驗測試哪些分子。

這種方法的另一個優點是該算法只需要少量的訓練數據。在這項研究中,麻省理工學院的研究小組用72個小分子及其與400多個蛋白質的相互作用(稱為蛋白激酶)對模型進行了訓練。然后,他們能夠使用這個算法分析近11000個小分子,這些小分子是從鋅數據庫中提取的,鋅數據庫是一個公開可用的儲存庫,含有數百萬種化合物。其中許多分子與訓練數據中的分子非常不同。

利用這一方法,研究人員能夠識別出與他們所加入的蛋白激酶具有非常強的結合親緣關系的分子。其中包括三種人類激酶,以及在結核分枝桿菌中發現的一種激酶。這種激酶,PknB,是細菌生存的關鍵,但不是任何一線結核病抗生素的目標。

研究人員隨后通過實驗測試了他們的一些最成功之處,以了解他們與目標的結合程度,并發現模型的預測非常準確。在模型給出的最確定的分子中,大約90%被證明是真正的命中--遠高于現有用于藥物篩選的機器學習模型的30%到40%的命中率。

研究人員還使用相同的訓練數據來訓練不包含不確定性的傳統機器學習算法,然后讓它分析相同的11000個分子庫。他說:“沒有不確定性,這個模型就會變得非常混亂,它提出了與激酶相互作用的非常奇怪的化學結構。”

然后,研究人員采取了一些最有前途的PknB抑制劑,并測試他們在細菌培養培養基中生長的結核分枝桿菌,并發現它們抑制細菌的生長。這些抑制劑也在感染細菌的人免疫細胞中起作用。

一個好的起點

這種方法的另一個重要因素是,一旦研究人員獲得額外的實驗數據,他們就可以將其添加到模型中,并對其進行再培訓,從而進一步改進預測。研究人員說,即使是少量的數據也能幫助模型變得更好。

Hie說:“每次迭代都不需要非常大的數據集。”“你可以用10個新的例子重新訓練這個模型,這是一個生物學家很容易產生的東西。”

布萊森說,這項研究是多年來首次提出新的分子,可以針對PknB,并且應該給藥物開發人員一個很好的起點,可以嘗試開發針對激酶的藥物。他說:“我們現在為他們提供了一些新的線索,超出了已經公布的范圍。”

研究人員還表明,他們可以利用同樣的機器學習來提高綠色熒光蛋白的熒光輸出,綠色熒光蛋白通常用于標記活細胞內的分子。它也可以應用于許多其他類型的生物學研究,Berger說,他現在正用它來分析推動腫瘤發展的突變。
責任編輯:YYX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1804

    文章

    48737

    瀏覽量

    246680
  • 機器學習
    +關注

    關注

    66

    文章

    8492

    瀏覽量

    134125
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    七款經久不衰的數據可視化工具

    Sense 是一種自助式分析工具,旨在通過內存計算和可視化手段使數據分析變得簡單直觀。它適合各種規模的企業,但相比于Tableau和Power BI,其
    發表于 01-19 15:24

    傳統機器學習方法和應用指導

    用于開發生物學數據機器學習方法。盡管深度學習(一般指神經網絡算法)是一個強大的工具,目前也非常
    的頭像 發表于 12-30 09:16 ?1051次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    DFT在生物信號分析中的應用

    一種強大的數學工具,能夠幫助科研人員更好地理解和分析這些生物信號。 DFT在生物信號分析中的應用 頻譜
    的頭像 發表于 12-20 09:28 ?844次閱讀

    zeta在機器學習中的應用 zeta的優缺點分析

    在探討ZETA在機器學習中的應用以及ZETA的優缺點時,需要明確的是,ZETA一詞在不同領域可能有不同的含義和應用。以下是根據不同領域的ZETA進行的分析: 一、ZETA在機器
    的頭像 發表于 12-20 09:11 ?890次閱讀

    微流控技術的生物學應用

    微流控技術為在推動生物學眾多領域的強大工具做出了巨大貢獻。隨著用于微通道中流體的注射、混合、泵送和存儲的新器件和工藝的發展,近年來微流控系統在化學和生物化學中的應用越來越廣泛。 盡管微流控技術近年來
    的頭像 發表于 12-01 21:50 ?436次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統自身的性能”。事實上,由于“經驗”在計算機系統中主要以數據的形式存在,因此機器學習需要設法對
    的頭像 發表于 11-16 01:07 ?859次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    《AI for Science:人工智能驅動科學創新》第一章人工智能驅動的科學創新學習心得

    人工智能:科學研究的加速器 第一章清晰地闡述了人工智能作為科學研究工具的強大功能。通過機器學習、深度學習等先進技術,AI能夠處理和分析海量
    發表于 10-14 09:12

    AI引擎機器學習陣列指南

    云端動態工作負載以及超高帶寬網絡,同時還可提供高級安全性功能。AI 和數據學家以及軟硬件開發者均可充分利用高計算密度的優勢來加速提升任何應用的性能。AI 引擎機器
    的頭像 發表于 09-18 09:16 ?715次閱讀
    AI引擎<b class='flag-5'>機器</b><b class='flag-5'>學習</b>陣列指南

    【「時間序列與機器學習」閱讀體驗】時間序列的信息提取

    個重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的分析和預測任務。 特征工程(Feature Engineering)是將數據轉換為更好地表示潛在問題的特征,從而提高
    發表于 08-17 21:12

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的
    發表于 08-14 18:00

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    的應用也很廣泛,用機器學習為時間分析帶來新的可能性。人們往往可以通過過往的時間序列數據來預測未來,在各行各業中都有很好的應用與發展前景。 時間序列分類: 1.單維時間序列 單維時間序列
    發表于 08-07 23:03

    數據分析除了spss還有什么

    Sciences)是一款非常流行的統計分析軟件,但除了SPSS之外,還有許多其他數據分析工具和方法。 引言 數據分析是一個跨學科的領域,涉
    的頭像 發表于 07-05 15:01 ?1097次閱讀

    數據分析工具有哪些

    數據分析是一個涉及收集、處理、分析和解釋數據以得出有意義見解的過程。在這個過程中,使用正確的工具至關重要。以下是一些主要的數據分析
    的頭像 發表于 07-05 14:54 ?1815次閱讀

    機器學習數據分析中的應用

    隨著大數據時代的到來,數據量的爆炸性增長對數據分析提出了更高的要求。機器學習作為一種強大的工具
    的頭像 發表于 07-02 11:22 ?1284次閱讀

    名單公布!【書籍評測活動NO.35】如何用「時間序列與機器學習」解鎖未來?

    ,如何將機器學習、深度學習或者大模型技術應用在大規模的數據生產中,是一個非常關鍵的問題。 國內外已出版了許多關于
    發表于 06-25 15:00
    主站蜘蛛池模板: 成 人 免费 黄 色 视频 | 日本三级456| 被男同桌摸内裤好爽视频 | 国产精品福利一区二区亚瑟 | 午夜在线视频免费观看 | 在线观看精品视频看看播放 | 五月婷丁香| 哟交小u女国产精品视频 | 婷婷色影院 | 日本一区不卡在线观看 | 国产伦子一区二区三区四区 | 91精选视频在线观看 | 欧美一级二级三级视频 | 欧美色图亚洲自拍 | 一区二区三区久久 | 亚洲欧美在线一区二区 | 一区二区三区视频免费观看 | 免费人成动漫在线播放r18 | 成 人网站免费 | 欧美成人午夜精品一区二区 | 激情五月视频 | 欧美天天 | 天天在线天天综合网色 | 丁香激情五月 | 天堂中文在线观看 | 国产在线黄 | 又潮又黄的叫床视频 | 女人张开腿 让男人桶视频 女人张开腿等男人桶免费视频 | 亚洲人成在线精品不卡网 | 伊人久久大香线蕉综合7 | 久久久久久久国产视频 | 色综合天天综一个色天天综合网 | 亚洲一区二区在线视频 | 伊人久久大香线蕉综合爱婷婷 | 欧美猛交xxxx乱大交 | 国产五月 | 久久综合五月婷婷 | 一级毛片ab片高清毛片 | 激情欧美在线 | 国产成人经典三级在线观看 | 美女 免费 视频 黄的 |