在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Net5.5G智能云網即將全面發布,打造新一代數字基礎設施

華為數據通信 ? 來源:智能感知與物聯網技術研 ? 2024-02-26 10:42 ? 次閱讀

中科大團隊開發首個通用的大語言模型分子交互學習框架,在多個數據集超 4,000,000 個分子對上驗證了其可靠性。

簡述

分子關系學習(Molecular Relational Learning)旨在理解和建模分子對的交互作用,如分子對交互(Drug-drug Interaction,DDI)、溶液-溶劑交互(Solution-solvent Interaction)。近來,憑借豐富的知識儲備和優秀的推演能力,大型語言模型(LLMs)已成為實現分子關系高效學習的重要工具。

盡管這一方法頗有成效,但當前范式的主要問題是數據利用的不充分。如下圖(a)所示,當前范式主要依賴于文本數據(如 SMILES),未能充分且顯式地利用分子圖中固有的豐富結構信息。

加劇這一問題的是統一學習框架的缺失,因為其阻礙了從各個數據集中學習到的關鍵交互信息與底層交互邏輯的高效共享和整合。如下圖 b 所示,這一缺失擴大了數據利用的不充分的影響,使得 LLMs 因高度過擬合的風險而無法建模那些廣泛存在的、數據量較少的分子交互任務。

wKgZomXb-xiAG2xwAAQuCmS3G-g797.jpg

▲ 圖1:當前基于 LLMs 的分子交互學習范式與 MolTC 的比較。(a)現行方法的通用范式;(b)將當前范式應用于樣本量較少的任務時所帶來的挑戰;(c)我們的 MolTC 的架構。

為了緩解這一問題,我們提出了一個通用的、基于 LLM 的多模態分子交互學習框架,MolTC(Molecular inTeraction Modeling enhanced by Chain-of-thought theory)。如上圖 c 所示,MolTC 通過圖編碼器(Encoder)和映射器(Projector)高效地建模分子圖信息,并創新性地提出了多層級思維鏈(Multi-hierarchical Chain-of-thought)的概念來引導訓練范式的優化。

此外,為了加強數據間的信息共享,我們為其設計了一個新穎的動態參數共享策略,以實現效率和精度的雙贏。同時,鑒于這一領域數據集的缺失,我們還構建了一個全面的分子交互指令數據集,MoT-instructions,用于提高當前基于 LLMs 的學習框架(包擴我們的 MolTC)對分子交互任務的理解能力。

我們在涉及超過 4,000,000 個分子對的十二個不同領域數據集上進行了驗證實驗。結果表明,我們的方法優于當前基于 GNN 的、基于(除 GNN 外)其它傳統深度學習架構的、和基于 LLMs 的基線方法。

多模態輸入框架

我們首先簡要介紹上圖 c 中所示的 MolTC 框架。其中,Graph Encoder 采用傳統的圖神經網絡(GNN)架構;Projector 采用在視覺領域常用于多模態對齊的 Querying Transformers (Q-Former)架構,作為 backbone 的 LLM 則是采用在生化任務中表現突出的 Galactica。更多細節勞請移步我們的論文和代碼。

基于多層級思維鏈的訓練范式

我們重點介紹基于多層級思維鏈的 MolTC 訓練范式。首先,考慮到從分子對中直接生成復雜相互作用的挑戰性,處于上層的思維鏈指導 MolTC 的預訓練過程優先識別并按次序輸出輸入分子對中,每個分子的關鍵生化性質,為準確預測它們的交互奠定基礎。具體而言,在預訓練階段,Prompts 的統一設計如下:

wKgZomXb-xeACnZ9AADkUPAur2E880.jpg

預訓練階段的數據來自多個權威的、包含分子-性質對的生化數據庫如 Drugbank 和 PubChem。為了提高 MolTC 在不同分子交互場景下的泛化能力,我們對上述數據庫中的分子進行隨機組合,來構造不同的分子對。

隨后,在微調階段,針對定性分子交互分析任務,Prompts 直接根據特定的下游任務進行定制。而針對傳統 LLMs 較難處理的定量分析任務,下層的思維鏈指導 MolTC 優先為目標數值預估一個大致的范圍,然后逐步將其細化到一個精確的值。以溶液-溶劑交互任務為例,其 Prompts 的設計如下:

wKgaomXb-xiAZAbwAAFjJa2wiP0534.jpg

動態參數共享策略

為了提高上述訓練范式的效率,MolTC 引入了一種新穎的參數共享策略。具體而言,我們首先考慮分子交互任務的以下關鍵屬性:

(1)交互中分子角色的重要性。例如,在溶液-溶劑交互場景中,水和乙醇互為溶劑會產生不同的能量釋放。某些時候,角色的顛倒甚至會導致交互反應的停滯。

(2)交互中分子順序的重要性。例如,在藥物對交互場景中,藥物引入順序的不同可能會導致不同的治療效果。

(3)分子角色/順序帶來的特征重要性的差異。例如,在發色團-溶液對中,一個化學基團在溶液內會對交互屬性產生關鍵的影響,但其在發色團中時,則可能對交互無足輕重。

wKgZomXb-xiAfUCpAAGMqSlMQhw455.jpg

▲ 圖2:應用動態參數共享策略后的的 MolTC 訓練范式。其中,鏈環表示兩個模塊之間的參數共享;雪花表示參數凍結;火焰表示參數更新。

這些屬性自然地啟發 MolTC 適應性地優先考慮倆個分子內的不同信息,即根據角色和順序為分子創建獨特的編碼。具體而言,為了學習到這種差異性,同時維持分子對中學習到的共性信息的共享,我們引入了如下參數共享策略:

(1)考慮 Graph Encoder 專注于提取底層的分子圖結構,并未將語義與分子結構進行對齊,因此,在預訓練和微調階段,MolTC 共享倆個 Graph Encoder 的參數,以增強其學習效率。

(2)考慮 Projector 專注于實現分子結構與語義信息的對齊,因此,在預訓練階段,MolTC 共享倆個 Projector 的參數以提高系統的泛化性和魯棒性;在微調階段,MolTC 終止這一共享,實現根據不同下游任務中的分子角色和順序量身定制的語義映射。

MoT-instruction數據集開發

在 MolTC 的訓練過程中,鑒于當前缺乏一個通用的、為大模型分子關系學習量身定制的指令數據集,我們首先給出這一數據集應當滿足的關鍵性質:(1)它應包含橫跨多個領域的、可以進行交互的大量分子對;(2)它應詳細描述這些分子對中每個分子的重要生化屬性,以及(3)它應根據思維鏈的形式闡述分子對的交互性質。

具體來說,我們通過以下三步構建上述 MoT-instructions 數據集:

(1)我們首先收集多個具有代表性的分子交互數據集,并從 DrugBank 和 PubChem 等權威生化數據庫中獲取這些交互所涉及分子的生化屬性;

(2)隨后,我們進行最優指令確定。具體而言,我們根據訓練 MolTC 得到的預測性能作為指標,來對定量交互 instructions 中的數值區間進行設定。并結合該值的統計數據(如均值和方差)得出最優區間設定和統計數據之間的規律,推廣至更多的定量交互數據集中;

(3)最后,我們將交互涉及的每個屬性單獨抽取至一個獨立的數據空間,以在排除交互屬性中缺失值、模糊值的干擾下,不浪費分子對所提供的其他有用信息。

實驗

為了更全面地評估 MolTC 的有效性,我們將基線算法分為三類:基于 GNN 的、基于其他深度學習模型的以及基于 LLMs 的方法。部分定性和定量的實驗結果如下表所示。更多結果如消融實驗結果煩請移步我們的文章或代碼。

wKgaomXb-xiAAnDsAAKQuxqhQh8193.jpg

▲ 表1:定性實驗結果(以藥物對交互任務為例)

wKgZomXb-xiAC2skAAKYl0_5Cng646.jpg

▲ 表2:定量實驗結果(以溶液溶劑交互任務為例)




審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3780

    瀏覽量

    137313
  • 語言模型
    +關注

    關注

    0

    文章

    560

    瀏覽量

    10696
  • GNN
    GNN
    +關注

    關注

    1

    文章

    31

    瀏覽量

    6509
  • LLM
    LLM
    +關注

    關注

    1

    文章

    321

    瀏覽量

    700

原文標題:MWC 2024 | 倒計時1天!Net5.5G智能云網即將全面發布,打造新一代數字基礎設施

文章出處:【微信號:Huawei_Fixed,微信公眾號:華為數據通信】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    PoE交換機如何助力智慧城市基礎設施建設?

    隨著全球城市化的加速發展,智慧城市的概念正逐步成為現實。通過技術手段提升居民生活質量、優化城市運營并促進可持續發展已成為趨勢。彈性且高效的網絡是智慧城市基礎設施的關鍵支撐,而以太供電(PoE
    發表于 03-25 10:20

    華為打造移動AI時代領先電信基礎設施

    使能平臺,助力運營商電信基礎設施從架構、自動化、綠色、AI等方面全面升級,從容應對復雜網絡挑戰,使能AI業務創新,打造移動AI時代領先電信基礎設施。 從電報、電話、移動通信、移動互聯網
    的頭像 發表于 03-08 11:39 ?661次閱讀

    華為亮相2025 WBBA寬帶發展大會

    在MWC25巴塞羅那期間,由WBBA主辦的寬帶發展大會(Broadband Development Congress, BDC)成功舉辦。本次峰會以“下一代互聯網演進,邁向智能化時
    的頭像 發表于 03-06 11:20 ?523次閱讀

    全球產業界共同發布Net5.5G網絡最佳實踐白皮書

    以"下一代互聯網演進,邁向智能化時代"為主題,吸引了來自全球產業組織、標準組織、政府機構、運營商、設備商等200余位行業領袖齊聚堂,共同探討Net5.5G演進方向、網絡技術創新、商用
    的頭像 發表于 03-05 14:40 ?265次閱讀
    全球產業界共同<b class='flag-5'>發布</b><b class='flag-5'>Net5.5G</b>網絡最佳實踐白皮書

    華為攜手產業伙伴打造一代智能電信基礎設施

    NFV是電信行業變革的重要催化劑,2012年NFV愿景白皮書的發布和ETSI NFV標準組織的成立,標志著電信行業新時代的開始。歷經十年發展,基于虛擬機的電信網絡化取得了令人矚目的成就,業已成為5G
    的頭像 發表于 02-24 17:00 ?425次閱讀

    Garmin佳明和天馬推出新一代數字座艙解決方案

    即將開幕的國際消費電子展(CES 2025)上,Garmin佳明推出全新一代數字座艙解決方案Garmin Unified Cabin 2025。該方案配備了天馬多款車規級顯示屏,其中包括款采用多屏全貼合技術的全新超寬顯示屏,
    的頭像 發表于 01-07 16:16 ?794次閱讀

    Garmin佳明和高通推出新一代數字座艙解決方案

    Garmin佳明和高通技術公司在2025年國際消費電子展(CES 2025)上宣布,雙方將擴展在汽車技術領域的合作,推出全新一代數字座艙解決方案Garmin Unified Cabin 2025,可基于單個Garmin控制模組提供可擴展的域控制器功能。
    的頭像 發表于 01-07 10:38 ?700次閱讀

    互聯網演進跨越半世紀,智能化時代呼喚Net5.5G網絡新代際

    沿著Net5.5G的方向加速前行,抵達充滿數字黃金機遇的新大陸
    的頭像 發表于 11-18 09:37 ?2421次閱讀
    互聯網演進跨越半世紀,<b class='flag-5'>智能</b>化時代呼喚<b class='flag-5'>Net5.5G</b>網絡新代際

    Net5.5G智能IP網絡峰會成功舉辦,全球Net5.5G加速商用部署

    上,全球領先運營商,產業組織,政府機構及設備廠商齊聚堂,分享Net5.5G IP承載演進和產業數字化演進新業務實踐,啟動全球Net5.5G
    的頭像 發表于 11-05 09:55 ?514次閱讀
    <b class='flag-5'>Net5.5G</b><b class='flag-5'>智能</b>IP網絡峰會成功舉辦,全球<b class='flag-5'>Net5.5G</b>加速商用部署

    華為推出面向Net5.5G的星河AI網絡解決方案

    今日,全球超寬帶高峰論壇(UBBF 2024)期間,華為數據通信產品線總裁王雷發表了題為“星河AI網絡:全面邁入Net5.5G,加速運營商新增長”的主題演講,分享了華為攜手全球領先運營商通過星河AI網絡解決方案助力客戶商業成功的具體實踐,并展望了智算場景下新業務的現有實踐
    的頭像 發表于 11-04 16:05 ?762次閱讀

    華為亮相Net5.5G智能IP網絡峰會

    由聯合國寬帶委員會、全球寬帶產業協會(WBBA)和華為共同舉辦的第十屆全球超寬帶高峰論壇(UBBF 2024)期間,在以“Net5.5G加速部署,邁向智能化時代”為主題的
    的頭像 發表于 11-04 15:39 ?650次閱讀

    智能駕駛所需的基礎設施

    智能駕駛所需的基礎設施主要包括以下幾個方面: 、通信網絡基礎設施 5G/6G網絡 :高速、低延
    的頭像 發表于 10-23 16:05 ?1593次閱讀

    艾為電子助力智能發布新一代旗艦產品

    近期,智能發布新一代旗艦產品——全智能清潔機器人逍遙001和智能洗地機S2,主打
    的頭像 發表于 07-14 09:28 ?1074次閱讀
    艾為電子助力<b class='flag-5'>云</b>鯨<b class='flag-5'>智能</b><b class='flag-5'>發布</b><b class='flag-5'>新一代</b>旗艦產品

    Net5.5G,全球運營商的AI之翼

    在AI時代飛翔,運營商的Net5.5G共識與實踐
    的頭像 發表于 07-05 16:12 ?1042次閱讀
    <b class='flag-5'>Net5.5G</b>,全球運營商的AI之翼

    華為發布Net5.5G時代《IP自動駕駛網絡白皮書》

    時代《IP自動駕駛網絡白皮書》,旨在以AI注智Net5.5G網絡,促進IP網絡加速邁向L4高階自智,助力運營商提質增效。 ? 《IP自動駕駛網絡白皮書》發布 在全球數字化轉型的浪潮下,網絡穩定以及用戶體驗變得尤其重要,運營商的網
    的頭像 發表于 06-29 11:02 ?1247次閱讀
    主站蜘蛛池模板: 日本黄色xxxx | 精品国产_亚洲人成在线高清 | 天天色天天色 | 五月亭亭六月丁香 | 亚洲欧美日韩色图 | www.色五月.com| 亚洲欧美日韩一区 | 午夜精品在线视频 | 日本久草网 | 在线色播 | 在线视频 二区 | 亚洲日本一区二区三区 | 日韩成人午夜 | 久久精品国产夜色 | 欧美18xxoovideos| 色费女人18女人毛片免费视频 | aa视频在线 | 欧美在线你懂的 | 亚洲精品电影天堂网 | 午夜免费视频观看在线播放 | 日本xxxx69日本| 人人插人人爱 | 亚洲国产精品第一页 | 涩狠狠狠狠色 | 欧美性aaa| 美女视频大全美女视频黄 | 成人综合婷婷国产精品久久免费 | 免费一级特黄特色大片在线观看看 | 天天干天天干天天天天天天爽 | 蕾丝视频在线播放 | 亚洲综合图片人成综合网 | 天堂资源最新版在线www | 色综合久久综合欧美综合图片 | 97精品伊人久久久大香线焦 | 五月天婷婷综合 | 米奇影院777 | 欧美成人午夜视频 | 亚洲一区二区三区中文字幕 | 久久久福利| 日产国产精品亚洲系列 | 免费你懂的 |