在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI領域頂會EMNLP 2020落下帷幕

醫健AI掘金志 ? 來源:IoT科技評論 ? 作者:IoT科技評論 ? 2020-12-15 18:12 ? 次閱讀

這項工作的意義在于,幫助醫學研究工作者更好地選擇醫學臨床試驗,特別在新冠疫情下,更好的醫學臨床試驗或許就意味著能更快地找到有效的治療方案。 日前,AI領域頂會EMNLP 2020落下帷幕。

今年全球僅有754篇論文被接受,接收率為24%,阿里巴巴憑借28篇論文成為入選論文數最多的中國科技公司。

據雷鋒網《醫健AI掘金志》了解,阿里相關研究成果覆蓋情感分析、文本生成及醫療NLP等領域。

在今年疫情的大環境下,醫療領域的研究與成果產出也不斷提速。

在名為《Predicting Clinical Trial Results by Implicit Evidence Integration》的論文中,達摩院研究團隊設計了針對醫學臨床試驗的進一步預訓練任務,并提出全新的模型,幫助醫學研究工作者更好地選擇醫學臨床試驗,以更快地找到有效的治療方案。

研究團隊在COVID-evidence數據集上完成了試驗,并證明了模型的有效性。

為此,該論文作者、達摩院算法專家譚傳奇進行了解讀。

自18年谷歌BERT橫空出世以來,預訓練語言模型一躍成為自然語言處理領域的研究熱點,“Pre-training + Fine-tune”也成為NLP任務的新范式,將自然語言處理由原來的手工調參、依靠機器學習專家的階段,進入到可以大規模、可復制的大工業施展的階段。

這篇論文在BioBERT(在醫學數據上訓練的BERT模型)的基礎上,設計了針對醫學臨床試驗的進一步預訓練任務(Post-Pre-training),最終在真實醫學臨床試驗數據上微調(Fine-tune)后,取得了超過10個百分點的結果提升。

而這項工作的意義在于,幫助醫學研究工作者更好地選擇醫學臨床試驗,特別在COVID-19疫情下,更好的醫學臨床試驗或許就意味著能更快地找到有效的治療方案。

劍指臨床試驗的設計難題

在循證醫學的時代,任何的治療都要有相應的臨床證據支持。證據往往來自于高質量的臨床試驗。然而,實施臨床試驗耗時耗力,需要大量資源支持。

并且,設計有缺陷或者難以成功的臨床試驗占用了寶貴的病人資源,可能會使亟待實施的臨床試驗因招募不到足夠的患者而被迫終止。

新冠肺炎疫情中的瑞德西韋臨床試驗就是一個例子:

因其他設計有缺陷或者難以成功的臨床試驗占用了不少病人資源,該試驗沒有招募到足夠的病人資源,而沒有得到統計學上顯著的結果。

所以,研究者需要在設計階段就去預測臨床試驗的結果,并優先進行成功概率較高的臨床試驗。

提出新的臨床試驗需要過往臨床證據的支持,比如WHO為新冠肺炎推薦優先檢測氯喹/羥氯喹,瑞德西韋,干擾素和洛匹那韋/利托那韋四種藥物優先進行臨床試驗。

推薦的理由就是,這些藥物在過往的實驗室或人體試驗中對相關冠狀病毒有效。然而,人類綜合過往臨床證據的能力有限。

譚傳奇引用了一個數據:一項研究發現大概86.2%的臨床試驗最終會失敗,WHO專家推薦的某些新冠肺炎治療方法,如氯喹/羥氯喹,也沒有得到好的結果。

臨床試驗設計難題的核心是臨床試驗的結果無法準確預測。

所以,如果能準確地預測臨床試驗的結果,就可以有針對性地進行成功概率的臨床試驗,從而大大提高臨床試驗實施的效率。

因此,譚傳奇團隊表示,在本工作中,我們的貢獻就在于:

第一、創新地從NLP的角度重新定義了臨床試驗結果預測任務;

第二、提出了一種基于大規模隱式臨床證據預訓練的模型EBM-Net(Evidence-Based Medicine Network)用以解決該任務,EBM-Net在各種指標上遠超醫學大規模語言模型BioBERT,如在標準數據集上有10.7%的相對F1提升,并且在新冠肺炎相關的臨床試驗上也被證明有效。

6dfc957e-34d3-11eb-a64d-12bb97331649.png

在上面這張圖中,參考醫學臨床試驗在填報提案時需要的基本信息,輸入是自然文本的形式的:

臨床試驗背景B,如“最新研究發現瑞德西韋在體外對新冠肺炎病毒有效……”;

要研究的人群P,如“重癥新冠肺炎病人”;

治療方法I,如“靜脈注射瑞德西韋”;

對照方法C,如“與瑞德西韋相匹配的安慰劑”;

測量指標O,如“死亡率”

輸出是其結果R,即在研究人群P中,治療組I和對照組C的測量結果O的比較關系,有升高、降低和不變三種。

EBM-Net

717acc3e-34d3-11eb-a64d-12bb97331649.png

為了解決上述臨床試驗結果預測任務,達摩院的團隊提出了針對循證醫學的EBM-Net模型,其結構如圖2所示,具體分為三步進行:

首先,用啟發式方法收集隱式證據;

然后,用隱式證據預訓練比較語言模型;

最后,用預訓練的模型進行臨床試驗結果預測。

收集隱式證據

臨床證據常常以一種比較的形式表達,如“瑞德西韋比對照組有更好的治療新冠肺炎的療效”,而找到這些證據就可以為我們提供訓練文本。

研究團隊發現,PubMed和PubMed Central是一個提供生物醫學方面的論文搜尋以及摘要,文獻資源中就包含需要的證據文本(注:醫學領域最好的大規模語言模型BioBERT的訓練數據即來自PubMed)。

這篇論文提出用關鍵詞匹配的方法,收集PubMed和PubMed Central中所有含有比較語義的句子:

為尋找表達升高和降低的語義,匹配含有“than”的句子,再進一步匹配形容詞或副詞的比較級,如“higher”,“smaller”等,同時含有“than”和一個或更多比較級的句子被收集;為尋找表達相似的語義,匹配含有“no difference between”和“similar to”模式的句子。

這些句子被稱為隱式證據,因為它們往往隱式地含有臨床證據所需要的PICO組分。他們還收集這些句子對應的文章摘要里的背景和方法的部分,作為隱式證據的背景B。

這種方法可以從PubMed和PubMed Central中提取出1180萬條隱式證據,其中240萬條表達結果降低,350萬條表達結果相似,590萬條表達結果升高。

預訓練比較語言模型

將收集到的隱式證據中提示結果語義的詞去除,就構造了一個類似語言模型訓練的問題,通過給定上下文信息,預測去除的比較詞。

論文中改進語言模型,提出用比較語言模型預訓練一個Transformer編碼器模型,即EBM-Net,以獲取預測臨床試驗結果的能力。具體地,兩組樣本被用于預訓練:

1、用正序的隱式證據預測其結果;

2、用反序的隱式證據預測相反的結果。

加入反序的例子有利于模型學到治療組和對照組之間的比較,而不是語言模型里的共現關系。

臨床試驗結果預測

在微調和測試時,團隊將一個新臨床試驗要研究的PICO要素拼接成E,將E和其研究背景B輸入到上述預訓練好的EBM-Net模型中,輸出其預測的比較結果,從而預測臨床試驗的結果。

標準數據集的試驗結果

EBM-Net在臨床試驗結果預測任務的標準數據集Evidence Integration試驗結果如圖3所示:

71e5b760-34d3-11eb-a64d-12bb97331649.png

從結果中可以看出:

1、EBM-Net相比其他方法,包括隨機預測、詞袋+邏輯回歸、利用MeSH知識圖譜、信息檢索+閱讀理解模型以及目前生物醫學NLP領域的SOTA模型BioBERT,都有很大的提高:BioBERT作為最強的基線模型,也比EBM-Net低了10.7%的相對macro-F1和9.6%的準確率;

2、EBM-Net相比其他方法在對抗攻擊下更魯棒:用|Δ||Δ|,即在對抗數據集上的accuracy的相對減少的值來衡量模型的魯棒性,|Δ||Δ|越大表示模型越易受攻擊。

BioBERT的|Δ||Δ|幾乎是EBM-Net的兩倍(5.1%比2.7%),說明EBM-Net遠比BioBERT魯棒;

EBM-Net用于新冠肺炎相關臨床試驗

達摩院團隊還基于COVID-evidence數據庫提取了截止5月12日前完成的22篇臨床試驗的結果,以本工作定義的臨床試驗結果預測的格式構建了一個小型數據集。

達摩院團隊提出的EBM-Net模型在該數據集上進行留一法驗證得到的macro-F1和accuracy都遠高于BioBERT,分別是45.5%比36.1%和59.1%比50.0%,再一次驗證了EBM-Net的有效性。

總結

為了優化臨床試驗的設計過程,本文從NLP的角度定義了臨床試驗結果預測任務,并且提出了一種基于大規模隱式證據預訓練的EBM-Net模型來解決這個任務。

EBM-Net在標準數據集和新冠肺炎相關臨床試驗上都有較好的表現,大幅超過生物醫學NLP的SOTA模型BioBERT。

未來,臨床試驗可以在EBM-Net等相關模型的協助下進行設計:

當我們固定了想要研究的疾病人群(P)和觀察指標(O)后,可以固定以現有的標準治療為對照(C),遍歷每種可能的新型治療方式(I)以及其相關的背景介紹(B),用模型預測其成功的概率,優先選取所有可能的治療方式中成功概率高的做臨床試驗。

當然,模型在技術上還需要進一步地提高才能更好地輔助臨床試驗設計。

后續,我們可以把團隊構建的大規模醫學知識圖譜集成在模型中,使其擁有更準確和魯棒的預測能力。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    34000

    瀏覽量

    275086
  • 語言模型
    +關注

    關注

    0

    文章

    558

    瀏覽量

    10647
  • 數據集
    +關注

    關注

    4

    文章

    1222

    瀏覽量

    25259

原文標題:劍指臨床試驗的設計難題!達摩院提出新模型EBM-Net,比最強基線模型準確率高9.6%

文章出處:【微信號:IoT_talk,微信公眾號:醫健AI掘金志】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    華太電子亮相第十三屆儲能國際峰會暨展覽

    此前,2025年4月12日,第十三屆儲能國際峰會暨展覽(ESIE 2025)在北京落下帷幕。作為儲能技術創新的重要參與者,蘇州華太電子技術股份有限公司攜重磅系統級產品亮相A3館A339展位,以“芯片-模組-系統”三級驗證體系全
    的頭像 發表于 04-14 17:13 ?515次閱讀

    后摩智能5篇論文入選國際

    2025年伊始,后摩智能在三大國際(AAAI、ICLR、DAC)中斬獲佳績,共有5篇論文被收錄,覆蓋大語言模型(LLM)推理優化、模型量化、硬件加速等前沿方向。
    的頭像 發表于 02-19 14:02 ?589次閱讀
    后摩智能5篇論文入選國際<b class='flag-5'>頂</b><b class='flag-5'>會</b>

    與 DeepSeek 對話,2025年AI硬件能為智慧醫療領域帶來什么幫助?

    我們與DeepSeek聊聊問問這款“AI流”2025,AI硬件能為智慧醫療領域帶來什么幫助?01提升醫療設備計算能力與實時數據處理效率在DeepSeek給出的回答中指出,
    的頭像 發表于 02-10 18:07 ?488次閱讀
    與 DeepSeek 對話,2025年<b class='flag-5'>AI</b>硬件能為智慧醫療<b class='flag-5'>領域</b>帶來什么幫助?

    不止于記錄:AI賦能,堅單北斗移動執法終端邁向智能化新時代

    終端,憑借其高精度定位、5G高速傳輸及AI技術的深度融合,正引領執法領域邁向智能化新時代。堅移動執法終端一、高精度定位,助力精準執法堅單北斗移動執法終端內置北
    的頭像 發表于 02-10 12:02 ?288次閱讀
    不止于記錄:<b class='flag-5'>AI</b>賦能,<b class='flag-5'>頂</b>堅單北斗移動執法終端邁向智能化新時代

    上能電氣亮相2024上海國際電力設備及技術展覽

    近日,第三十二屆上海國際電力設備及技術展覽(EP Shanghai 2024)暨上海國際儲能技術應用展覽(ES Shanghai 2024)在上海新國際博覽中心正式落下帷幕。上能電
    的頭像 發表于 12-10 13:47 ?455次閱讀

    AI在環境可持續發展方面的作用

    近日,《聯合國氣候變化框架公約》締約方會議第二十九次會議(COP29)在阿塞拜疆巴庫落下帷幕,與會者們齊聚于此,共同應對氣候變化。AI 在環境可持續發展方面的作用成為了本屆大會關注的焦點。
    的頭像 發表于 11-27 11:24 ?647次閱讀

    安全可靠,高效防爆:堅單北斗防爆終端在工業領域的創新應用

    堅單北斗防爆終端,憑借其安全可靠的性能與高效防爆技術,在工業領域展現出非凡的創新應用潛力,不僅提升了工業生產的安全標準,還促進了智能化管理與監控的深度融合,為工業安全生產與效率提升開辟了新路徑。
    的頭像 發表于 11-20 14:11 ?403次閱讀
    安全可靠,高效防爆:<b class='flag-5'>頂</b>堅單北斗防爆終端在工業<b class='flag-5'>領域</b>的創新應用

    RISC-V在AI領域的發展前景怎么樣?

    隨著人工智能的不斷發展,現在的視覺機器人,無人駕駛等智能產品的不斷更新迭代,發現ARM占用很大的市場份額,推出的ARM Cortex M85性能也是杠杠的,不知道RISC-V在AI領域有哪些參考方案?
    發表于 10-25 19:13

    經緯恒潤功能安全AI 智能體論文成功入選EMNLP 2024!

    :AnAdvancedLLM-BasedMulti-AgentforIntelligentFunctionalSafetyEngineering》成功入選EMNLP2024產業應用分會(IndustryTrack)。EMNLP作為自然語言處理
    的頭像 發表于 10-18 08:00 ?593次閱讀
    經緯恒潤功能安全<b class='flag-5'>AI</b> 智能體論文成功入選<b class='flag-5'>EMNLP</b> 2024!

    圓滿收官!昊衡科技2024中國光博之旅精彩紛呈

    2024年9月13日,為期三天的第25屆中國國際光電博覽(CIOE中國光博)在深圳國際會展中心圓滿落下帷幕。本屆光博以“光引未來,驅動
    的頭像 發表于 09-15 08:08 ?635次閱讀
    圓滿收官!昊衡科技2024中國光博<b class='flag-5'>會</b>之旅精彩紛呈

    華怡豐2024華南國際工業博覽精彩回顧

    日前,為期3天的華南國際工業博覽落下帷幕,在這個規模龐大的行業盛會上,華怡豐作為本屆參展商之一,以優質的產品和專業的服務在展會上贏得廣大參觀者的青睞!
    的頭像 發表于 09-09 14:13 ?504次閱讀

    AI4Science黑客松光子計算挑戰賽成功舉辦

    經過數月角逐,第二屆AI4Science黑客松競賽日前落下帷幕。在曦智科技主持的光子計算挑戰賽中,參賽選手何自強和來自東北大學的參賽隊伍The Power of Light獲得完賽優勝獎。
    的頭像 發表于 08-07 09:58 ?885次閱讀

    地平線科研論文入選國際計算機視覺ECCV 2024

    近日,地平線兩篇論文入選國際計算機視覺ECCV 2024,自動駕駛算法技術再有新突破。
    的頭像 發表于 07-27 11:10 ?1259次閱讀
    地平線科研論文入選國際計算機視覺<b class='flag-5'>頂</b><b class='flag-5'>會</b>ECCV 2024

    2020-2022-2024年TI杯全國大學生電子設計競賽官方推薦芯片對比分析比較

    2020-2022-2024年TI杯全國大學生電子設計競賽官方推薦芯片對比分析比較 一年一度的TI杯全國大學生設計競賽又正式拉開帷幕,器件清單一出來又忍不住對2024、2022年和2020年共3年
    發表于 06-25 10:25

    啟明智顯助力客戶 AI 法律機器人新品發布圓滿成功

    近日,一場備受矚目的AI法律機器人新品發布圓滿落下帷幕,在業界引起了廣泛的反響和高度關注。在這次發布會中,客戶所展示的AI法律機器人驚艷全
    的頭像 發表于 06-16 08:36 ?549次閱讀
    啟明智顯助力客戶 <b class='flag-5'>AI</b> 法律機器人新品發布<b class='flag-5'>會</b>圓滿成功
    主站蜘蛛池模板: 九九精品免费观看在线 | 国产一级做a爱免费观看 | 男人的天堂免费视频 | 精品欧美一区二区三区在线观看 | 99国产精品农村一级毛片 | 巨骚综合网| 四虎音影| 777色狠狠一区二区三区香蕉 | 国产精品麻豆va在线播放 | 亚洲精品久久久久午夜福 | 日本不卡毛片一二三四 | 深爱五月激情网 | 欧美影院在线 | 福利视频一区二区 | 国产成人啪午夜精品网站 | 午夜视频免费观看 | aaa一级片| 日本三级黄在线观看 | 激情综合视频 | 天天综合天天做天天综合 | 免费国产一区二区三区 | 亚洲 欧美 另类 综合 日韩 | 丁香花在线视频 | www.色天使| 人人插人人爽 | 亚洲一区三区 | 欧美综合色 | ts国产| 一区二区三区高清视频在线观看 | 成人手机看片 | 看真人一一级毛片 | 狂野欧美性色xo影院 | 国产一级一片免费播放视频 | 国模谢心2013.05.06私拍 | 激情六月丁香婷婷 | 综合网在线 | 国产一级特黄全黄毛片 | 老司机51精品视频在线观看 | 丁香激情小说 | 国产免费一级在线观看 | 婷婷久操 |