在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

近五年來中文電子病歷的命名實體識別研究進展

深度學習自然語言處理 ? 來源:python遇見NLP ? 2020-08-27 17:56 ? 次閱讀

閱讀綜述性論文是一種能夠快速了解某一領域的方法,接下來通過今年的一篇綜述性論文來了解一下近五年來中文電子病歷的命名實體識別研究進展。

基本的,我們應該先來了解一下兩個概念:電子病歷和命名實體識別。

電子病歷(Electronic Medical Record,EMR)是指醫務人員在醫療活動過程中,使用醫療機構信息系統生成的數字化信息, 并能實現存儲、管理、傳輸和重現的醫療記錄。電子病歷中的文本內容是醫務人員按照《病歷書寫基本規范》和《電子病歷基本規范(試行)》中相關書寫規定,圍繞患者醫療需求與服務活動而記錄的描述性文本內容。

命名實體識別(Named Entity Recognition,NER)是指識別自由文本中具有特定意義的實體,如人名、地名、專有名詞等。與通用領域的命名實體不同,電子病歷中的命名實體通常有疾病、癥狀、治療等實體。

有了上述兩個概念的了解后,接下來我們就可以來了解中文電子病歷命名實體識別的任務,它包括:

①電子病歷數據的獲取與匿名化處理;

②明確命名實體種類,進行語料標注;

③構建模型進行實體識別;

④結果評價及優化。

以電子病歷中現病史章節為例,中文電子病歷命名實體識別研究任務流程如圖1所示:

從上述四個任務出發,我們繼續進行探討。

1

電子病歷數據集的獲取

中文電子病歷數據的獲取途徑通常包括:

①與醫院建立合作關系,如曲春燕等通過與某醫科大學附屬醫院建立合作關系獲取到該院35個大科室、87個小科室的992份電子病歷。同時,相關醫務人員也全程參與數據標注,為數據集的質量提供了保障。

②開放獲取的學術評測語料,如CCKS2020學術評測任務三開放了用于命名實體識別評測任務的已標注匿名化電子病歷1500份和未標注的電子病歷1000份,在電子病歷語料資源匱乏的現狀下,全國知識圖譜與語義計算大 會無疑為行業發展作出了巨大貢獻。 ③網絡發布的電子病歷資源。 當前,大多數研究采用第1種方式獲取電子病歷的研究數據,并邀請醫務人員參與語料數據的標注工作;而第2、3種獲取方式具有很大的不確定性,并且電子病歷的數據標注工作過程控制和質量控制均存在不確定性。

2

數據標注的相關工作

曲春燕等參照i2b2 2010的標注規范制定了中文電子病歷的標注規范,進而在兩名臨床醫生的全程參與下,對病歷文本分為前后共計4輪標注,并進行了一致性檢驗。楊錦鋒等在曲春燕等人的工作基礎上,對相同的病歷文本資源,進行了命名實體和實體關系的標注語料構建工作。He等在曲春燕、楊錦鋒等人的工作基礎上,新增了電子病歷文本的分詞、詞性標注、斷言、關系抽取等自然語言處理常見任務的語料標注工作,并對標注結果進行了一致性檢驗。 上述學者的延續性標注工作,對今后研究的語料標注工作具有一定的指導意義。然而,與臨床醫生長期從事語料建設和維護的難以實現。一方面,臨床醫生用于語料標注的時間有限;另一方面,邀請臨床醫生標注語料成本更高。因此,醫學數據標注團隊建設和專業人員培養的可行性值得探討。

3

主要的命名實體識別算法模型

中文命名實體識別的主要研究算法為條件隨機場(CRF)和雙向長短期記憶網絡模型條件隨機場(Bi-LSTM-CRF)。 Liu等設計不同特征模板和上下文窗口進行條件隨機場的學習訓練,進行模型實體識別效率的比對分析,以尋找最佳的電子病歷特征模板和上下文窗口。Liu等在i2b2 2010,2012和2014語料上實驗對比了Bi-LSTM-CRF與傳統的CRF實體識別算法的性能,結果表明Bi-LSTM-CRF性能較好。CCKS 2017學術評測任務二:面向電子病歷的命名實體識別,共收錄了7篇論文,研究內容和測評結果等見表1。總體上看,7篇論文均有對Bi-LSTM-CRF(或Bi-LSTM)算法模型的實現;均采用“字粒度”模型使用word2vec工具將輸入文本特征向量化表示。Zhang等利用CCKS 2017開放的電子病歷語料,分別采用CRFs和Bi-LSTM-CRF兩種統計機器學習算法從電子病歷數據集中識別疾病、身體部位和治療等信息,并對兩種方法進行了對比分析,發現后者性能較好。Qiu等為提高循環神經網絡模型的訓練速度,提出了殘差卷積神經網絡條件隨機場模型(RD-CNN-CRF)在CCKS 2017開放測試語料上獲得了較Bi-LSTM-CRF更高的訓練速度和F1值。CCKS 2018學術評測任務一:面向中文電子病歷的命名實體識別,共收錄論文2篇,分別是Yang等將詞嵌套、詞性、偏旁部首、拼音、詞典和規則特征作為條件隨機場(CRFs)的學習特征,實驗F1值為89.26%;Luo等基于多特征(如標點符號、分詞和詞典等特征)融合,整合CNN-CRF, Bi-LSTM-CRF, Bi-LSTM-CNN-CRF, Bi-LSTM+CNN-CRF和Lattice LSTM五種神經網絡模型,實驗F1值最高達到了88.63%(表1)。

4

結果評價及優化

隨著中文電子病歷命名實體識別的研究逐步深入以及相關算法框架的逐漸成熟,基于中文電子病歷的命名實體識別算法構成了臨床電子病歷系統、專病科研數據提取、臨床輔助決策系統的重要組成部分。 電子病歷命名實體識別結果評價指標說明如下圖:

袁冬生為解決出院小結文檔中普遍存在的信息不準確、無效信息、信息缺失等問題,設計開發了一套基于命名實體識別的出院小結錯誤檢測系統。李山為提高住院病歷錄入的交互性和可操作性,降低書寫的繁雜度,減輕醫生負荷,提高工作效率,使用條件隨機場算法,進行電子病歷命名實體識別,提取病歷中重要的診療信息,并將其應用在住院病歷錄入輔助中,以優化和改善病歷錄入方式。Su等則基于中文電子病歷命名實體標注規范構建了一個可用于識別心血管疾病危險因素的語料庫。

展望

.....

針對電子病歷的語義特征的量化分析與研究,對于提升算法特征工程質量有積極意義;近兩年來,針對電子病歷語料標注的成本問題,很多研究聚焦于半監督和無監督的算法來實現基于少量標注語料或完全基于非標注原始語料進行實體識別,是一個重要的研究方向。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 電子病歷
    +關注

    關注

    1

    文章

    61

    瀏覽量

    20180
  • 數字化
    +關注

    關注

    8

    文章

    8874

    瀏覽量

    62229
  • 識別
    +關注

    關注

    3

    文章

    173

    瀏覽量

    32020

原文標題:【NER綜述】近五年中文電子病歷命名實體識別研究進展

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    iPhone 17設計圖曝光,或迎年來最大變革

    近期,社交平臺X上流傳的一組疑似iPhone 17的工業設計圖,瞬間引發了廣泛關注和熱烈討論。這組設計圖不僅吸引了眾多科技愛好者的目光,更揭示了蘋果可能正在醞釀一場年來最具顛覆性的設計調整
    的頭像 發表于 02-10 09:30 ?287次閱讀

    語音識別技術在醫療領域的應用

    語音識別技術在醫療領域的應用已經越來越廣泛,為醫療服務帶來了諸多便利和效率提升。以下是對語音識別技術在醫療領域應用的介紹: 一、語音病歷 語音識別技術可以將醫生或患者的語音信息轉換成文
    的頭像 發表于 11-26 09:35 ?510次閱讀

    高能點焊電源技術在現代工業制造中的應用與研究進展

    制造中的最新研究進展。 一、高能點焊電源技術的基本原理及特點 高能點焊電源技術是一種利用高壓脈沖電流實現金屬材料瞬間熔化并完成焊接的先進工藝。其工作原理主要基于
    的頭像 發表于 11-23 08:58 ?242次閱讀
    高能點焊電源技術在現代工業制造中的應用與<b class='flag-5'>研究進展</b>

    從發展歷史、研究進展和前景預測三個方面對混合鍵合(HB)技術進行分析

    、無凸點的永久鍵合。闡述了HB 技術的發展歷史、研究進展并預測了發展前景。目前HB 技術的焊盤直徑/節距已達到0.75 μm /1. 5 μm,熱門研究方向包括銅凹陷、圓片翹曲、鍵合精度及現有設備兼容等,未來將突破更小的焊盤直徑/節距。HB 技術將對后摩爾時代封裝技術的發
    的頭像 發表于 11-22 11:14 ?1586次閱讀
    從發展歷史、<b class='flag-5'>研究進展</b>和前景預測三個方面對混合鍵合(HB)技術進行分析

    上海光機所在多路超短脈沖時空同步測量方面取得研究進展

    圖1.超短脈沖時空同步實驗的光路圖 近日,中科院上海光機所高功率激光物理聯合實驗室在多路超短脈沖時間同步與空間疊合度測量方面取得研究進展,相關研究成果以“High-precision
    的頭像 發表于 11-11 06:25 ?242次閱讀
    上海光機所在多路超短脈沖時空同步測量方面取得<b class='flag-5'>研究進展</b>

    AI大模型的最新研究進展

    AI大模型的最新研究進展體現在多個方面,以下是對其最新進展的介紹: 一、技術創新與突破 生成式AI技術的爆發 : 生成式AI技術正在迅速發展,其強大的生成能力使得AI大模型在多個領域得到廣泛應用
    的頭像 發表于 10-23 15:19 ?674次閱讀

    開爾文電阻測試方法有哪些

    (William Thomson, Lord Kelvin)在1861發明,主要用于測量低阻值電阻,以消除接觸電阻和引線電阻對測量結果的影響。以下是對開爾文電阻測試方法的介紹: 一、基本原理 開爾文電阻測試方法的基本原理是在未
    的頭像 發表于 08-27 11:35 ?1090次閱讀

    導熱紙(膜)的研究進展 | 晟鵬技術突破導熱芳綸紙

    問題。紙張及薄膜具有良好的柔韌性、優異的加工性和厚度可調整性,是良好的柔性導熱材料。本文概述了近年來導熱紙(膜)的研究進展,對不同基材的導熱紙進行了歸納分類和介紹,重點
    的頭像 發表于 07-12 08:10 ?870次閱讀
    導熱紙(膜)的<b class='flag-5'>研究進展</b> | 晟鵬技術突破導熱芳綸紙

    量子計算+光伏!本源研究成果入選2023度“中國地理科學十大研究進展

    近日中國地理學會公布了2023度“中國地理科學十大研究進展”本源量子參與的“量子地理計算技術、軟件及應用”研究成果獲選系量子計算領域唯一入選單位來源:中國地理學會此次入選的“量子地理計算技術、軟件
    的頭像 發表于 05-10 08:22 ?566次閱讀
    量子計算+光伏!本源<b class='flag-5'>研究</b>成果入選2023<b class='flag-5'>年</b>度“中國地理科學十大<b class='flag-5'>研究進展</b>”

    銻化物超晶格紅外探測器研究進展與發展趨勢綜述

    銻化物超晶格紅外探測器具有均勻性好、暗電流低和量子效率較高等優點,其探測波長靈活可調,可以覆蓋短波至甚長波整個紅外譜段,是實現高均勻大面陣、長波、甚長波及雙色紅外探測器的優選技術,得到了國內外相關研究機構的關注和重視,近年來取得了突破性的
    的頭像 發表于 04-19 09:13 ?1269次閱讀
    銻化物超晶格紅外探測器<b class='flag-5'>研究進展</b>與發展趨勢綜述

    用于先進電生理記錄的有源微納協同生物電子器件研究進展綜述

    開發精確靈敏的電生理記錄平臺對心臟病學和神經科學領域的研究至關重要。近年來,有源微納生物電子器件取得了重大進展,從而促進了電生理學的研究
    的頭像 發表于 04-16 10:55 ?812次閱讀
    用于先進電生理記錄的有源微納協同生物<b class='flag-5'>電子</b>器件<b class='flag-5'>研究進展</b>綜述

    綜述:高性能銻化物中紅外半導體激光器研究進展

    據麥姆斯咨詢報道,近期,由中國科學院半導體研究所和中國科學院大學組成的科研團隊受邀在《激光技術》期刊上發表了以“高性能銻化物中紅外半導體激光器研究進展”為主題的文章。該文章第一作者為曹鈞天,通訊作者為楊成奧和牛智川研究員。
    的頭像 發表于 04-13 12:08 ?2141次閱讀
    綜述:高性能銻化物中紅外半導體激光器<b class='flag-5'>研究進展</b>

    先進封裝中銅-銅低溫鍵合技術研究進展

    用于先進封裝領域的 Cu-Cu 低溫鍵合技術進行了綜述,首先從工藝流程、連接機理、性能表征等方面較系統地總結了熱壓工藝、混合鍵合工藝實現 Cu-Cu 低溫鍵合的研究進展與存在問題,進一步地闡述了新型納米材料燒結工藝在實現低溫連接、降低工藝要求方面的優
    的頭像 發表于 03-25 08:39 ?898次閱讀
    先進封裝中銅-銅低溫鍵合技術<b class='flag-5'>研究進展</b>

    電子封裝用金屬基復合材料加工制造的研究進展

    共讀好書 蓋曉晨 成都四威高科技產業園有限公司 摘要: 在航空航天領域中,金屬封裝材料被廣泛應用,對其加工制造工藝的研究具有重要的意義。近年來,金屬基復合材料逐漸代替傳統金屬材料應用于新一代
    的頭像 發表于 03-16 08:41 ?713次閱讀
    <b class='flag-5'>電子</b>封裝用金屬基復合材料加工制造的<b class='flag-5'>研究進展</b>

    2023度中國半導體十大研究進展出爐,一項傳感器技術入榜(附全名單)

    來源:《半導體學報》? ?2月5日,《半導體學報》發布2023度“中國半導體十大研究進展”名單,其中,一項傳感技術入選。 ? 由中國科學院上海技術物理研究所紅外科學與技術重點實驗室胡偉達、苗金水
    的頭像 發表于 02-20 08:37 ?956次閱讀
    2023<b class='flag-5'>年</b>度中國半導體十大<b class='flag-5'>研究進展</b>出爐,一項傳感器技術入榜(附全名單)
    主站蜘蛛池模板: 在线电影你懂得 | 九九美剧 | 免费一级黄色录像 | 91在线国内在线播放大神 | 天天免费看片 | 日日摸人人看97人人澡 | 日本a级影院 | 欧美日韩精品乱国产538 | 国产又色 | 免费精品一区二区三区在线观看 | 88xx成人永久免费观看 | www成人在线观看 | 久久99热精品 | 国产在线播放一区 | 婷婷综合久久中文字幕蜜桃三 | 五月婷婷在线免费观看 | 天天色成人 | 日本加勒比在线精品视频 | 人人草在线 | 韩国午夜精品理论片西瓜 | 日韩一级片免费 | 日本色黄视频 | 欧美一区二区三区黄色 | 精品三级三级三级三级三级 | jizjizjizjiz日本护士出水 | 大尺度在线播放 | 亚洲一级香蕉视频 | 久久综合久久久久 | 天天色资料 | 日本天天色| 欧美一级特黄aaaaaa在线看片 | 女人张开双腿让男人桶完整 | 永久免费的啪啪免费的网址 | 黄色片xxxx | 久久中文字幕一区二区三区 | 起碰成人免费公开网视频 | 天天cao在线 | 精品国产柚木在线观看 | 被男同桌摸内裤好爽视频 | 色男人在线 | 九九re6精品视频在线观看 |