隨著DRG支付方式的逐漸落地,醫院將從“點餐”模式向“自助餐”經營模式實現巨大的轉變。
近日,雷鋒網醫療科技·未來投資云峰會揭幕。 本次峰會邀請到紅杉中國、軟銀中國、高榕資本、聯想創投、點石資本、磐霖資本、啟明創投、國科嘉和、遠毅資本的多位頂級觀察者,以云峰會形式,從專業投資人的角度剖析醫療大數據、藥企創新服務、醫療機器人等多個醫療科技新領域的投資邏輯和項目經驗。來自遠毅資本的唐軼男以《AI病案質控在DRG支付和醫院精細化管理領域的應用》為題,發表了主題演講。 她表示,隨著DRG支付方式的逐漸落地,醫院將從“點餐”模式向“自助餐”經營模式進行轉變。 在此背景下,醫院病案數據的重要性呈指數級上升,因為病案數據起到了一個連接臨床系統和支付體系的橋梁作用,承載了醫保支付績效考核多層次的重任,關乎醫院的面子和里子。 然而,醫院病案數據的質量卻面臨很大的問題,因此,數據驅動的精細化管理是未來的一大方向,以“質控”為核心的AI系統將為醫院帶來巨大的經濟價值和管理價值。
以下為唐軼男的峰會演講內容,雷鋒網《醫健AI掘金志》作了不改變原意的編輯及整理
感謝雷鋒網的邀請,我是遠毅資本的唐軼男。 從三年前起,我開始關注醫保支付改革。當時特別興奮,因為只有變化才能給新事物帶來成長的機會。 作為一個早期的醫療投資機構,我們的任務就是在一個賽道成為行業共識之前,識別并提前布局。未來十年,醫療行業最大的一個變量就是醫保改革。幸運的是,通過對DRG的研究,我發現了一個新的賽道——AI的病案質控。 首先,先介紹一下遠毅資本。 我們是一家專注于醫療早期風險投資的基金,有四大投資方向:流通觸達、保險科技、器械設備和精準診療。其中,保險支付和流通觸達是遠毅資本比較獨特的兩個投資方向。 下面是我們的一些代表性投資企業,很多已經成為細分賽道的領先者。
病案數據質量是新時代醫院管理的重中之重首先,我想談談為什么會出現新的賽道 醫保支付改革也就是DRG,未來5年將從現在的模擬運行走到更廣泛的全方位落地,這已經成為醫療行業的明確共識。 按照目前采用按項目付費的體系,醫院賺的是藥品、耗材加成的錢。理論上來說,這種體制會引導醫院產生過度醫療的行為。 而目前正在推廣的DRG,也就是按病種付費,未來會給醫院的經營模式帶來一個底層的顛覆。在DRG的模式下,會根據患者的疾病嚴重程度以及診療過程的資源消耗情況,對醫療服務進行一系列的標準化分類,產生上千種DRG的組別。 如果一個闌尾炎患者所在DRG組別的支付標準在1萬元,那么醫院會盡量減少藥品、耗材等成本的浪費。該用的還得用,但是不需要的就盡量不用。如果只花掉6000元的成本就可以治好病,那么節余的4000元可以給醫生發工資或者發展新的技術。 做一個通俗的比喻:醫院將從點餐模式向自助餐經營模式進行轉變。之前按項目付費的方式,醫院沒有經濟風險,做什么都有加成的收入,所以不會虧損。但等到DRG以后,醫院會面臨更大的經濟風險。
虧損的原因通常有兩類:第一類就是治療的成本超支,由于疾病的復雜性或者醫療質量問題。例如,術后感染導致患者多住一個星期院,費用肯定超支。 一個5萬塊錢的DRG分組,如果醫院的治療花費在1.5萬到15萬這個區間內,通通都只能拿到5萬塊錢的總收入。而這5萬是所有的自費部分加醫保部分的總和。 所以,只要費用落在圖中綠色部分,醫院虧損的風險就很大。而剩下的兩端是費用極低和極高的部分,會按項目結算的方式來覆蓋一些比較少量的特殊案例。第二種虧損是由于病案質量和編碼的問題,這種就比較可惜。一個8萬元的治療只在病案上體現出了5萬元的難度,從而進入了一個更低的DRG組別。無論醫院怎么縮減成本,這個病例大概率都會嚴重虧損。
有院長表示,在DRG的大背景下,病案數據的重要性呈指數級上升。 因為病案首頁和醫保結算清單承載了醫保支付績效考核多層次的重任,關乎醫院的面子和里子,生存還有發展。病案數據起到了一個連接臨床系統和支付體系的橋梁作用。在按項目付費的模式下,醫院什么樣的數據是最準的?肯定是費用數據。同樣的道理,在未來DRG付費的模式下,只有準確的病案才能帶來準確的支付。 病案數據的質量現狀如何? 中國的大三甲醫院,臨床質量在世界范圍內都很高,但臨床質量和數據質量是一個高度不匹配的狀態。而未來的醫保支付是按照數據質量來付。 數據質量鴻溝產生的原因是什么? 醫院的臨床質量是高年資醫生、主任們來把關,但是寫病歷的都是誰?是低年資醫生甚至是規培生,往往無法在病案中體現完整的臨床思維過程。 從病案到病案首頁、編碼,信息會層層失真。臨床質量提升10%是非常難的。但是在數據生產的過程中,損失20%-30%是極為簡單的,這是目前普遍存在的狀態。 因此,無論從醫保還是醫療質量評價的角度,數據質量的提升都是關鍵中的關鍵。 除了支付,病案數據也是醫院精細化管理的核心情報之一。 醫療服務是高度非標的,醫生群體是一個知識密集型的專家組織,這兩點因素會加大醫院精細化管理的難度,企業常用的流程管理方法不適合醫療管理。 因此,數據驅動的精細化管理是未來的一大方向。
在新的支付體系下,醫院的精細化管理需求會從之前的“nice to have”變成一個“must have”。病案數據包含了醫療服務過程所有的核心信息,將會成為管理決策的核心依據。 如果數據不準確,會帶來一系列的問題,打擊臨床工作的積極性。所以,只有基于準確的數據才能推動高效的管理。
DRG推廣后,又會對醫院的發展產生什么影響? 目前,中國大、小醫院并沒有在CMI指數,也就是疾病的難度系數上拉開差距,有兩方面的原因:首先,分級診療并沒有真正落地,大醫院看了很多的常見?。黄浯?,頭部醫院的臨床水平沒有在病案數據上得到準確的體現。但是,DRG支付已經在美國運行了30年,醫院間的CMI指數以及發展的差距會不斷加大。有些醫院實現了跨越式發展,有些醫院最終關停,病案數據質量起到很關鍵的作用。 在數據中,如果能找回5%的CMI損失,就可以幫醫院提升5%的營收。國內三甲醫院的營收普遍在十億甚至幾十億的量級,5%將會是一個巨大的數字。 如果把這些錢投入到??平ㄔO、引進新技術、人才激勵等方面,就可以幫助醫院實現持續發展。AI病案質控產品的應用價值AI病案質控是什么,能給醫院帶來怎樣的價值?
首先,聊聊什么是病案。 病案是在醫療過程以文字的方式再現患者在住院期間完整的病情變化以及所有的診療過程。因此,想要做病案質控,除了醫院的財務數據,需要把醫院幾乎所有的核心臨床數據都要接進來。 第二個基礎的概念是編碼員編碼。 編碼員這個工作很有意思,是目前少有的一項沒有任何電子化工具輔助的工作。 編碼員的標配就是三本厚厚的字典,外加一個保溫杯,每天坐在編碼科里編碼,工作方式也極為原始:閱讀病案、翻工具書、查詢編碼、驗證編碼,每份病案首頁都有少則幾個、多則幾十個的編碼需要確認,工作強度極大。 臨床技術是不斷發展的,所以編碼并不是一成不變,它會定期推陳出新,進行版本迭代。 目前,國際上的版本已經更新到了ICD11,編碼的總體數量和復雜度又大幅增加。
根據國家病歷質控中心的病案大數據來看,全國平均首頁數據的完整率為71.93%,費用信息是完整度最高的,接近90%;診療信息的完整度最差,不到60%。其中,低編的現象普遍存在,占總體錯誤的8成以上。 低編意味著什么?意味著臨床的成績被低估,醫院的收入受到損失。 高編發生的頻率比較低,但未來隨著DRG的正式落地會有一些變化。高編不代表醫院可以獲益,如果被醫保認定為騙保,不僅會遭受拒付,還會受到罰款。 因此,準確的編碼是醫院實現收益最大化的最好方式。 顧名思義,病案質控就是對診療過程進行醫學邏輯的梳理和驗證。想要深入的質控病案和編碼,往往需要工作人員有深厚的臨床經驗。 中國每年產生的病案數超過2億份,而病案質控的專業人員處于高度缺乏的狀態。約有4萬名的質控醫生和編碼員在醫院工作,但大部分未經過專業培訓,也不是持證上崗,同時不具有臨床經驗。 在歐美,平均1000張床的醫院對應的編碼統計人員是40位;而在中國全國范圍內,目前持證的質控員和編碼員總數量小于2000人,處于嚴重供需不匹配的狀態。 幸好,NLP技術的發展,可以為這個行業的困局提供一個新的解決方案。
左邊的案例中,患者的主要問題是動脈硬化并斑塊。從臨床角度來看,這個診斷名稱是沒有問題。 但是從ICD編碼以及DRG支付的角度看不夠具體,因為沒有說明具體的病變部位。不同部位的病變,診療過程及醫療資源消耗是不一樣的,必須要在編碼中明確表示出來,不然就會產生損失。 在病案的病程記錄部分,AI質控系統發現了一個關鍵信息——頸部血管彩超。 因此,系統推斷這是一個頸動脈的病變,對應的編碼應該是I70.806,系統會將這個缺陷提示給臨床醫生,由臨床醫生做最后的確認并更正。 可以看到,NLP技術可以通過理解并按內容模仿臨床專家的思維,來發掘病案的缺陷并反饋給醫生,進而構建一個高效的病案質量提升閉環。 我們來對比一下傳統的質控方式。 傳統方式只能實現抽查還有形式的質控——即有沒有漏填,完全無法滿足新形勢下醫保以及醫院管理的業務需求。 而AI質控不僅可以達到病案的全覆蓋、找出形式有沒有漏填,更可以找出深入的內涵錯誤,幫醫院找回病案上費用的損失。系統可以及時反饋結果,在患者出院前夕就及時發現問題、修改問題,而不是事后亡羊補牢。 我分享三個案例,幫助大家進一步理解。
病案首頁上的主要診斷選擇,對DRG的入組影響極大,入錯組一定會造成費用上的損失。 在病案里,主要診斷的選擇是化療,但是AI系統在病案數據里發現,患者在入院后進行了一個全喉的切除術,之后才進行化療。 按照主要診斷選擇的原則,應該選擇咽喉癌這個診斷,而不是化療?;熢贒RG支付里的權重和付費是極低的。所以,這是一個典型的低編,把一個3萬元難度的治療寫成了5000元,除了主要診斷,其它診斷的漏填、錯填也會影響入組和費用。
根據病案可以發現,患者是入院后進行的腦血管造影檢查,被診斷為腦動脈瘤急性伴動脈瘤破裂,從而引導蛛主網膜下腔出血。 所以,蛛網膜下腔出血并不是患者本次入院的主要就診原因,主診的選擇應該改為大腦動靜脈有畸形的破裂,對應的編碼是I60.8。 病案首頁中的很多錯誤,根本原因是臨床體系和支付體系間存在的差別。 從臨床的角度看,醫生選擇的主要診斷和編碼是沒有問題的,但是它不符合疾病分類學的要求。這就是一個典型的跨領域、跨學科的任務帶來的痛點。 想要解決這個問題,是讓醫生學習編碼,還是讓編碼員學習臨床?這兩條路都不容易走通,好的技術和好的產品的價值極大。 最后一個例子,手術和操作編碼的漏填。
這也是目前醫院損失的一大原因。 漏填出現的原因很多,因為臨床情況很復雜,比如患者在診療過程中曾經轉過科,后續的科室醫生往往不知道轉科前的治療過程,漏填手術直接會把這個病例從外科組變到內科組,付費差異也是極大。 我們可以看到,想要做首頁質控,對于病案內容的理解是前提,NLP技術是核心關鍵。業內有不少做首頁質控的企業和產品,但很可惜都沒有能力對接并分析完整的病案數據,無法進行病案和首頁的前后一致性核查。 這樣的產品會遺漏絕大部分的重要缺陷,只能找到一些基礎錯誤,無法滿足醫院的業務需求。
我們看看國外的案例。 DRG支付在歐美各國已經推廣多年,因而AI病案和編碼質控已經成為各級醫院的必備工具,最主要的價值是保障準確的保險支付,減少醫院損失。 AI病案質控在美國的興起可以追溯到2015年。當時,美國的編碼系統要從ICD-9升級到ICD-10,復雜度大大提升,傳統的人工質控方法無法維系,只能通過技術來解決問題。 截止到2019年,美國超過50%的醫療機構都配備了病案質控和編碼系統。醫院平均每年支付百萬美元級別的費用,可以帶來千萬美元級別的收益。 這個系統的ROI極高,在120的水平。也就是說,醫院一個月左右就可以回本。 M&Modal是美國病案質控領域的一家新興公司,2018年底被3M以10億美元的價格收購。該公司可以實現5%的CMI指數提升,意味著幫醫院增加了5%的總營收,以及找到漏填的并發癥、嚴重并發癥,降低了出院診斷不明確的病例。
目前,在美國病案質控系統最大的兩家供應商是3M和United Health旗下的Optimum,行業集中度很高,前兩名的產品占據了市場的絕大多數份額。 經常有朋友問,這個系統未來會不會成為HIS系統的一個子集?言外之意,廠商會不會很容易就做出來?在美國Epic和Cerner這么強大,也沒有進入這個賽道,其實背后有很多深層次的原因。 在德國也是“Code = Money”,在DRG推行后,類似的系統成為醫院的標配。
AI病案質控的技術特點和行業展望從投資人的角度來看,投資AI賽道有兩個核心的問題:技術壁壘如何判斷?如何甄別不同公司產品的成熟度?我認為,不同的應用場景對于系統性能的要求不同,系統性能要求越嚴苛的應用場景,技術門檻也最高。 很多行業都有質控系統,作為生產安全和產品質量保障的終極守門員,質控系統的可靠性要求往往極高。
對于病案質控系統,95%的準確率只是一個最基礎的要求。 舉一個例子,一家病床數2000張的三甲醫院,每天需要質控的運行中和終末病案數量大約也是2000份。假設每份病案平均只會出現一個質量缺陷,一天下來就會產生2000個缺陷;如果是5%的錯誤率,就意味著100份病案質控出錯。 因此,醫院病案質控系統是極其慎重的。系統的精準度是產品成功的關鍵,而保障一個系統精準度的就是底層的NLP引擎。 如果對醫學文本理解的顆粒度和準確度不高,那么無論如何打磨上層產品,都不可能實現性能的顯著提升。 病案質控的第一步就是理解病案的語言,NLP技術的三個重要環節:分詞命名、實體識別、語義關聯分析的提取。醫學語言的NLP有特殊的技術難點,需要通過構建專用的語料庫進行針對性的算法訓練。
第一步是分詞,從第一部分開始,醫學語言的特殊性就已經體現得淋漓盡致。
我們只看最后一句話,里面不包含任何一醫學的專業術語,我們感受一下:患者病來,患者神志清,精神可,睡眠可,二便無殊,體重無明顯變化。 如果直接把其他領域訓練出來的NLP算法,通過簡單的調參就用于醫療,結果的準確度可想而知。
第二部分,命名實體識別,因為醫學語言專業的屬性很強,存在大量的專業術語,性能可靠性要求又極高。 行業里有很多醫療NLP領域的先行者,最早的核心應用場景定位在科研。從技術的角度來看,先做科研是對的。因為技術難度相對較小。 科研的應用場景很好理解,就是從完整的病案中抽取一部分的信息來進行分析和整理??蒲袘貌⒉恍枰獙Σ“高M行100%的后結構化,只需從中挑選部分的信息。 因此,科研NLP的標簽類型在8-20類即可滿足要求,同時會有大量的文本不需要被識別。 但是醫療質控的應用需求又如何呢?
單單說現病史的質控,就需要把一個癥狀的描述拆分到非常之細的程度:嘔吐的性狀是不是噴射狀,以及內容物的差別,都會影響主診醫生對診斷大方向的判別,這些都需要被算法進行識別。 病案質控是尋找醫生在病案書寫中的缺陷,其前提就是,算法必須有能力對病人進行一個100%的后結構化。如果沒有完整理解全部的病案,又哪來的自信,拍著胸脯說醫生你寫錯了呢。 所以,質控NLP算法的分詞顆粒度和命名實體識別的標簽類別要遠遠超過科研NLP的要求。
第三部分,語義關聯分析提取。 一個真正智能的算法,必須能夠容忍真實病案中出現的各種各樣的問題:同義詞、錯別字、丟字造字、語法錯誤等等,不能遇到問題的時候就卡殼。算法需要和人一樣能夠識別、容忍還有理解。 作為投資人,我們經常聽到,某個醫療AI項目說自己的算法是最好、最精準的,因為用于訓練算法的數據都是用標準流程生產出來的。我并不是很認同這個觀點。 我認為,一個能廣泛應用于真實世界的產品,必須要通過技術來解決這些不完美。一個在真空環境中訓練出來的算法,不可能被臨床廣泛接受。
下面這個是關聯分析提取后的結果,找到標簽間的邏輯關系后結構化完成的。 AI病案質控是一個典型的AI產品,而不是一個信息化的產品,所有底層算法和產品架構不可能通過一、兩個醫院項目就能打磨完成。而要在產品研發的初期,根據應用場景的任務目標來打造專用的語料庫,進行算法的訓練和迭代。因此,研發周期會比較長。另外,投資人如何判斷某個項目的技術成熟度?我的經驗是從研發的流程入手,看團隊是否在用正確的方法研發、每一步研發要用的時間是否符合科學規律。 對于醫療產品來說,對于品質的追求永遠要優先于速度。用科學的方法正確的方法做事,是基礎中的基礎。如果方法錯了,基本上可以一票否決。對于已經上市的產品又如何判斷產品的成熟度呢?這就要找對驗證產品性能的金標準。醫療AI行業有個亂象,大家都喜歡玩概念,什么都打上AI的標簽。 60分的AI和95分的AI是一回事嗎?可能中間差了好幾個太平洋。但是驗證系統性能的基本標準又是什么呢?不同的產品可能不太一樣,需要NMPA證的產品還好,至少有一個底線就是拿證。 但是,今天分享的AI病案質控、CDSS這一類不需要拿證的產品,找到金標準就顯得特別重要。
對于病案質控,臨床采納率可以作為一個金標準,系統給醫生指出錯誤,醫生改就表示采納意見,沒改或者申訴就是不認可算法結果,這應該是一個終極檢驗的標準。 遠毅資本投資的國內首家專注于病案質控的企業——頤圣智能,公司的系統目前臨床應用得很好,已經達到了98%的臨床采納率,給這條賽道起了一個好頭,也給未來的進入者定了一個比較高的門檻。
根據市場測算,我們認為AI質控是一個典型的、被暫時低估的醫療AI賽道。在國外,這是一個60億美金規模的成熟市場。 隨著DRG支付的逐步推開,AI病案質控賽道即將進入一個發展的快速期。 AI病案質控的特點非常明確:第一,可以幫助醫院開源增收,醫院的付費意愿明確。隨著DRG試點支付的落地,我們對產品的議價空間十分樂觀。在美國病案基礎質量已經非常出色的情況下,類似的系統還可以找回5%的營收損失。在中國數據質量基礎更加薄弱的情況下,我們認為,這個數字會相當的驚人。第二,產品在臨床應用中可以持續得到醫生的反饋,幫助迭代算法。同時,由于不需要注冊,沒有NMPA的束縛,產品用的越多性能就會越好,形成強者恒強的網絡效應。 我們判斷,未來賽道的集中度會比較高,頭部企業具有極大的投資價值。
醫療數據的應用潛力和商業價值是巨大的,但底層的數據質量問題,就像一座大山阻擋了行業未來發展的道路。 DRG改革或許會給行業帶來一些變化,讓醫院有主動提升數據質量的意愿,而NLP技術又帶來了相當成熟的數據質量提升方案,在數據產生的過程中就保證了數據的質量。 AI病案質控將是未來醫療行業的重要基礎設施之一,可以幫助更多、更豐富的應用場景加速生根落地。
責任編輯:lq
-
醫療
+關注
關注
8文章
1906瀏覽量
59926 -
AI
+關注
關注
88文章
35138瀏覽量
279802 -
大數據
+關注
關注
64文章
8960瀏覽量
140210
原文標題:遠毅資本唐軼男:DRG支付推行后,AI病案質控將成為「黃金賽道」
文章出處:【微信號:IoT_talk,微信公眾號:醫健AI掘金志】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
評論