在中國(guó)受人工智能影響最大的醫(yī)療健康行業(yè)中,數(shù)據(jù)已成為“AI+醫(yī)療”落地的最大阻礙之一——數(shù)據(jù)復(fù)雜且質(zhì)量參差不齊。那么,基于人工智能、云計(jì)算和大數(shù)據(jù)三位一體的互聯(lián)互通,是否有望打破醫(yī)療數(shù)據(jù)孤島,助力應(yīng)用落地?
中國(guó)哪一行業(yè)受人工智能影響最大?答案是:醫(yī)療健康行業(yè),AI滲透率達(dá)22%。
這也致使智能醫(yī)療的戰(zhàn)場(chǎng)已經(jīng)涌入無數(shù)新老玩家,但比起數(shù)據(jù)標(biāo)準(zhǔn)化、信息化起步早的金融等行業(yè),醫(yī)療領(lǐng)域面臨更嚴(yán)重的數(shù)據(jù)孤島問題——數(shù)據(jù)零散且質(zhì)量參差不齊。
不少企業(yè)都因?yàn)榧夹g(shù)門檻高而選擇在“門外”張望,醫(yī)療健康行業(yè)到底需要怎樣的AI方案?
將數(shù)據(jù)作為突破口,或許是一劑良藥:
醫(yī)療數(shù)據(jù)復(fù)雜且分散,“對(duì)癥下藥”的前提是需要有效地建立起安全可信的多源數(shù)據(jù)協(xié)同方案;
基于云計(jì)算和大數(shù)據(jù)技術(shù)的互聯(lián)互通,AI、云、大數(shù)據(jù)的“組合拳”成為消除醫(yī)療數(shù)據(jù)孤島的利器;
智能醫(yī)療中最先落地的技術(shù)主要集中在計(jì)算機(jī)視覺領(lǐng)域,例如醫(yī)學(xué)影像、醫(yī)療圖像分割等,這些方面的數(shù)據(jù)量較大,而CPU憑借對(duì)大內(nèi)存的支持,在高速、大容量數(shù)據(jù)承載和讀寫能力上的優(yōu)勢(shì)就格外突顯,有望讓相關(guān)AI推理速度得到較大提升;
在為大半個(gè)智慧醫(yī)療圈的企業(yè)做“后盾”的過程中,從芯片航母轉(zhuǎn)型到數(shù)據(jù)中心的英特爾總結(jié)了一份《英特爾醫(yī)療健康行業(yè)AI實(shí)戰(zhàn)手冊(cè)》,用AI內(nèi)功助力AI+醫(yī)療落地。
醫(yī)療健康行業(yè)AI滲透率達(dá)22%,市場(chǎng)潛力巨大但數(shù)據(jù)“水深”
在中國(guó),醫(yī)療健康行業(yè)是被人工智能滲透最多的領(lǐng)域。
在中國(guó)各類垂直行業(yè)中,人工智能滲透較多領(lǐng)域的包括醫(yī)療健康、金融、商業(yè)、教育和安防等,其中醫(yī)療健康領(lǐng)域占比最大,達(dá)到22%。
相比安防、教育等行業(yè),AI出現(xiàn)在醫(yī)療領(lǐng)域起到的更多是輔助作用,并非要直接取代人類的工作。例如,在醫(yī)學(xué)影像中,AI技術(shù)作為一種工具,憑借在準(zhǔn)確度與工作可持續(xù)性方面的優(yōu)勢(shì),可以輔助醫(yī)生提升診斷效率,有利于醫(yī)生做出最終判斷。
然而相對(duì)于數(shù)據(jù)標(biāo)準(zhǔn)化、信息化起步早、機(jī)械化工作方式占比高的金融行業(yè),醫(yī)療健康業(yè)真正擁抱AI面對(duì)的限制更多,甚至目前還很難看到明確的未來。
數(shù)據(jù)就是一大難關(guān),無論是數(shù)量還是質(zhì)量。智慧醫(yī)療面臨著諸多挑戰(zhàn):
數(shù)據(jù)量。模型越復(fù)雜,參數(shù)越多,所需要的訓(xùn)練樣本量就越大。但是對(duì)許多復(fù)雜的臨床場(chǎng)景而言,所需要的大量可靠數(shù)據(jù)卻并不容易獲得;
數(shù)據(jù)質(zhì)量。一般而言,健康數(shù)據(jù)的組織化和標(biāo)準(zhǔn)化程度都不高,且數(shù)據(jù)分散、有噪聲。在條件不好的診所,還存在電子病歷信息缺失或有誤、多機(jī)構(gòu)間分散存儲(chǔ)等問題,同時(shí)接口數(shù)據(jù)可靠性也很差;
模型的可解釋性。深度學(xué)習(xí)模型是個(gè)黑盒子,對(duì)如何得出結(jié)論沒有明確的解釋,其決策模式的權(quán)威性也尚待驗(yàn)證;
模型的通用性。首先是模型偏差,比如采用白種人患者數(shù)據(jù)進(jìn)行訓(xùn)練的模型,可能在其他種族患者中效果不佳;還有就是模型互操作性差,也就是很難建立一個(gè)適用于兩種不同電子病歷系統(tǒng)中的深度學(xué)習(xí)模型;
已知前方“攔路虎”,亟需更對(duì)路的AI解決方案。
基于人工智能、云計(jì)算和大數(shù)據(jù)的互聯(lián)互通,打破數(shù)據(jù)孤島,建立醫(yī)療全連接
在AI三大支柱——算力、算法和數(shù)據(jù)中,數(shù)據(jù)更有望成為智慧醫(yī)療的突破口。
其中,醫(yī)學(xué)影像則被認(rèn)為是AI與醫(yī)療的融合中,最有可能率先實(shí)現(xiàn)商業(yè)化的領(lǐng)域。影像數(shù)據(jù)的標(biāo)準(zhǔn)性和大體量為AI在這一領(lǐng)域的應(yīng)用提供了最重要前提。
通過較為成熟的算法和大數(shù)據(jù)應(yīng)用,機(jī)器讀片可以做到較為“客觀、精準(zhǔn)、高效”,也給機(jī)器在醫(yī)學(xué)影像上與人工媲美,甚至代替人工增加了可能。
然而,過去很多醫(yī)療數(shù)據(jù)都是孤島式的,一個(gè)設(shè)備產(chǎn)生一個(gè)孤島式數(shù)據(jù),一家醫(yī)院產(chǎn)生一個(gè)孤島式數(shù)據(jù),當(dāng)把這些“孤島”全部連接在一起,才是真正的大數(shù)據(jù)。
而英特爾此前倡導(dǎo)要“深挖數(shù)據(jù)紅利,釋放數(shù)據(jù)價(jià)值”。同時(shí),人工智能、云、大數(shù)據(jù)技術(shù)結(jié)合也是必然趨勢(shì),可圍繞數(shù)據(jù)的每個(gè)環(huán)節(jié)創(chuàng)造價(jià)值。
如今在醫(yī)學(xué)影像分析中,“云技術(shù)+大數(shù)據(jù)+AI”這套組合拳正逐漸打破醫(yī)療數(shù)據(jù)的孤島:基于云計(jì)算和大數(shù)據(jù)技術(shù)的互聯(lián)互通,各醫(yī)療機(jī)構(gòu)之間可以建立無邊界醫(yī)療全連接。
將醫(yī)技設(shè)備鏈接和聚合起來的醫(yī)真云
例如,西安盈谷的解決方案就是,先通過醫(yī)真云的部置,利用物聯(lián)網(wǎng)技術(shù),將源自不同設(shè)備的海量醫(yī)學(xué)影像數(shù)據(jù)鏈接起來,再通過其醫(yī)學(xué)影像處理及分析云計(jì)算核心引擎iMAGES,來輸出強(qiáng)勁的影像大數(shù)據(jù)在線處理能力。最后,構(gòu)建 Cloud IDT 服務(wù),將AI技術(shù)引入到醫(yī)學(xué)影像處理和分析中。
在這一解決方案的過程中,盈谷在英特爾的支持下完成了 Cloud IDT 服務(wù)向英特爾架構(gòu)平臺(tái)的遷移,以及對(duì)于 Tensorflow等AI技術(shù)框架的部署和優(yōu)化。
AI與云技術(shù)的搭配實(shí)現(xiàn)了實(shí)現(xiàn)了人工智能輔助醫(yī)學(xué)診療的創(chuàng)新。例如,在篩查肺部疾病時(shí),在 Cloud IDT 服務(wù)的輔助下,低劑量 CT 肺小結(jié)節(jié)智能化輔助診斷定量的監(jiān)測(cè)敏感度(探測(cè)率)已達(dá)到 95%,篩查時(shí)間也由人工方式所需的10多分鐘縮短到6秒以內(nèi)。
CPU優(yōu)勢(shì)盡顯,深度學(xué)習(xí)技術(shù)加速圖像分割A(yù)I推理
事實(shí)上,入局AI+醫(yī)療,強(qiáng)大推理能力的尤為重要。
在AI推理市場(chǎng),英特爾至強(qiáng)處理器的普及率非常高,為80%-90%的AI推理助力。
而作為計(jì)算機(jī)視覺技術(shù)的重要分支,圖像分割已在醫(yī)學(xué)影像處理領(lǐng)域獲得廣泛應(yīng)用,例如腫瘤和其他病理位置定位、計(jì)算機(jī)輔助手術(shù)以及臨床輔助診斷等細(xì)分領(lǐng)域。
隨著計(jì)算機(jī)視覺技術(shù)飛速發(fā)展,與卷積神經(jīng)網(wǎng)絡(luò)(CNN)類似的模型,是目前基于AI的圖像分割技術(shù)中常見的網(wǎng)絡(luò)模型。這其中,全卷積網(wǎng)絡(luò)、U-net 和 V-net 是常見的幾種基于深度學(xué)習(xí)的圖像分割方法。
基于AI的圖像分割需要大規(guī)模推理,而AI應(yīng)用不能對(duì)臨床診療造成延遲,因此需要保持保證 AI 推理具備高吞吐、低延遲的特性,在這方面CPU優(yōu)勢(shì)明顯。
西門子醫(yī)療與英特爾一起合作,優(yōu)化了基于全新的第二代英特爾至強(qiáng)可擴(kuò)展處理器平臺(tái)構(gòu)建的心腔檢測(cè)和量化模型。
西門子醫(yī)療與英特爾一起構(gòu)建心臟 MRI 的 AI 分析能力
處理器內(nèi)置的英特爾深度學(xué)習(xí)加速技術(shù),具有全新的矢量神經(jīng)網(wǎng)絡(luò)指令(VNNI),能夠進(jìn)一步加速深度學(xué)習(xí)中的各種計(jì)算密集型操作,讓圖像分類、圖像分割、目標(biāo)檢測(cè)等 AI 應(yīng)用在該處理器平臺(tái)上的推理效率變得更高。
英特爾深度學(xué)習(xí)加速技術(shù)對(duì) INT8 良好的支持能力,使其可以將 FP32 訓(xùn)練模型轉(zhuǎn)化為 INT8,在保持準(zhǔn)確性的同時(shí)大幅提升推理速度。
硬件如同土地,那么軟件就像耕地的工具,選擇適合的軟件與硬件搭配,能實(shí)現(xiàn)事半功倍的效果。
圖像分割的深度學(xué)習(xí)模型也需要軟件進(jìn)行優(yōu)化。CT檢查是現(xiàn)代醫(yī)療最常用的檢查手段之一。以往通常依賴人類醫(yī)生進(jìn)行人工看片,通用電氣醫(yī)療集團(tuán)(GE醫(yī)療)正利用深度學(xué)習(xí)的方法,使 CT 切片圖像能更便捷地進(jìn)行分類和標(biāo)記。
英特爾DLDT是 OpenVINOTM 工具套件中,專門用于深度學(xué)習(xí)模型的推理加速部件。可以對(duì)多種主流深度學(xué)習(xí)開源框架訓(xùn)練好的模型進(jìn)行轉(zhuǎn)換和優(yōu)化,生成獨(dú)立于深度學(xué)習(xí)框架的 bin 文件和 xml 文件。
利用英特爾DLDT 對(duì)模型進(jìn)行轉(zhuǎn)換和優(yōu)化后,可將優(yōu)化后的模型導(dǎo)入GE 醫(yī)療CT 邊 緣 AI 增強(qiáng)應(yīng)用中,該應(yīng)用在硬件基礎(chǔ)上構(gòu)建了基于邊緣的強(qiáng)大推理引擎。
多核心帶來了推理性能的穩(wěn)步擴(kuò)展
GE 醫(yī)療希望在對(duì)模型實(shí)施優(yōu)化后,能夠在使用小于 4 個(gè)處理器核心的情況下,使推理引擎每秒可處理的圖像數(shù)量達(dá)到 100 張。優(yōu)化后的測(cè)試結(jié)果為:在使用了英特爾至強(qiáng)處理器上的4個(gè)核心時(shí),優(yōu)化后的模型每秒可處理的圖像數(shù)量,提升到了596張,近6倍于上述的期望值。
AI介入藥物研發(fā)進(jìn)程,圖像分析模型訓(xùn)練時(shí)間從11小時(shí)降至31分鐘
醫(yī)療健康行業(yè)不僅限于臨床醫(yī)學(xué),還包含藥物研發(fā)與制造等細(xì)分領(lǐng)域。
AI技術(shù)如今也被運(yùn)用于藥物研發(fā)進(jìn)程,基于細(xì)胞圖像的高內(nèi)涵篩選(HCS)是目前在該領(lǐng)域常用的自動(dòng)化分析方法之一,也是AI技術(shù)在藥物發(fā)現(xiàn)早期環(huán)節(jié)的重要應(yīng)用。
利用深度學(xué)習(xí)方法、從數(shù)據(jù)中“自動(dòng)”學(xué)習(xí),并區(qū)分一種治療與另一種治療的相關(guān)圖像特征,但細(xì)胞顯微鏡圖像巨大的信息量使這一方法仍需耗費(fèi)大量時(shí)間——其圖像分析模型的訓(xùn)練時(shí)間約為 11 小時(shí)。
如今,英特爾和諾華的生物學(xué)家、數(shù)據(jù)科學(xué)家們通過基于優(yōu)化的英特爾至強(qiáng)可擴(kuò)展處理器平臺(tái)上部署的 M-CNN 網(wǎng)絡(luò),來加快 HCS 分析,實(shí)現(xiàn)更佳的訓(xùn)練和推理效果。
諾華優(yōu)化后方案的訓(xùn)練效果
優(yōu)化方案部署了8 個(gè)基于英特爾至強(qiáng)可擴(kuò)展處理器的節(jié)點(diǎn),使用 Broad Bioimage Benchmark Collection* 021 (BBBC-021) dataset29 數(shù)據(jù)集,圖像總量為 1 萬張,尺寸為1024*1280*3。在超過20 次的訓(xùn)練后,如圖上圖所示,訓(xùn)練時(shí)間總長(zhǎng)約為31分鐘,準(zhǔn)確率超過 99%。
在這一過程中,CPU在大內(nèi)存方面的優(yōu)勢(shì)就格外突顯。它在某些需要較大容量?jī)?nèi)存的(數(shù)十GB乃至上百GB)場(chǎng)合時(shí)要優(yōu)于其他平臺(tái)的表現(xiàn)。
事實(shí)上,醫(yī)療行業(yè)內(nèi),盡管數(shù)據(jù)質(zhì)量參差不齊,但常常要處理大量需要大內(nèi)存支持的影像數(shù)據(jù),除了3D數(shù)據(jù)外,還有附帶時(shí)序的核磁共振4D數(shù)據(jù),它們更加依賴大容量?jī)?nèi)存。
用特定硬件“圈地”畫邊界,增強(qiáng)數(shù)據(jù)安全防護(hù)
盡管前景并非百分百明朗,但很多傳統(tǒng)醫(yī)療機(jī)構(gòu)還是一頭扎進(jìn)了AI戰(zhàn)場(chǎng)。
人們對(duì)健康的追求是不會(huì)停止的,AI+醫(yī)療這一領(lǐng)域也更貼近人們對(duì)未來科技世界的美好期待——AI的出現(xiàn)對(duì)智能化醫(yī)療體系的構(gòu)建起到了關(guān)鍵作用。
就數(shù)據(jù)方面,AI+醫(yī)療依然存在不少隱患,這需要政策與技術(shù)的雙重努力。
2017年7月8日,國(guó)務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,提出要發(fā)展智能醫(yī)療,推廣應(yīng)用人工智能治療的新模式新手段,建立快速精準(zhǔn)的智能醫(yī)療體系。
政策的支持促使人工智能在醫(yī)療領(lǐng)域的應(yīng)用更上一層樓。然而,醫(yī)療行業(yè)大數(shù)據(jù)集中化確實(shí)是一大重要趨勢(shì),但在數(shù)據(jù)安全和主權(quán)問題尚未沒解決前,不同醫(yī)療和健康機(jī)構(gòu)的數(shù)據(jù)很難實(shí)現(xiàn)真正意義上的共享,或者共同的發(fā)掘和利用,這就要求技術(shù)方面要建立起真正實(shí)用且安全可信的多源數(shù)據(jù)協(xié)同方案。
在這方面,英特爾就憑借過“硬”技術(shù),為平安科技聯(lián)邦學(xué)習(xí)技術(shù)團(tuán)隊(duì)聚合多源數(shù)據(jù)實(shí)施 AI 模型訓(xùn)練的過程保駕護(hù)航。
英特爾SGX 技術(shù)以可信“飛地”來增強(qiáng)數(shù)據(jù)安全防護(hù)
英特爾SGX 技術(shù)可通過在特定硬件(例如內(nèi)存)中構(gòu)造出一個(gè)可信的“飛地”(Enclave),使數(shù)據(jù)和應(yīng)用程序的安全邊界僅限于“飛地”本身以及處理器,同時(shí)其運(yùn)行過程也不依賴于其他軟硬件設(shè)備。
這意味著數(shù)據(jù)的安全保護(hù)是獨(dú)立于軟件操作系統(tǒng)或硬件配置之外,即使硬件驅(qū)動(dòng)程序、虛擬機(jī)乃至操作系統(tǒng)均受到攻擊和破壞,也能更有效地防止數(shù)據(jù)泄露。
而多源數(shù)據(jù),顧名思義,數(shù)據(jù)來源多樣,來自不同機(jī)構(gòu)。英特爾SGX 技術(shù)能解決另一痛點(diǎn)問題就是跨醫(yī)療機(jī)構(gòu)、跨公司企業(yè)之間的數(shù)據(jù)利用問題——既可以推動(dòng)跨不同機(jī)構(gòu)的數(shù)據(jù)利用,又可以保障其安全。
中國(guó)醫(yī)療市場(chǎng)潛力巨大,AI+醫(yī)療仍處于起步階段,英特爾在這方面的經(jīng)驗(yàn)將為傳統(tǒng)醫(yī)療企業(yè)轉(zhuǎn)型提供高價(jià)值的借鑒作用。
在人工智能賦能各個(gè)領(lǐng)域中,落地已經(jīng)成為繞不開的話題,所有AI都應(yīng)該最終能做到解決實(shí)際問題,實(shí)現(xiàn)真正的落地。簡(jiǎn)化流程、對(duì)癥下藥,正是英特爾在中國(guó)醫(yī)療健康行業(yè)的AI實(shí)戰(zhàn)經(jīng)驗(yàn)。
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7250瀏覽量
91501 -
醫(yī)療
+關(guān)注
關(guān)注
8文章
1890瀏覽量
59745 -
人工智能
+關(guān)注
關(guān)注
1805文章
48893瀏覽量
247805
發(fā)布評(píng)論請(qǐng)先 登錄
MBox20網(wǎng)關(guān)開啟工廠互聯(lián)互通與數(shù)據(jù)上云新時(shí)代
RFID技術(shù)三位一體開啟智能資產(chǎn)管理新時(shí)代

人工智能、云計(jì)算、區(qū)塊鏈三者區(qū)別對(duì)比
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值
電視機(jī)頂盒互聯(lián)互通的能力
ADS1284數(shù)據(jù)采集時(shí),只要24位數(shù)據(jù),是取高三位還是低三位?
德晟達(dá)推出高性能醫(yī)療專用AI一體機(jī)
嵌入式和人工智能究竟是什么關(guān)系?
存算一體化與邊緣計(jì)算:重新定義智能計(jì)算的未來

評(píng)論