經(jīng)美國食品藥品監(jiān)督管理局(FDA)批準(zhǔn)后,第一批可穿戴式數(shù)字健康監(jiān)測(cè)儀目前剛剛上市,并集成在諸如智能手表之類的消費(fèi)產(chǎn)品中。醫(yī)學(xué)傳感器技術(shù)的不斷快速發(fā)展,使得小巧、經(jīng)濟(jì)且精度越來越高的生理傳感器被應(yīng)用在現(xiàn)有的可穿戴設(shè)備中。
前沿的機(jī)器學(xué)習(xí)和人工智能算法正是這種轉(zhuǎn)變的驅(qū)動(dòng)力之一,它們能夠從海量數(shù)據(jù)中提取和解讀有價(jià)值的信息。這些數(shù)據(jù)往往包含噪聲和不太完美的信號(hào)(比如智能手表上的心電圖數(shù)據(jù)),并被各種偽信號(hào)所破壞,傳統(tǒng)算法常常是基于規(guī)則和確切性的,因此難以妥善處理這類數(shù)據(jù)。
直到最近,解開這些傳感器發(fā)出的生理信號(hào)中的秘密,并做出足夠準(zhǔn)確的決策,從而被申報(bào)監(jiān)管機(jī)構(gòu)接受仍然非常困難,有時(shí)甚至是不可能的。而機(jī)器學(xué)習(xí)和人工智能算法的進(jìn)步,正使得工程師和科學(xué)家能夠克服許多這樣的挑戰(zhàn)。
通過這篇文章,讓我們一同來仔細(xì)看看生理信號(hào)處理算法的總體架構(gòu),理解背后的運(yùn)算過程,并將其轉(zhuǎn)化為經(jīng)過數(shù)十年研究建立起來的現(xiàn)實(shí)中的工程技術(shù)。
機(jī)器學(xué)習(xí)算法的開發(fā)主要包括兩個(gè)步驟(圖 1)。
第一步是特征工程,從相應(yīng)的數(shù)據(jù)集中提取特定數(shù)值/數(shù)學(xué)特征。
第二步,將提取的特征輸入一個(gè)廣為人知的統(tǒng)計(jì)分類或回歸算法,如支持向量機(jī)或適當(dāng)設(shè)定后的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)(訓(xùn)練好的模型可用于對(duì)新的數(shù)據(jù)集進(jìn)行預(yù)測(cè))。利用一個(gè)合理標(biāo)記過的數(shù)據(jù)集對(duì)該模型進(jìn)行迭代訓(xùn)練,在達(dá)到令人滿意的準(zhǔn)確度后,就可以在生產(chǎn)環(huán)境中作為預(yù)測(cè)引擎在新數(shù)據(jù)集上使用。
圖 1. 典型的機(jī)器學(xué)習(xí)工作流程包括訓(xùn)練和測(cè)試階段。
那么,對(duì)于心電信號(hào)的分類問題,這個(gè)工作流程是如何實(shí)現(xiàn)的呢?
在本案例中,我們采用了 2017 年的 PhysioNet Challenge dataset,其中使用了真實(shí)的單導(dǎo)聯(lián)心電圖數(shù)據(jù)。目標(biāo)是將病人的心電信號(hào)分為四類:正常、房顫、其他心律和雜音過多。
在 MATLAB 中處理這個(gè)問題的整個(gè)流程和各個(gè)步驟如圖 2 所示。
圖 2. MATLAB用于開發(fā)心電信號(hào)分類的機(jī)器學(xué)習(xí)算法的工作流程。
預(yù)處理和特征工程
特征工程可能是開發(fā)一套魯棒的機(jī)器學(xué)習(xí)算法中最難的部分。這類問題不能簡單地視為“數(shù)據(jù)科學(xué)”問題,因?yàn)樵谔骄拷鉀Q方法時(shí),掌握生物醫(yī)學(xué)工程領(lǐng)域的專業(yè)知識(shí),了解不同類型的生理信號(hào)和數(shù)據(jù)非常重要。
MATLAB 等工具為領(lǐng)域?qū)<姨峁┝藬?shù)據(jù)分析和高級(jí)機(jī)器學(xué)習(xí)功能,使他們能夠更容易地將“數(shù)據(jù)科學(xué)”功能(如高級(jí)機(jī)器學(xué)習(xí)功能)應(yīng)用于他們正在解決的問題,從而專注于特征工程。在本例中,我們使用先進(jìn)的小波技術(shù)對(duì)信號(hào)進(jìn)行處理,以去除數(shù)據(jù)集中的噪聲和漸變趨勢(shì),如呼吸偽影,并從信號(hào)中提取各種需要關(guān)注的特征。
開發(fā)分類模型
統(tǒng)計(jì)和機(jī)器學(xué)習(xí)工具箱中的分類學(xué)習(xí)應(yīng)用程序,對(duì)于對(duì)機(jī)器學(xué)習(xí)不太熟悉的工程師和科學(xué)家來說,是一個(gè)特別有效的切入點(diǎn)。
一旦從信號(hào)中提取到足夠多實(shí)用的相關(guān)特征,我們就能使用這個(gè)應(yīng)用程序來快速探究各種分類器及其性能,從而縮小模型選擇范圍,用于進(jìn)一步優(yōu)化。這些分類器包括決策樹、隨機(jī)森林、支持向量機(jī)和 K 近鄰(KNN)。您能夠嘗試并選擇出能夠?yàn)樘卣骷峁┳罴逊诸愋阅艿牟呗裕ㄍǔJ褂没煜仃嚮?AUC 等指標(biāo)進(jìn)行評(píng)估)。在示例中,我們只采用這種方法就快速實(shí)現(xiàn)了所有類別約 80% 的總體準(zhǔn)確率(本次比賽的獲獎(jiǎng)項(xiàng)目得分大約為 83%)。注意,我們沒有在特征工程或分類器調(diào)試上花費(fèi)太多時(shí)間,因?yàn)橹攸c(diǎn)是驗(yàn)證方法。
通常,花時(shí)間進(jìn)行特征工程和分類器調(diào)試,可以顯著提高分類準(zhǔn)確度。深度學(xué)習(xí)等更先進(jìn)的技術(shù)也可以應(yīng)用于此類問題,其中,特征工程、特征提取和分類步驟會(huì)被整合到單一訓(xùn)練步驟中,然而與傳統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)相比,這種方法通常需要大很多的訓(xùn)練數(shù)據(jù)集,以達(dá)到期望的效果。
挑戰(zhàn)、法規(guī)和對(duì)未來的承諾
雖然許多常見的可穿戴設(shè)備還不能完全取代 FDA 批準(zhǔn)并經(jīng)醫(yī)學(xué)驗(yàn)證的對(duì)應(yīng)設(shè)備,但所有的技術(shù)和消費(fèi)趨勢(shì)都明確地指向這個(gè)方向。FDA 已經(jīng)開始在多方面積極發(fā)揮作用,例如簡化法規(guī),通過諸如“數(shù)字健康軟件預(yù)認(rèn)證計(jì)劃”這樣的舉措,鼓勵(lì)管理科學(xué)的發(fā)展,和設(shè)備開發(fā)的建模仿真等。
人們希望,將從日常可穿戴設(shè)備中收集到的人體生理信號(hào)轉(zhuǎn)換為一種新型數(shù)字生物標(biāo)記,以全面反映我們的健康狀況。如今,這一愿景比以往任何時(shí)候都更加真實(shí),這在很大程度上要?dú)w功于信號(hào)處理、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法的進(jìn)步。MATLAB 等工具所支持的工作流程,使醫(yī)療設(shè)備領(lǐng)域的專家,在即使不成為數(shù)據(jù)科學(xué)家的情況下,也能夠采取并利用機(jī)器學(xué)習(xí)等數(shù)據(jù)科學(xué)技術(shù)。
-
人工智能
+關(guān)注
關(guān)注
1804文章
48773瀏覽量
246807 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8493瀏覽量
134155 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1470瀏覽量
34823
發(fā)布評(píng)論請(qǐng)先 登錄
人工智能和機(jī)器學(xué)習(xí)以及Edge AI的概念與應(yīng)用

【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值
嵌入式和人工智能究竟是什么關(guān)系?
魯棒性在機(jī)器學(xué)習(xí)中的重要性
具身智能與機(jī)器學(xué)習(xí)的關(guān)系
人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

評(píng)論