隨著人工智能技術(shù)與產(chǎn)業(yè)不斷融合,人工智能技術(shù)助力傳統(tǒng)產(chǎn)業(yè)實(shí)現(xiàn)新的發(fā)展和升級(jí),助力工業(yè)經(jīng)濟(jì)向數(shù)字經(jīng)濟(jì)快速轉(zhuǎn)型。目前,人工智能技術(shù)在醫(yī)療、金融、交通、零售、工業(yè)制造、教育、安防等領(lǐng)域均產(chǎn)生良好的發(fā)展前景。
雖然人工智能技術(shù)的行業(yè)應(yīng)用越來越廣泛,仿佛真的站在風(fēng)口準(zhǔn)備擁抱下一場革命,但正如專家們所言,對于人工智能的發(fā)展,應(yīng)該保持謹(jǐn)慎的樂觀態(tài)度。眾所周知,沃森是當(dāng)下諸多人工智能技術(shù)和應(yīng)用的典型代表,其重點(diǎn)領(lǐng)域是醫(yī)療(主攻癌癥的預(yù)測與治療)。然而,在經(jīng)歷了六年時(shí)間、耗資數(shù)十億美元之后,Watson的診斷結(jié)果卻令人沮喪。人工智能系統(tǒng)需要基于數(shù)據(jù)調(diào)整參數(shù),以達(dá)到最佳擬合效果,由于數(shù)據(jù)的復(fù)雜性和相對不可用性,人工智能的效用往往存在不確定性。
同樣對IBM沃森而言,當(dāng)Watson獲得足夠多的“條理清楚”的數(shù)據(jù)時(shí),能通過不斷學(xué)習(xí)給出可能有用的答案。但在實(shí)際操作中,一方面Watson使用的訓(xùn)練數(shù)據(jù)并不豐富,例如,訓(xùn)練肺癌治療方案的數(shù)據(jù)僅有635例,其它疾病更是少得可憐。另一方面,由于患者就醫(yī)記錄沒有全部聯(lián)網(wǎng),醫(yī)生經(jīng)驗(yàn)錄入成為沃森分析最核心的來源,這意味著當(dāng)它掃描大量文件時(shí),必然要識(shí)別復(fù)雜的信息并從中抽取關(guān)鍵內(nèi)容。例如,患者的病歷可能包含醫(yī)生的大量注釋,這些注釋又是由簡寫和短語構(gòu)成的,機(jī)器想完全理解它們并非易事。總結(jié)IBM沃森失敗的原因,其算法算力毋庸置疑,而在數(shù)據(jù)處理上,除了收集的樣本數(shù)據(jù)量不足,最大的問題便是在數(shù)據(jù)質(zhì)量不高,幾十萬份病例下來,能夠用的可能才幾萬份病例。這一切導(dǎo)致了沃森不能提供足夠的敏感性、特異性和精準(zhǔn)性,而這都是臨床決策所必需的。
當(dāng)前人工智能還面臨諸多挑戰(zhàn),例如數(shù)據(jù)孤島問題、隱私保護(hù)問題、安全問題等瓶頸。一項(xiàng)2018年的研究顯示,人工智能的采納率急劇增加,從2017年的38%增至2018年的61%,醫(yī)療保健業(yè)、制造業(yè)和金融服務(wù)業(yè)等各個(gè)行業(yè)都是如此。但根據(jù)國際數(shù)據(jù)公司(IDC)發(fā)布的一份報(bào)告指出,評(píng)估了4個(gè)行業(yè)(包括醫(yī)療健康行業(yè))的“數(shù)據(jù)質(zhì)量”,范圍為1(嚴(yán)重)到5(優(yōu)化)。IDC將醫(yī)療健康行業(yè)的數(shù)據(jù)質(zhì)量評(píng)為2.4。報(bào)告顯示,60%的醫(yī)療行業(yè)受訪者缺乏數(shù)據(jù)處理能力。
構(gòu)建高質(zhì)量數(shù)據(jù)集,推動(dòng)人工智能快速發(fā)展
當(dāng)前,不管是人工智能技術(shù)的研發(fā)以及應(yīng)用領(lǐng)域的發(fā)展,“數(shù)據(jù)”都是一個(gè)不可或缺、位于重中之重的因素。機(jī)器學(xué)習(xí)等AI技術(shù)的基礎(chǔ)是應(yīng)用軟件分析系統(tǒng)對數(shù)據(jù)集進(jìn)行分析、挖掘。而數(shù)據(jù)集的大小至關(guān)重要,因?yàn)闄C(jī)器學(xué)習(xí)需要特定、大量的數(shù)據(jù)。只有數(shù)據(jù)上傳足夠高效,才能夠在相關(guān)工作中體現(xiàn)出及時(shí),而準(zhǔn)確的數(shù)據(jù)是人工智能技術(shù)研發(fā)、訓(xùn)練的關(guān)鍵,以及其能夠在生活中起到多大作用的一個(gè)考量因素。乍一看,醫(yī)療健康行業(yè)應(yīng)該具有優(yōu)勢:該行業(yè)擁有大量數(shù)據(jù)。到2025年,醫(yī)療健康領(lǐng)域的數(shù)據(jù)數(shù)量將超過金融、媒體和制造業(yè)等領(lǐng)域,其年復(fù)合增長率達(dá)到36%。這在很大程度上是由于醫(yī)療健康領(lǐng)域新興技術(shù)的不斷涌現(xiàn),例如醫(yī)學(xué)成像、康復(fù)機(jī)器人以及不斷成熟的大數(shù)據(jù)分析工具。但不幸的是,數(shù)量只是數(shù)據(jù)的一個(gè)方面:質(zhì)量是另一個(gè)關(guān)鍵。醫(yī)療領(lǐng)域的數(shù)據(jù)往往數(shù)量足夠,但質(zhì)量堪憂。
GetApp的一項(xiàng)研究表示,他們調(diào)查了五個(gè)行業(yè)(包括醫(yī)療健康行業(yè))的近500名小企業(yè)領(lǐng)導(dǎo)者,當(dāng)詢問受訪者數(shù)據(jù)分析過程的哪個(gè)方面讓他們感到信心最低時(shí),25%的醫(yī)療行業(yè)受訪者表示,他們對收集“相關(guān)數(shù)據(jù)”——可以提供決策的高質(zhì)量數(shù)據(jù)的能力最不自信,在所有五個(gè)領(lǐng)域(包括醫(yī)療行業(yè))數(shù)據(jù)質(zhì)量是他們關(guān)注的主要問題。加拿大的一家保險(xiǎn)公司想要根據(jù)保險(xiǎn)公司的工作地點(diǎn)來衡量保險(xiǎn)公司的風(fēng)險(xiǎn)時(shí),其分析產(chǎn)生了垃圾結(jié)果,究其原因,是在對距離數(shù)據(jù)的標(biāo)注時(shí),分別以英里和公里為標(biāo)記,使其結(jié)果出現(xiàn)了偏差。而在Dun&Bradstreet的一項(xiàng)調(diào)查中,很多組織表示,缺乏正確的數(shù)據(jù)是進(jìn)一步實(shí)施人工智能的最大障礙之一。
大數(shù)據(jù)是人工智能技術(shù)研發(fā)、訓(xùn)練的關(guān)鍵,是人工智能長期發(fā)展的重要保障。只有當(dāng)人工智能系統(tǒng)能夠獲取更為準(zhǔn)確、及時(shí)、一致的高質(zhì)量數(shù)據(jù),才能提供更有效、有用、精準(zhǔn)性高的智能化服務(wù)。根據(jù)埃森哲在2018年4月的一份調(diào)研發(fā)現(xiàn),中國制造企業(yè)在運(yùn)用人工智能技術(shù)時(shí)面臨一系列挑戰(zhàn)。其中,52%的受訪中國企業(yè)將數(shù)據(jù)質(zhì)量列為突出挑戰(zhàn),數(shù)據(jù)安全與網(wǎng)絡(luò)安全緊隨其后(47%)。在2017年4月的一次研討會(huì)上,圍繞人工智能話題,某業(yè)界專家提出:“高質(zhì)量的數(shù)據(jù)是人工智能的前提和基礎(chǔ)”。當(dāng)前,不管是人工智能技術(shù)的研發(fā),還是人工智能應(yīng)用領(lǐng)域的發(fā)展,“數(shù)據(jù)質(zhì)量”都是一個(gè)不可或缺、位于重中之重的要素。
用戶隱私安全問題成制約人工智能發(fā)展因素
大數(shù)據(jù),被視為人工智能發(fā)展的基石。在過去很多年里,人們并沒有意識(shí)到大數(shù)據(jù)使用中的隱私風(fēng)險(xiǎn),企業(yè)對用戶數(shù)據(jù)的收集使用達(dá)到了無節(jié)制的程度,結(jié)果是“數(shù)據(jù)丑聞”在近兩年集中爆發(fā)。比如今年剛被曝光的IBM,為了進(jìn)行人臉識(shí)別訓(xùn)練,未經(jīng)當(dāng)事人許可,便從網(wǎng)絡(luò)圖庫上獲得了近100萬張照片。亞馬遜的智能音箱Alex,也屢次因隱私問題引發(fā)美國用戶的質(zhì)疑。雖然企業(yè)總會(huì)辯稱匿名化處理后的數(shù)據(jù)無法對應(yīng)到具體的用戶,人們還是無法完全放下?lián)鷳n。根據(jù)加州大學(xué)伯克利分校的一項(xiàng)新研究顯示,人工智能的進(jìn)步為人們健康數(shù)據(jù)的隱私性帶來了新威脅。業(yè)內(nèi)一項(xiàng)人工智能相關(guān)調(diào)查報(bào)告也顯示,8成受訪者擔(dān)心人工智能會(huì)威脅自己的隱私,3成受訪者已經(jīng)感受到了人工智能給自己工作帶來的威脅。
作為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,人工智能正在深刻影響社會(huì)生活、改變發(fā)展格局。同時(shí),人工智能如同一把“雙刃劍”,如果應(yīng)用不當(dāng),就可能帶來隱私泄露的倫理風(fēng)險(xiǎn)。如何在人工智能應(yīng)用中兼顧隱私保護(hù),確保安全、可靠、可控,是一項(xiàng)亟須關(guān)注的倫理課題。
2019年9月5日,由北京大學(xué)、國家電網(wǎng)全球能源互聯(lián)網(wǎng)研究院與華矩科技三家產(chǎn)學(xué)研代表聯(lián)合發(fā)起的第三屆大數(shù)據(jù)數(shù)據(jù)質(zhì)量管理國際峰會(huì)將在北京舉辦,峰會(huì)以“數(shù)以質(zhì)造質(zhì)造未來”為主題展開深入探討與交流,薈萃技術(shù)發(fā)展與產(chǎn)業(yè)升級(jí),匯聚國內(nèi)外數(shù)據(jù)質(zhì)量學(xué)術(shù)大拿、技術(shù)大拿、行業(yè)應(yīng)用及技術(shù)創(chuàng)新者,不僅從更新更全的角度剖析數(shù)據(jù)質(zhì)量的前沿發(fā)展,而且更貼合各行業(yè)各領(lǐng)域深度的業(yè)務(wù)場景,提供全新的視角與思考。
針對人工智能領(lǐng)域,DQMIS2019特設(shè)數(shù)據(jù)質(zhì)量與人工智能的結(jié)合主題板塊,深度挖掘機(jī)器視覺、智能機(jī)器人、大數(shù)據(jù)與數(shù)據(jù)服務(wù)、AI+產(chǎn)業(yè)等前沿技術(shù)話題,邀請了國內(nèi)外技術(shù)大咖及行業(yè)領(lǐng)袖現(xiàn)身說法,分享人工智能發(fā)展過程的數(shù)據(jù)質(zhì)量難點(diǎn)與實(shí)踐,給人工智能應(yīng)用與發(fā)展帶來更多啟發(fā)與探討。
-
醫(yī)療
+關(guān)注
關(guān)注
8文章
1891瀏覽量
59746 -
人工智能
+關(guān)注
關(guān)注
1805文章
48898瀏覽量
247870 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1223瀏覽量
25355
發(fā)布評(píng)論請先 登錄
東風(fēng)汽車積極推動(dòng)汽車產(chǎn)業(yè)高質(zhì)量發(fā)展
淺析:數(shù)字經(jīng)濟(jì)時(shí)代,高質(zhì)量數(shù)據(jù)集對AI產(chǎn)業(yè)帶來哪些新的變化
標(biāo)貝科技“4D-BEV上億點(diǎn)云標(biāo)注系統(tǒng)”入選國家數(shù)據(jù)局首批數(shù)據(jù)標(biāo)注優(yōu)秀案例

東風(fēng)科技攜手合作伙伴推動(dòng)汽車產(chǎn)業(yè)高質(zhì)量發(fā)展
喜報(bào)丨阿丘科技榮登蘇州市人工智能大模型與高質(zhì)量數(shù)據(jù)集雙項(xiàng)榜單

廣汽集團(tuán)召開高質(zhì)量發(fā)展大會(huì)
標(biāo)貝科技:AI基礎(chǔ)數(shù)據(jù)服務(wù),人工智能行業(yè)發(fā)展的底層支撐

嵌入式和人工智能究竟是什么關(guān)系?
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感
AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得
risc-v在人工智能圖像處理應(yīng)用前景分析
鯤云科技AI視頻分析解決方案入選人工智能典型應(yīng)用示范案例

商湯科技加入中國移動(dòng)人工智能大模型評(píng)測聯(lián)盟
科技創(chuàng)新!國產(chǎn)自主三坐標(biāo)測量機(jī)推動(dòng)產(chǎn)業(yè)高質(zhì)量發(fā)展

評(píng)論