大數據出現的時間只有十幾年,被人們廣泛接受并應用只有幾年的時間,但就是這短短幾年的時間,大數據呈現出爆炸式增長的態勢。在各個領域,大數據的身影幾乎無處不在。今天我們通過一些大數據典型的應用場景分析,一起來看看大數據到底能做些什么,我們學大數據究竟有什么用,應該關注大數據的哪些方面。
大數據在醫療健康領域的應用
健康醫療領域是最近幾年獲得最多創業者和投資人青睞的大數據領域。為什么這么說呢?首先,醫療健康領域會產生大量的數據;其次,醫療健康領域有一個萬億級的市場規模;最關鍵的是,醫療健康領域里很多工作依賴人的經驗,而這正是機器學習的強項。醫學影像智能識別
圖像識別是機器學習獲得的重大突破之一,使用大量的圖片數據進行深度機器學習訓練,機器可以識別出特定的圖像元素,比如貓或者人臉,當然也可以識別出病理特征。
比如X光片里的異常病灶位置,是可以通過機器學習智能識別出來的。甚至可以說醫學影像智能識別在某些方面已經比一般醫生擁有更高的讀圖和識別能力,但是鑒于醫療的嚴肅性,現在還很少有臨床方面的實踐。
雖然在臨床實踐方面應用有限,但是醫療影像AI還是在一些領域取得一定的進展。醫學影像智能識別,一方面可以幫助醫生進行輔助診療,另一方面對于皮膚病等有外部表現的病癥,病人可以自己拍照然后使用AI智能識別做一個初步診斷。
病歷大數據智能診療
病歷,特別是專家寫的病歷,本身就是一筆巨大的知識財富,利用大數據技術將這些知識進行處理、分析、統計、挖掘,可以構成一個病歷知識庫,可以分享給更多人,即構成一個智能輔助診療系統。下面這張圖是我曾經參與設計過的一個醫療輔助診療系統的架構。
針對同類疾病和其他上下文信息(化驗結果、病史、年齡性別、病人回訪信息等)可以挖掘出針對同樣的疾病情況,哪種治療手段可以用更低的治療成本、更少的病人痛苦,獲得更好的治療效果。從上面的架構圖你能看到,將這些病歷知識和循證醫學知識、科研文獻知識、用藥知識共同構成一個輔助診療知識庫,通過知識匹配搜索引擎可以對外提供服務?;颊呋蛘哚t生錄入病史、檢查結果等信息,系統匹配初步診斷結果,搜索診療計劃,產生多個輔助診療建議,供患者和醫生進行參考。
大數據在教育領域的應用
教育倡導“因人施教”,但是在傳統教育過程中要做到因人施教,需要老師本身能力很強才能把握好。但是大數據在線教育利用大數據技術進行分析統計,完全可以做到根據學生能力和學習節奏,及時調整學習大綱和學習進度,提供個性化和自適應的學習體驗。除此之外,人工智能在教育的其他方面也取得很好的進展。AI外語老師
得益于語音識別和語音合成技術的成熟(語音識別與合成技術同樣是利用大數據技術進行機器學習與訓練),一些在線教育網站嘗試用人工智能外語老師進行外語教學。這里面的原理其實并不復雜,聊天機器人技術已經普遍應用,只要將學習的知識點設計進聊天的過程中,就可以實現一個簡單的AI外語老師了。
智能解題
比較簡單的智能解題系統其實是利用搜索引擎技術,在收集大量的試題以及答案的基礎上,進行試題匹配,將匹配成功的答案返回。這個過程看起來就像智能做題一樣,表面看給個題目就能解出答案,而實際上只是找到答案。
進階一點的智能解題系統,通過圖像識別與自然語言處理(這兩項技術依然使用大數據技術實現),進行相似性匹配。更改試題的部分數字、文字表述,但是不影響實質性解答思路,依然可以解答。
高階的智能解題系統,利用神經網絡機器學習技術,將試題的自然語言描述轉化成形式語言,然后分析知識點和解題策略,進行自動推導,從而完成實質性的解題。
大數據在社交媒體領域的應用
大數據有一個重要的、和我們大多數人密切相關,但是又不太引人注目的一個應用領域是輿情監控與分析。我們日常在各種互聯網應用和社交媒體上發表各種言論,這些言論事實上反映了最準確的民情輿論。一個個體的言論基本沒有意義,但是大量的、全國乃至全球的言論數據表現出的統計特性,就有了非常重要的意義。
編寫數據爬蟲,實時爬取各個社交新媒體上的各種用戶內容和媒體信息,然后通過自然語言處理,就可以進行情感分析、熱點事件追蹤等。輿情實時監控可用于商業領域,引導智能廣告投放;可用于金融領域,輔助執行自動化股票、期權、數字貨幣交易;可用于社會管理,及時發現可能引發社會問題的輿論傾向。
在美國總統大選期間,候選人就曾雇傭大數據公司利用社交媒體的數據進行分析,發現選票可能搖擺的地區,有針對性前去進行競選演講。并利用大數據分析選民關注的話題,包裝自己的競選主張。Facebook也因為授權大數據公司濫用自己用戶的數據而遭到調查和譴責,市值蒸發了數百億美元。
大數據在金融領域的應用
大數據在金融領域應用比較成熟的是大數據風控。在金融借貸中,如何識別出高風險用戶,要求其提供更多抵押、支付更高利息、調整更低的額度,甚至拒絕貸款,從而降低金融機構的風險?事實上,金融行業已經沉淀了大量的歷史數據,利用這些數據進行計算,可以得到用戶特征和風險指數的曲線(即風控模型)。當新用戶申請貸款的時候,將該用戶特征帶入曲線進行計算,就可以得到該用戶的風險指數,進而自動給出該用戶的貸款策略。
利用股票、外匯等歷史交易記錄,分析交易規律,結合當前的新聞熱點、輿論傾向、財經數據構建交易模型,進行自動化交易,這就是金融領域的量化交易。這些數據量特別巨大,交易涉及金額也同樣巨大,所以金融機構在大數據領域常常不惜血本,大手筆投入。
大數據在新零售領域的應用
區別于傳統零售,新零售使用大數據進行全鏈路管理。從生產、物流、購物體驗,使用大數據進行分析和預判,實現精準生產、零庫存、全新的購物體驗。
亞馬遜Go無人店使用大量的攝像頭,實時捕捉用戶行為,判斷用戶取出還是放回商品、取了何種商品等。這實際上是大數據流計算與機器學習的結合,最終實現的購物效果是,無需排隊買單,進去就拿東西,拿好了就走,超級科幻有沒有。
雖然無人店現在看起來噱頭的意味更多一點,但是利用大數據技術提升購物體驗、節省商家人力成本一定是正確的方向。
大數據在交通領域的應用
交通也是一個對大數據實時采集與處理應用比較廣的領域?,F在幾乎所有的城市路段、交通要點都有不止一個監控攝像頭在實時監控,一線城市大約有百萬計的攝像頭在不停地采集數據。這些數據一方面可以用于公共安全,比如近年來一些警匪片里會有一些場景:犯罪嫌疑人駕車出逃,警方只要定位了車輛,不管它到哪里,系統都可以自動調出相應的攝像頭,實時看到現場畫面。應該說這項技術已經成熟,大數據流計算可以對百萬計的流數據實時處理計算,電影里的場景計算其實并不復雜。
此外,各種導航軟件也在不停采集數據,通過分析用戶當前位置和移動速度,判斷道路擁堵狀態,并實時修改推薦的導航路徑。你如果經常開車或者打車,對這些技術一定深有體會。
還有就是無人駕駛技術,無人駕駛就是在人的駕駛過程中實時采集車輛周邊數據和駕駛控制信息,然后通過機器學習,獲得周邊信息與駕駛方式的對應關系(自動駕駛模型)。然后將這個模型應用到無人駕駛汽車上,傳感器獲得車輛周邊數據后,就可以通過自動駕駛模型計算出車輛控制信息(轉向、剎車等)。計算自動駕駛模型需要大量的數據,所以我們看到,這些無人駕駛創業公司都在不斷攀比自己的訓練數據有幾十萬公里、幾百萬公里,因為訓練數據的量意味著模型的完善程度。
小結
正如我前面所說,利用大數據和機器學習,發掘數據中的規律,進而對當前的事情做出預測和判斷,使機器表現出智能的特性,正變得越來越普及。
大數據主要來自企業自身所產生,還有一些數據來自互聯網,通過網絡爬蟲可以獲取;再有就是公共數據,比如氣象數據等。所有這些數據匯聚在一起,計算其內在的關系,可以發現很多肉眼和思維無法得到的知識。然后進一步計算其內在的模型,可以使系統獲得智能的特性。當系統具備智能的特性,可以使機器對當前的事情做出預測和判斷,正如我今天和你聊的,大數據技術應用正變得越來越普及。
但是,這些數據通常非常巨大,存儲、計算、應用都需要一套不同以往的技術方案。通過前面3期內容,我帶你了解了大數據技術和應用的發展史,以及當今大數據典型的應用領域。從第4期開始,我將會從大數據主要產品的架構原理、大數據分析與應用、數據挖掘與機器學習算法等幾個維度,全面講解大數據的方方面面,相信你一定有所收獲。
-
醫療健康
+關注
關注
2文章
280瀏覽量
26155 -
機器學習
+關注
關注
66文章
8481瀏覽量
133840 -
大數據
+關注
關注
64文章
8941瀏覽量
139106
發布評論請先 登錄
相關推薦
邊緣計算網關的實時監控與預測性維護都有哪些方面?適合哪些行業使用?
請問ADS1263能做到多高精度?實現高精度應該注意什么?
智慧城市可以實現哪些方面的監測
緩存對大數據處理的影響分析
ADS1675最大數據吞吐率是是多少?
ADS8558無法實現高速采集,可能是哪些因素導致的,我們應該從哪些方面檢查呢?
ADS1284通過SPI讀取數據,長期采集的時候發現會小概率丟一些數據,什么原因?
智慧城市與大數據的關系
新加坡云主機需要考慮哪些方面
人員定位系統技術原理包括哪些方面?一篇弄懂

評論