(文章來源:神小無)
自從人工智能誕生之初,計算機科學家就一直夢想著能制造出可以像人類一樣看到和理解世界的機器。這些努力導致了計算機視覺的出現。計算機視覺是AI和計算機科學的領域,致力于處理視覺數據的內容。近年來,由于深度學習和人工神經網絡的進步,計算機視覺取得了巨大飛躍。深度學習是AI的一個分支,特別擅長處理圖像和視頻等非結構化數據。這些技術上的進步,在現有領域中極大促進了計算機視覺的應用,并將其引入新領域。現如今,計算機視覺算法已成為我們每天使用的應用中非常重要的組成部分。
關于計算機視覺,盡管它已經取得了巨大的進步,但它暫時還不能完全像人類一樣理解照片和視頻。深層神經網絡是計算機視覺系統的基礎,非常擅長在像素級別匹配模式。它們在分類圖像和定位圖像中的對象方面特別有效。但是,當要理解視覺數據的上下文,并描述不同對象之間的關系時,它們卻效果慘淡。
計算機視覺取得巨大進步的領域之一是圖像分類和物體檢測。經過足夠多的標記數據訓練而出的神經網絡,將能夠以驚人的精度檢測并標記出各種物體。很少有公司能與Google龐大的用戶數據存儲相匹配。該公司一直在使用其幾乎無限多(并且正在不斷增長)的用戶數據存儲庫來開發一些最高效的AI模型。當用戶在Google相冊中上傳照片時,它會使用其計算機視覺算法對場景,物體和人物的內容信息進行注釋。然后,用戶可以根據此信息搜索照片。例如,如果用戶搜索“狗”,則Google會自動返回相簿中包含狗的所有照片。
但是,Google的圖像識別效果并不理想。在一次事件中,計算機視覺算法錯誤地將兩張皮膚黝黑的人的照片標記為``大猩猩'',這給該公司帶來了極大的尷尬。
現在,有很多公司正在使用機器學習來自動增強照片的質量,例如白平衡并添加效果,模糊背景等等。智能計算機變焦是計算機視覺技術的一大進步。傳統的縮放功能通常會使圖像模糊,因為它們通過在像素之間進行插值來填充放大的區域?;谟嬎銠C視覺的縮放不是放大像素,而是著重于邊緣,圖案等功能。這種方法可產生清晰的圖像。許多初創公司和歷史悠久的圖形公司已轉向深度學習來增強圖像和視頻。
直到不久前,面部識別技術還是一項笨拙且昂貴的技術。但是近年來,由于計算機視覺算法的進步,面部識別已進入各種智能計算設備。智能手機引入了FaceID,這是一種身份驗證系統,該系統使用設備上的神經網絡在看到擁有者的臉部時將手機解鎖。
在設置過程中,FaceID在所有者的臉上訓練其AI模型,并在不同的光照條件,面部毛發,理發,帽子和眼鏡下正常工作。在我國,許多商店現在都在使用面部識別技術為顧客提供更順暢的付款體驗??蛻魺o需使用信用卡或移動支付應用程序,而只需要向配備了計算機視覺的相機展示自己的臉即可。
隨著物聯網(IoT)的蓬勃發展,連接互聯網的家庭安全攝像頭日益普及?,F在,用戶可以隨時輕松地安裝監控攝像頭并在線監視房屋。每個攝像頭都會向云端發送大量數據。但是安全攝像機記錄的大多數鏡頭都是無關緊要的信息,從而導致大量的網絡、存儲和電力資源浪費。
計算機視覺算法可以使家庭安全攝像頭在使用這些資源時變得更加高效。通常情況下,智能攝像頭會保持空閑狀態,直到它們在視頻源中檢測到物體或物體移動,然后它們才開始將數據發送到云端或向攝像頭所有者發送警報。但是目前,計算機視覺仍然不能很好地理解上下文環境。因此,不要指望它能在良性運動(例如,球在房間內滾動)和需要注意的事物(例如,小偷闖入房屋)之間區分開來。
在過去的幾年中,增強現實已經成為一個不斷增長的市場。AR的大部分擴展歸功于計算機視覺算法的發展。AR應用程序使用機器學習來檢測和跟蹤目標位置和放置虛擬對象。你可以在很多應用中看到AR和計算機視覺的結合。
利用計算機視覺,你可以通過手機攝像頭從現實世界中提取信息。它可以使用計算機視覺算法執行各種任務,例如讀取名片,檢測家具和衣服的風格,翻譯路牌以及將手機連接到基于路由器的wi-fi網絡。由于深度學習的進步,計算機視覺現在可以解決以前很難解決甚至計算機無法解決的問題。在某些情況下,訓練有素的計算機視覺算法可以與經驗豐富的工作人員相媲美。
在深度學習之前,創建可以處理醫學圖像的計算機視覺算法需要軟件工程師和相關專家付出大量的努力。他們必須合作開發從放射影像中提取相關特征的代碼,然后對其進行檢查以進行診斷。深度學習算法提供了端到端的解決方案,使該過程變得非常容易。計算機視覺已進入許多醫學領域,包括癌癥檢測和預測、放射學、糖尿病性視網膜病變。一些AI研究人員甚至說深度學習將很快取代放射科醫生。不過,不要忘了深度學習是從像素中提取信息的,所以它不能復制人類醫生的所有功能。
教計算機玩游戲一直是AI研究的熱門領域。大多數游戲程序都使用強化學習,這是一種AI技術,可以通過反復試驗來發展其行為。計算機視覺算法在幫助這些程序解析游戲圖形內容方面發揮著重要作用。但是要注意的一件事是,在許多情況下,圖形會被“簡化”或簡化,以使神經網絡更容易理解它們。此外,目前AI算法需要大量數據才能學習游戲。例如,OpenAI玩Dota的AI必須經歷45,000年的游戲時間才能達到冠軍水平。
2016年,亞馬遜推出了Go,這是一家無人商店,顧客可以走進商店,拿起想要的東西,然后走出去。Go使用各種人工智能系統來消除對收銀員的需求。當顧客在商店中走動時,配備了高級計算機視覺算法的攝像頭會監控他們的行為,并跟蹤他們拾取或返回貨架的物品。當他們離開商店時,他們的購物車會自動從他們的Amazon帳戶中結賬。
在沒有人類駕駛員的情況下可以在道路上行駛的汽車,一直是AI社區最長的夢想和最大的挑戰之一。在今天,我們距離能在各種光照和天氣條件下,在道路上任意行駛的自動駕駛汽車這個夢想還很遙遠。但是,由于深度神經網絡的進步,我們取得了許多進步。打造無人駕駛汽車的最大挑戰之一是使他們能夠了解周圍的環境。
盡管不同的公司以各種方式解決該問題,但它們之間不變的一件事是計算機視覺技術。車輛周圍安裝的攝像頭可監控汽車的環境。深度神經網絡解析鏡頭并提取有關周圍物體和人物的信息。該信息與來自其他設備(如激光雷達)的數據相結合,以創建該區域的地圖,并幫助汽車在道路上行駛并避免碰撞。
隨著“新基建”風口的到來,在5G、物聯網傳感器、具有AI功能的智能攝像頭和邊緣計算的推動下,計算機視覺領域將迎來快速爆發。鈦靈AI市場是由Google AI技術推廣伙伴Gravitylink打造的全球化AI算法和解決方案交易市場,致力于幫助來自全球的優秀AI解決方案與需求方建立更加高效的直接連接,加速AI技術在各個領域的落地和應用。
(責任編輯:fqj)
-
AI
+關注
關注
88文章
35164瀏覽量
280045 -
面部識別
+關注
關注
1文章
375瀏覽量
27221
發布評論請先 登錄

【幸狐Omni3576邊緣計算套件試用體驗】人臉識別
人臉識別技術的算法原理解析
人臉識別技術在安全監控中的應用
人臉識別技術的應用場景
深度識別人臉識別有什么重要作用嗎
隧道人臉識別門禁系統應用于隧道工程等場所的智能化安全管理系統

評論