《安創(chuàng)“芯”視野》第30期,邀請(qǐng)到亞馬遜云科技機(jī)器學(xué)習(xí)高級(jí)產(chǎn)品經(jīng)理李媛,她為大家介紹了如何借助亞馬遜云科技的AI/ML服務(wù),在沒有機(jī)器學(xué)習(xí)專業(yè)團(tuán)隊(duì)的情況下輕松打造IPC的AI能力,開啟產(chǎn)品及運(yùn)營(yíng)創(chuàng)新模式。
(以下是分享內(nèi)容整理)
大家好。我是李媛,來自亞馬遜云科技,負(fù)責(zé)機(jī)器學(xué)習(xí)產(chǎn)品方向。很高興能夠有機(jī)會(huì)和安創(chuàng)加速器生態(tài)的各位朋友一起交流,如何在IPC行業(yè)里運(yùn)用一些開箱即用的AI服務(wù)為IPC產(chǎn)品增加創(chuàng)新。
在智能攝像頭領(lǐng)域,無(wú)論是IP Camera或者是Smart Camera,相信大家都并不陌生。在亞馬遜電商平臺(tái)搜索IP Camera或者Smart Camera,就會(huì)看到各式各樣的攝像頭。其中主要有兩類形態(tài),一類是我們常說的智能攝像頭,另一類是目前非常流行的產(chǎn)品形態(tài)—智能門鈴,即Smart Doorbell。
一份來自IDC的關(guān)于智能硬件的調(diào)查數(shù)據(jù)顯示,在2019年到2024年的出貨量預(yù)測(cè)里,智能家居硬件的出貨量是呈現(xiàn)逐年遞增的趨勢(shì)。其中,占比最大的是Smart Camera,其次是智能門鈴。特別是從每年的年均復(fù)合增長(zhǎng)率來看,智能門鈴的年均出貨率增長(zhǎng)率是非常高的,年均可以達(dá)到35%。所以,這個(gè)行業(yè)在全球市場(chǎng)有著非常廣闊的機(jī)會(huì)。在全球的IPC產(chǎn)品里,涌現(xiàn)了很多國(guó)內(nèi)出海的品牌以及來自海外的品牌,特別是在中國(guó)長(zhǎng)三角和珠三角地區(qū),有著非常多的IPC公司。
雖然有著巨大的市場(chǎng)機(jī)會(huì),但由于玩家眾多、頭部品牌逐漸形成、以及硬件產(chǎn)品同質(zhì)化等原因,這就使得行業(yè)里一些現(xiàn)存企業(yè)不得不在激烈競(jìng)爭(zhēng)的市場(chǎng)環(huán)境中尋找更多突破:例如,如何從軟件端和硬件端去提高產(chǎn)品的競(jìng)爭(zhēng)力、越來越重視IPC后端的運(yùn)營(yíng)能力、如何降低現(xiàn)有成本支出從而控制成本。亞馬遜云科技有非常多的IPC客戶都在不斷地探索新的利潤(rùn)點(diǎn),以便在一個(gè)非常大,同時(shí)同質(zhì)化競(jìng)爭(zhēng)又非常嚴(yán)重的行業(yè)里尋找最容易做出一些差異性的方面去做創(chuàng)新,找尋新的利潤(rùn)增長(zhǎng)點(diǎn)。
在IPC行業(yè),常見的云端創(chuàng)新場(chǎng)景大體可以分為兩大類:一類是在產(chǎn)品本身的功能點(diǎn)或者是特性上去做一些創(chuàng)新,比如增加一些AI的智能識(shí)別功能或者是智能語(yǔ)音。因?yàn)樵谌藱C(jī)交互里,語(yǔ)音是最自然的方式。在AI領(lǐng)域,很多不同企業(yè)都做了不同的探索。比如,一些海外的家居安防企業(yè)做了人形檢測(cè)、車輛檢測(cè)以及快遞包裹檢測(cè)等等。對(duì)于這些公司來講,AI產(chǎn)品就是一個(gè)額外的盈利點(diǎn)。在智能語(yǔ)音方面,有很多深圳的智能語(yǔ)音公司生產(chǎn)了大量的智能硬件,并且接入了Alexa這個(gè)平臺(tái)。無(wú)論是智能燈還是耳機(jī),人們都可以通過語(yǔ)音去做控制,這也是一個(gè)常見的應(yīng)用。這些都是在產(chǎn)品功能方面做出的創(chuàng)新。
另一類創(chuàng)新是基于數(shù)據(jù)領(lǐng)域的創(chuàng)新或者是基于數(shù)據(jù)領(lǐng)域的一些精細(xì)化運(yùn)營(yíng)和探索。比如,基于IoT的直連數(shù)據(jù)、云端存儲(chǔ)或者是使用行為規(guī)律數(shù)據(jù);還有,比如在客服領(lǐng)域,針對(duì)用戶的使用做分析,分析退貨率或者差評(píng)究竟來自于哪里,或者是一些設(shè)備的故障可能出現(xiàn)在哪里。基于這樣的前提在設(shè)備使用過程中,對(duì)其本身的很多數(shù)據(jù)去構(gòu)造一個(gè)云上即數(shù)據(jù)湖,從而挖掘數(shù)據(jù)的價(jià)值。這是另外一類做IPC云端創(chuàng)新的場(chǎng)景。就目前來看,這個(gè)行業(yè)是機(jī)遇與挑戰(zhàn)并存的,現(xiàn)在越來越多的廠商也都在探索一些創(chuàng)新功能點(diǎn)以及基于數(shù)據(jù)的精細(xì)化運(yùn)營(yíng)以使得自己在競(jìng)爭(zhēng)里獲得一些優(yōu)勢(shì)。
在IPC行業(yè)里,一個(gè)叫做Ring的公司的一些產(chǎn)品,就代表了針對(duì)To C端當(dāng)下比較有代表性的創(chuàng)新產(chǎn)品形態(tài)。譬如非常極致地利用云帶來了一些包括云存、視頻回放以及動(dòng)作捕捉、識(shí)別陌生人寵物快遞人員、幫助判斷是家人來了可以開門等等諸多功能。而這些功能背后其實(shí)都離不開云端的AI能力。
對(duì)于在AWS上做一整套的IPC端到端的解決方案,大家不要覺得這好像很復(fù)雜,其實(shí)都是一部分一部分來逐步部署的。這里分了幾類,一類是基于KVS(KVS就是Kinesis Video Streams,是AWS平臺(tái)上一個(gè)完全托管的流媒體服務(wù),可以把視頻流設(shè)入到云端),它包括了基于KVS去實(shí)現(xiàn)IPC云端的存儲(chǔ)和回放、基于WebRTC來實(shí)現(xiàn)一些實(shí)時(shí)通訊、基于一些語(yǔ)音功能去跟Alexa做交互、基于S3做存儲(chǔ)、還有一些數(shù)據(jù)分析、基于云端的AI方案等等。由此可見,整套方案里確實(shí)包含了很多部分,但今天我們就主要講AI這一部分。
那么具體是如何實(shí)現(xiàn)基于云端的AI呢?左邊是一個(gè)攝像頭端側(cè)。端側(cè)的視頻流一方面會(huì)基于KVS推流到云端,另一方面會(huì)在端測(cè)做動(dòng)作識(shí)別即motion detection。檢測(cè)到這個(gè)motion之后,會(huì)抽取視頻流的關(guān)鍵幀,把關(guān)鍵幀的圖片或者短視頻片段送到云端去做AI分析。而AI分析的部分通常會(huì)有兩種做法,一種是通過API調(diào)用方式直接調(diào)用開箱即用的服務(wù)Rekognition,另一種是企業(yè)自己構(gòu)建AI模型并托管在機(jī)器學(xué)習(xí)平臺(tái) SageMaker上。它們?cè)谠贫藭?huì)去做一些AI分析,例如:是否檢測(cè)到陌生人還是家人,或者是否檢測(cè)到出現(xiàn)人臉、寵物、包裹、動(dòng)作等等。
關(guān)于AI的實(shí)現(xiàn)部分,上圖是AWS平臺(tái)上機(jī)器學(xué)習(xí)服務(wù)的一個(gè)三層技術(shù)堆棧。如果有IPC廠商是剛開始接觸AI,或者只是想要在它們的業(yè)務(wù)場(chǎng)景里給攝像頭增加AI功能。那么,位于最上層的這些人工智能服務(wù)就適合于那些還沒有自己的專業(yè)機(jī)器學(xué)習(xí)團(tuán)隊(duì),但卻想給產(chǎn)品或者業(yè)務(wù)增加AI能力的企業(yè);中間的SageMaker是機(jī)器學(xué)習(xí)平臺(tái),它是供算法人員或者開發(fā)人員使用的,以便提高他們?cè)陂_發(fā)機(jī)器學(xué)習(xí)模型以及部署時(shí)的效率;此外,一些公司有著非常專業(yè)的龐大AI團(tuán)隊(duì),那他們就可以利用最下層的基礎(chǔ)設(shè)施層來完成其機(jī)器學(xué)習(xí)的任務(wù)。
人工智能服務(wù)
這層服務(wù)有幾個(gè)特點(diǎn)。一是完全托管、開箱即用。我們可以看到,這些服務(wù)覆蓋了視覺、語(yǔ)音、文本等等各種領(lǐng)域。在實(shí)際使用過程中,只需要通過一個(gè)簡(jiǎn)單的API 調(diào)用就可以使用了。此外,這一層的很多服務(wù),無(wú)論Rekognition或是像Comprehend在做自然語(yǔ)言理解服務(wù)時(shí),也支持在標(biāo)準(zhǔn)API服務(wù)之外進(jìn)行一些定制開發(fā)。還有一類AI服務(wù),是跟應(yīng)用相關(guān)的服務(wù)。比如個(gè)性化推薦Amazon Personalize,是基于亞馬遜電商的技術(shù),這相當(dāng)于一個(gè)自動(dòng)學(xué)習(xí)工具,你可以用自己的數(shù)據(jù)去訓(xùn)練出一個(gè)你自己專有的模型,并且它不需要專業(yè)機(jī)器學(xué)習(xí)人員來做這個(gè)事情。最后,這層的AI服務(wù)有些是深入行業(yè)的端到端解決方案,比如工業(yè)領(lǐng)域的5項(xiàng)AI服務(wù)和醫(yī)療健康領(lǐng)域的服務(wù)。
Amazon Rekognition: 圖像及視頻服務(wù)
Rekognition分為兩部分,一個(gè)叫Rekognition Image,是圖像處理服務(wù);一個(gè)叫Rekognition Video,是視頻服務(wù)。我們來看一下Rekognition有哪些功能。左上角最基本的功能叫對(duì)象與場(chǎng)景檢測(cè),它可以識(shí)別圖像里有哪些物體以及是什么樣的場(chǎng)景,還能做一些行為檢測(cè)。第二個(gè)功能在很多UGC場(chǎng)景或者很多media場(chǎng)景里使用得非常多。它能夠檢測(cè)圖片里可能的存在一些不安全內(nèi)容比如情色、暴力、煙酒、不當(dāng)?shù)淖诮虄?nèi)容等等,應(yīng)用于需要對(duì)內(nèi)容進(jìn)行審核的情況。這在短視頻或是圖片社交等領(lǐng)域幾乎是一個(gè)必備的功能。第三個(gè)是面孔檢測(cè)與分析。它會(huì)檢測(cè)一張圖片里是否含有人臉,并且給出這張人臉的一些信息,例如他的表情、年齡段以及五官位置等信息。最右邊是名人識(shí)別功能,Rekognition產(chǎn)品團(tuán)隊(duì)本身有一個(gè)非常大且不斷完善的名人庫(kù)。如果我們給到一張含有一個(gè)名人的圖片,它會(huì)告訴你這個(gè)名人是誰(shuí)。第二行第一個(gè)是面孔比較與查找,即去做一些身份識(shí)別以及身份認(rèn)證工作。其次是識(shí)別圖片中的文字,比如對(duì)一些車牌或者駕照信息或者是對(duì)身份證上的文字做提取。接著是個(gè)人防護(hù)裝備檢測(cè),即PPE檢測(cè),最開始較多應(yīng)用于一些生產(chǎn)制造場(chǎng)景或者有安全著裝需要的場(chǎng)合里。在這種場(chǎng)合下,你可以根據(jù)實(shí)際需求設(shè)置比如佩戴口罩是必須的或者說頭盔和手套都是必須的,那它就會(huì)去檢測(cè)工人們是否佩戴了這些必須裝備,同時(shí)也會(huì)告訴你其佩戴是否正確,因?yàn)橛锌赡軋D片里確實(shí)有一個(gè)頭盔,但是頭盔不是戴在人的頭上,那么這就是一個(gè)不安全的著裝。這時(shí)它會(huì)告訴你兩個(gè)點(diǎn):一是是否佩戴了,二是是否佩戴到了正確且合適的位置。接著的功能叫Custom Labels,自定義標(biāo)簽。目前Rekognition標(biāo)準(zhǔn)API支持2000多種標(biāo)簽,但是物體那么多,難免存在一些特殊情況。比如,在特定的行業(yè)領(lǐng)域或者特定的環(huán)境下,需要被識(shí)別的標(biāo)簽沒有在標(biāo)準(zhǔn)API里面,這時(shí)就可以利用自定義標(biāo)簽這個(gè)功能去定義需要被識(shí)別的標(biāo)簽。最下面3個(gè)功能是Rekognition Video特有的。在視頻場(chǎng)景里,除了可以檢測(cè)上面的這些內(nèi)容,它還有幾個(gè)在視頻方面特有的功能。比如,在視頻里我們可能會(huì)有一些提示幀用來提示該在哪些地方插入廣告,或者在視頻里需要做軌跡檢測(cè)之類的。這時(shí)候,在Rekognition video里,它都可以開箱即用,從而去進(jìn)行分析。
IPC場(chǎng)景會(huì)涉及到的功能
第一個(gè)是對(duì)象與場(chǎng)景檢測(cè),這在IPC里用得最多。無(wú)論我們?nèi)プ鋈诵螜z測(cè)還是去做車輛檢測(cè)都會(huì)用到這個(gè)功能。它的使用過程其實(shí)就是一個(gè)簡(jiǎn)單的API調(diào)用。比如,只需要提供一張圖片就能拿到一個(gè)這張圖里關(guān)于物品和場(chǎng)景檢測(cè)結(jié)果的信息, 里面包含了檢測(cè)到的標(biāo)簽以及它的置信度。因?yàn)閷?duì)象檢測(cè)會(huì)出現(xiàn)一些需要自定義的標(biāo)簽,這時(shí)就可以用Custom Labels。現(xiàn)在Custom Labels可以支持單標(biāo)簽分類,比如應(yīng)用在生鮮超市場(chǎng)景里去區(qū)分哪些是半成品食品,哪些是生鮮食品;也可以支持給圖片打多種標(biāo)簽的分類;同時(shí),通過給不同的對(duì)象標(biāo)出bounding box也能實(shí)現(xiàn)對(duì)象識(shí)別。就在IPC企業(yè)里的使用頻率而言,對(duì)象檢測(cè)是使用非常多的。
第二類是面孔檢測(cè)與分析。面孔分析這個(gè)API本身會(huì)告訴你這是男性還是女性、他的年齡段、他的表情、是否戴了眼鏡之類的。對(duì)于有圖片集的場(chǎng)景來講,就可以根據(jù)這些圖片信息去做特定的檢索,比如檢索微笑場(chǎng)景,然后去制定特定的相冊(cè)合集或者回憶相冊(cè)。
還有一類IPC使用比較多的場(chǎng)景是用作身份識(shí)別。這會(huì)包括兩種細(xì)分情況,一種是在人像集中進(jìn)行搜索比較,另一種是人和證件的比對(duì)。對(duì)于在大型集會(huì)等需要對(duì)人員進(jìn)行管控的場(chǎng)景,它的實(shí)現(xiàn)手段是在后臺(tái)把畫面里的人臉和一個(gè)人臉集做比較。例如,關(guān)于預(yù)先登記是有一個(gè)face collection集合的,那如果要判斷是否有進(jìn)行預(yù)先登記,就可以把這張人臉與既有的集合做比對(duì),從而做出身份識(shí)別。另外一種使用場(chǎng)景是人證比對(duì)。比如,去年疫情導(dǎo)致很多有遠(yuǎn)程考試的機(jī)構(gòu)需要進(jìn)行在線身份核驗(yàn),它使用的是人和證的比較,所以它其實(shí)應(yīng)用的是Rekognition后面的 Compare Faces這個(gè)API來實(shí)現(xiàn)人和證的比較的。
此外,像前面提到的考試證件識(shí)別場(chǎng)景,除了基于人臉的比對(duì)信息,可能很多時(shí)候還需要去收集這個(gè)人的一些證件信息例如駕照信息、身份證信息或者是護(hù)照信息。那么,就可以直接識(shí)別圖片里面的文本信息從而在數(shù)據(jù)庫(kù)里進(jìn)行存儲(chǔ),就不再需要像從前一樣做手動(dòng)輸入了。這也是Rekognition文本識(shí)別功能可以做到的。
在工業(yè)領(lǐng)域的AI服務(wù)
除了消費(fèi)場(chǎng)景下的IPC,在工業(yè)領(lǐng)域也有越來越多基于智能攝像頭的應(yīng)用。我們來看下上面的這個(gè)工業(yè)AI服務(wù)領(lǐng)域。左邊的Panorama有兩個(gè)服務(wù),它有一個(gè)硬件設(shè)備,也提供一個(gè)SDK。它與右邊的Lookout for Vision都是和計(jì)算機(jī)視覺相關(guān)的。中間兩個(gè)工業(yè)服務(wù)Monitron和Lookout for Equipment是對(duì)設(shè)備傳感器數(shù)據(jù)進(jìn)行異常發(fā)現(xiàn)以及預(yù)測(cè)性維護(hù)的。關(guān)于IPC相關(guān)的工業(yè)領(lǐng)域攝像頭,它會(huì)涉及到這兩個(gè)框里的服務(wù),即Panorama和Lookout for Vision。
Lookout for Vision這個(gè)服務(wù)的名字有點(diǎn)長(zhǎng)。其實(shí)Lookout是小心的意思,它是用來做工業(yè)質(zhì)檢的。也就是說,在工業(yè)生產(chǎn)環(huán)境或者是在一些制造業(yè)、零售業(yè)等各種不同的工業(yè)場(chǎng)景下,可以通過視覺圖片來檢測(cè)它的一些缺陷。因?yàn)槠鋵?shí)質(zhì)檢對(duì)于比如汽車或者半導(dǎo)體等相關(guān)行業(yè)來說都是非常重要的一個(gè)環(huán)節(jié),相較于人工檢查,利用機(jī)器做檢查的好處更明顯:一來機(jī)器不用下班,二來機(jī)器的效率比較高,三來檢查結(jié)果的一致性也比較強(qiáng)。Lookout for Vision其實(shí)是一個(gè)AI SaaS服務(wù),它的使用方式與前面的Rekognition的Custom Labels功能非常類似。比如,對(duì)于正常的圖片,我們會(huì)給它一些正常圖片的數(shù)據(jù)集;對(duì)于異常的圖片,會(huì)給一些異常的數(shù)據(jù)集。那么,基于這個(gè),它就能自己學(xué)習(xí)出一個(gè)模型來。其中的好處是它需要的數(shù)據(jù)非常少,最少30張就可以開始構(gòu)建模型進(jìn)而檢測(cè)模型的效果。
這是在工業(yè)領(lǐng)域通常使用比較多的場(chǎng)景類型的幾個(gè)例子。一是生產(chǎn)線上的缺陷檢測(cè),檢測(cè)它是否有劃痕或者錯(cuò)位之類的;另外一個(gè)是零部件缺失的檢測(cè),比如說我們?cè)谘b藥品膠囊的時(shí)候可能有某個(gè)沒有裝到,或者做一些輸液包的時(shí)候可能會(huì)出現(xiàn)有氣泡的情況,這時(shí)通過視覺就能檢測(cè)出它的異常;它還能解決產(chǎn)品一致性的問題,比如說右邊的銅纜出現(xiàn)了產(chǎn)品不一致的情況,都可以通過這種 AI服務(wù)很方便地來實(shí)現(xiàn)。
機(jī)器學(xué)習(xí)服務(wù)
那么,除了標(biāo)準(zhǔn)服務(wù)外,企業(yè)可能會(huì)有一些需要自己定制的服務(wù)。比如,想要做老人摔倒的檢測(cè)或者做嬰兒快要爬出床的檢測(cè),這時(shí)候,企業(yè)就會(huì)需要自己去構(gòu)建模型。對(duì)于需要自己構(gòu)建模型的企業(yè),亞馬遜云也有一個(gè)PaaS機(jī)器學(xué)習(xí)平臺(tái)服務(wù)叫SageMaker。SageMaker可以提供非常大的靈活性,一方面它提供給你非常大的構(gòu)建模型的靈活性,另一方面它又極大地提高了算法科學(xué)家構(gòu)建整個(gè)機(jī)器學(xué)習(xí)的效率。SageMaker平臺(tái)里面的功能組件非常多,也是我們非常重要的一個(gè)服務(wù),而且每一年都會(huì)不斷地更新迭代出更多新的產(chǎn)品功能。
大致來說,它的功能可以分成四個(gè)階段,這與機(jī)器學(xué)習(xí)的項(xiàng)目周期是一致的,即從數(shù)據(jù)準(zhǔn)備,到模型構(gòu)建,模型訓(xùn)練,超參數(shù)調(diào)優(yōu),再到模型部署與管理。SageMaker在每一步都有相應(yīng)的功能組件提供給大家使用,以便提高我們?cè)跈C(jī)器學(xué)習(xí)開發(fā)的效率。
幾個(gè)關(guān)鍵功能
首先介紹的功能是數(shù)據(jù)標(biāo)注。如果要企業(yè)自己構(gòu)建模型,非常重要的一步就是要準(zhǔn)備數(shù)據(jù)集,并且給這些數(shù)據(jù)打標(biāo)簽。無(wú)論是做分類、做目標(biāo)檢測(cè)還是畫bounding box,都需要給數(shù)據(jù)打標(biāo)簽。只有基于打過標(biāo)簽的數(shù)據(jù)集做機(jī)器學(xué)習(xí)才能構(gòu)建出模型。但是,給數(shù)據(jù)打標(biāo)簽向來是一個(gè)非常煩瑣且非常花時(shí)間的任務(wù),尤其當(dāng)你的數(shù)據(jù)集非常大的時(shí)候。SageMaker的打標(biāo)簽工具叫做Ground Truth。Ground Truth支持幾種不同的使用方式。一方面,它內(nèi)置了一個(gè)打標(biāo)簽的工作流,可以讓我們自己內(nèi)建的私有團(tuán)隊(duì)來打標(biāo)簽,無(wú)論是公司內(nèi)部的人還是我們自己指定的人都可以。另一方面,它支持亞馬遜Mechanical Turk眾包平臺(tái)。或者你也可以通過AWS Marketplace去尋找這種合作商。這些都是通過人力的方式實(shí)現(xiàn)的,但是它還有一個(gè)非常好用并且受到我們很多客戶喜歡的功能,即自動(dòng)打標(biāo)簽功能。比如要打10萬(wàn)張甚至上百萬(wàn)張圖片的時(shí)候,這對(duì)于很多頭部客戶來說是非常常見的。這時(shí)候全部靠人力來完成其實(shí)挺花時(shí)間的,但如果啟動(dòng)這個(gè)自動(dòng)標(biāo)記功能的話,它會(huì)基于前面打標(biāo)簽的部分結(jié)果去自己訓(xùn)練出一個(gè)模型,然后通過模型用機(jī)器的方式去打標(biāo)簽,從而降低數(shù)據(jù)標(biāo)記的成本。
這是Ground Truth標(biāo)記任務(wù)的幾種類別。對(duì)于圖片任務(wù),它支持圖像分類、邊界框語(yǔ)義分割;也支持文本分類、命名實(shí)體;另外也可以自定義打標(biāo)簽的任務(wù)。像前面提到的基于小量數(shù)據(jù)集很快進(jìn)行自動(dòng)化訓(xùn)練模型的比如Rekognition 的Custom Labels或者 Lookout for Vision,它們都跟Ground Truth有非常好的集成。如果數(shù)據(jù)本身已經(jīng)用Ground Truth打好標(biāo)簽了,就能很方便地導(dǎo)入到Custom Labels直接開始自動(dòng)化訓(xùn)練。所以,這是自己構(gòu)建模型時(shí)非常重要的一個(gè)步驟,也是 SageMaker的功能之一。
根據(jù)業(yè)務(wù)需求和團(tuán)隊(duì)組成選擇不同算法來源
既然是自己訓(xùn)練模型就有算法選擇問題。SageMaker它可以支持4種方式。第一種是內(nèi)置算法。我們?cè)赟ageMaker里提供了不同種類的內(nèi)置算法。比如與視覺相關(guān)的圖像分類或者對(duì)象檢測(cè)、語(yǔ)義分割,都有SageMaker內(nèi)置的算法,并且都跟SageMaker本身做過優(yōu)化和適配。第二種是支持把比如在GitHub上找到的一些開源算法直接放在SageMaker上來訓(xùn)練,會(huì)利用到它的免運(yùn)維和全托管的機(jī)器學(xué)習(xí)環(huán)境。再有就是也可以自己打一個(gè)docker。假設(shè)我們不是用常用的TensorFlow和PyTorch這些框架,我們有自己的框架,那也是可以支持的。最后一種是可以把在SageMaker的marketplace應(yīng)用市場(chǎng)上第三方的算法和模型直接調(diào)來在SageMaker上使用。而且,如果我們真的自己開發(fā)了一個(gè)很有意思或者很有價(jià)值的模型,那也可以放在第三方應(yīng)用市場(chǎng)上進(jìn)行售賣,也算是增加一個(gè)創(chuàng)新性的收入來源。
既然是自己訓(xùn)練模型就有算法選擇問題。SageMaker它可以支持4種方式。第一種是內(nèi)置算法。我們?cè)赟ageMaker里提供了不同種類的內(nèi)置算法。比如與視覺相關(guān)的圖像分類或者對(duì)象檢測(cè)、語(yǔ)義分割,都有SageMaker內(nèi)置的算法,并且都跟SageMaker本身做過優(yōu)化和適配。第二種是支持把比如在GitHub上找到的一些開源算法直接放在SageMaker上來訓(xùn)練,僅僅會(huì)利用到它的免運(yùn)維和全托管的機(jī)器學(xué)習(xí)環(huán)境。再有就是也可以自己打一個(gè)docker。假設(shè)我們不是用開源的或者常用的TensorFlow和PyTorch這些框架,我們有自己的框架,那也是可以支持的。最后一種是可以把在SageMaker的marketplace上第三方的算法和模型直接調(diào)來在SageMaker上使用。而且,如果我們真的自己開發(fā)了一個(gè)很有意思或者很有價(jià)值的模型,那也可以放在第三方應(yīng)用市場(chǎng)上進(jìn)行售賣,也算是增加一個(gè)創(chuàng)新性的收入來源。
在算法和模型訓(xùn)練之后,就會(huì)存在在線推理集群?jiǎn)栴}。訓(xùn)練好一個(gè)模型,然后用圖片來進(jìn)行分析,這個(gè)過程通常叫推理。推理時(shí)通常需要考慮的問題就是根據(jù)攝像頭在全球不同國(guó)家出貨量非常大的情況和它們波峰波谷的使用情況需要做到集群的彈性伸縮等等。這時(shí)候,在SageMaker上去部署這個(gè)推理集群就很簡(jiǎn)單了,只需一鍵就可以實(shí)現(xiàn)彈性伸縮和高可用的部署。并且,還有一個(gè)非常重要的功能就是我們?cè)诟履P偷臅r(shí)候會(huì)去做一些A/B測(cè)試,基于SageMaker做A/B測(cè)試也非常簡(jiǎn)單。此外,因?yàn)镮PC公司的創(chuàng)新性都非常強(qiáng),所以客戶可能會(huì)有多個(gè)模型,比如他可以支持他的每個(gè)終端的C端用戶都有一個(gè)自己的模型,那對(duì)他來講,最后他就會(huì)有成千上萬(wàn)個(gè)模型。如果按照常規(guī)的部署模型的方式,假設(shè)一個(gè)模型是一臺(tái)集群,那成千上萬(wàn)個(gè)模型就是成千上萬(wàn)個(gè)集群,這個(gè)成本是非常高的。但是,在SageMaker的end point即終端節(jié)點(diǎn)上,它有一個(gè)非常好用的功能就是它在一個(gè)終端節(jié)點(diǎn)可以支持部署大量的模型實(shí)現(xiàn)模型的自動(dòng)輪替,這就相當(dāng)于他的多個(gè)模型都可以部署在一個(gè)節(jié)點(diǎn)上,從而極大地降低了他們模型在線推理時(shí)的成本。
在邊緣端應(yīng)用的功能組件
可能在工業(yè)場(chǎng)景下或者在一些特殊要求的場(chǎng)景下,模型需要部署在邊緣端。當(dāng)我們?cè)谶吘壎诉M(jìn)行部署比如說把模型部署在掃地機(jī)器人上或者部署在一些車內(nèi)的攝像頭去做駕駛行為分析的時(shí)候,一個(gè)很重要的問題是邊緣端的算力和內(nèi)存與云端是不太好相比的。另外,邊緣端的硬件設(shè)備也是各種各樣的,需要去做適配。但是,SageMaker有一個(gè)叫做Neo的功能組件,它可以支持我們把云端的模型進(jìn)行編譯從而適配到不同的硬件和邊緣設(shè)備。它的好處是經(jīng)過一次編譯就可以在多個(gè)硬件平臺(tái)運(yùn)行;并且在最優(yōu)的情況下它可以在不影響模型精度的情況下將運(yùn)行速度提高25倍,同時(shí)使用的資源也能優(yōu)化到原來的1/10大小。如此一來,就可以很好地適配邊緣端比較小的內(nèi)存和算力了。
還有一種場(chǎng)景是說我們?cè)谶吘壎诉\(yùn)行模型的時(shí)候,每個(gè)模型都需要一個(gè)自己的獨(dú)立運(yùn)行時(shí)。如果單個(gè)計(jì)算空間只用一個(gè)模型,會(huì)造成這些空間不太充裕。而且,我們?cè)谕瓿梢粋€(gè)任務(wù)的時(shí)候有可能是需要多個(gè)模型組合的,比如一個(gè)掃地機(jī)器人可能需要先去檢測(cè)到這是什么環(huán)境,然后再去輪轉(zhuǎn)另外一個(gè)模型,這是非常正常的。這時(shí)候,在每個(gè)設(shè)備上運(yùn)行多個(gè)模型要怎么做呢?SageMaker有一個(gè)叫做Edge Manager的功能組件,它會(huì)在邊緣端部署一個(gè)agent。這個(gè)agent占比非常小,但是可以實(shí)現(xiàn)對(duì)邊緣設(shè)備的有效管理。此外,我們?cè)跈C(jī)器學(xué)習(xí)領(lǐng)域非常常見也經(jīng)常遇到的一個(gè)問題就是模型不是一成不變的。不是說部署了這個(gè)模型后就永遠(yuǎn)是這個(gè)模型了,很有可能過一段時(shí)間后因?yàn)橥獠炕蛘邇?nèi)部環(huán)境的變化我們需要更新模型。那怎么對(duì)邊緣端的模型進(jìn)行監(jiān)測(cè)以及收集反饋數(shù)據(jù)重新進(jìn)行模型的迭代更新呢?那么,Edge Manager同樣也可以有效地實(shí)現(xiàn)這個(gè)需求。SageMaker的Edge Manager其實(shí)就是實(shí)現(xiàn)對(duì)在邊緣端運(yùn)行的大量模型的有效管理。
那么,為了幫助大家快速、零成本起步實(shí)踐這些云上的AI服務(wù),針對(duì)初創(chuàng)企業(yè),我們有一個(gè)專門給到初創(chuàng)企業(yè)的福利包,叫做云創(chuàng)計(jì)劃。我們和安創(chuàng)加速器就云創(chuàng)計(jì)劃的合作也非常順利。如果您的企業(yè)是初創(chuàng)企業(yè),那您可以掃描這個(gè)二維碼,去注冊(cè)申請(qǐng)?jiān)苿?chuàng)計(jì)劃大禮包。它含有一個(gè)最高17.5萬(wàn)人民幣的AWS云服務(wù)抵扣券。
在今天活動(dòng)的最后,也跟大家分享一下即將到來的亞馬遜云科技中國(guó)峰會(huì)。今年我們分別會(huì)在上海、北京和深圳三地舉辦,都是線下活動(dòng)。上海和北京的活動(dòng)都是萬(wàn)人規(guī)模的,同期北京還會(huì)有線上活動(dòng)。如果大家對(duì)云計(jì)算、AI或者數(shù)據(jù)分析等領(lǐng)域有興趣想要深入學(xué)習(xí),或者是聽取別的企業(yè)的成功經(jīng)驗(yàn)的話,都可以掃描這個(gè)二維碼注冊(cè)并查看大家感興趣的內(nèi)容。
以上就是我今天的分享內(nèi)容。
? ? ? ?責(zé)任編輯:tzh
評(píng)論