科技行業發展滾滾向前,不過一直以來,中國科技行業都是一個追隨者,可以說在PC時代我們是一個完全的學習者,而在互聯網時代,我們的網絡應用和服務開始能夠和海外巨頭并駕齊驅,而到了移動互聯網時代,開始呈現領先全球的態勢,中國移動互聯網發展的進程遠超西方發達國家,很多人都覺得中國人太依賴手機了。不過想要領先世界,那么機會真正出現在人工智能領域,AI改變世界已經是一個不爭的趨勢,而在這個領域,中國科技界正在凝聚一股強大的力量。
AI三要素和人工智能五小強
在互聯網乃至移動互聯網時代,大家突然發現中國賴以成功的人口紅利優勢依然存在,不斷增加的互聯網用戶帶來了非常好的發展基礎。即便是在最近兩年,下沉市場還帶動了拼多多這樣的企業誕生,可以說,市場規模依然是科技界的最大優勢。不過讓人感到欣慰的是,這種優勢還將繼續起作用,到了人工智能時代,依舊是中國科技行業能夠實現彎道超車的基礎。因為大量的人口紅利、多樣且豐富的使用場景、對新技術的接受程度等等因素疊加,產生了大量的可在AI場景中數據,這種數據樣本從規模到價值都非常宏大。對人工智能三要素來說,這也是其為關鍵的數據優勢。
AI三要素是指算法、算力和數據,用簡單的話講,算法可以說是計算的方法,好的算法效率高,準確率高,而算力則是硬件能力,在量子計算機誕生之前,在算力方面,不會產生什么跨時代的差距,目前努力的方向也是芯片產品的小微化,能夠讓更多的智能設備具有運算能力。而5G的發展將會帶來一個非常巨大的變革就是設備可以共享云端算力,這會大大增強智能設備的算力,這也是為什么我們會說5G時代才是真正的萬物互聯的原因。而數據這個層面,那就非常簡單了,是AI學習的基礎,就好像是你讀的書,簡單的可以說,你讀的書越多,你也就越聰明越有智慧。而在這個層面,各大科技公司開始出現了一些差距。
目前中國在AI數據方面還是具有顯著優勢的,硅谷的人工智能公司大部分都只能在算法上想辦法。而中國市場的數據規模更為龐大,更多的公司可以提供這些數據來供人工智能公司進行學習,由此產生了一個非常好的人工智能生態,而一旦這個生態達到臨界爆發,人工智能的自學習能力達到一定的程度,那么就會產生一個代際的差距,就好像大學生和小學生一樣。而目前中國在人工智能領域有五家公司被業界稱為“五小強”,算法層有商湯、曠視,AI數據領域有云測數據,硬件方面有涂鴉智能、地平線,這些公司雖然不是BAT級的巨頭公司,但是在人工智能領域都有著自己專業的深耕和成果,可以說是中國人工智能領域彎道超車的中堅力量。
AI領域的數據英雄
在人工智能“五小強”中都是人工智能領域的頭部企業,商湯、曠視經常在視覺和識別等方面一騎絕塵,而涂鴉和地平線,支撐了目前大量的智能產品進入全球千家萬戶,而云測數據用高質量的AI數據撐起了人工智能的一片天,曾被媒體稱為“AI領域的數據英雄”。簡單說,云測數據就像是生產行業燃料的企業,幫助算法公司去把數據進行標記,從而實現更好的學習效果,而這個工作可以說是非常龐大和繁瑣,但確實又非常重要。不然再好再多的數據,也沒有辦法實現他們的核心價值。
比如人工智能領域有一個有趣的話題,人臉識別的準確率對于有色人種隨著膚色的加深會大大下降,這里有一個很重要的原因就是訓練數據的不足。如果想要訓練一個低精度的人臉識別比如性別識別,那么隨便標注性別人像的數據就可以了,但如果要精準識別一個人,就要有不同維度的被標注好的數據。由此也就誕生了定制化的AI數據服務,還原或搭建真實使用場景中所需要的環境,采集好定制化的場景數據并經過精準標注后,用這些高質量數據去訓練算法模型,才能使其具有越來越智能。
這種定制化的數據服務能力的要求很高,必須具備對場景深度的還原能力、作業協同化能力、專業化能力這三種能力,首先保證對用戶的需求進行精準的拆解、理解甚至預判,其次設立專業規范的協作流程,最后有足夠專業的人士能夠保證數據標注的質量。比如說,在醫療領域做X光片病理診斷中,標注人員需要非常專業,甚至是副主任醫師專業以上的級別,才能對病理的片子進行正確的數據標注與解讀。類似的情況也出現在教育、法律、智能駕駛等多個領域。
而云測數據正是這個領域的頭部企業,他們通過自建數據標注基地和場景實驗室的方式,打造專業的定制化采集和高質量的標注隊伍,幫助人工智能企業獲取更多優質的特定場景數據,持續為AI訓練、優化提供安全可靠、精準高質的數據服務。現在已經覆蓋了智能駕駛、智慧城市、智能家居、智慧金融、新零售等諸多領域的定制化的數據采集、數據標注服務,實現了語音、圖像、文本、視頻的全領域覆蓋,全方位支持各類型數據的處理。可以說是成為了人工智能領域的數據基礎服務提供者。目前已經擁有了行業內最大規模的專業數據服務全職人員,成功為上百家企業提供了AI數據服務。
數據優勢是核心優勢
目前在算法和算力方面,其實并沒有什么代際差距,所以人工智能競爭的關鍵核心,還是在數據本身,這是行業的源頭活水,也是發展的關鍵。不過對于人工智能公司來說,選擇第三方的數據標準公司已經是當下最優的選擇,這里面存在人員成本、專業程度以及效率質量等多方面問題,可以說越專業的數據公司就有著越高的數據標記能力,更有著豐富的數據標記經驗和對客戶訓練需求的深刻理解。這對于云測數據來說,其實是一個很好的機會,而隨著行業規模的不斷擴大,其領軍和帶頭作用也越發明顯,而其在隱私保護、數據安全等方面的高標準,也逐漸成為行業的標桿。所以云測數據也開始越來越多地出現在大眾視野之中,從相當程度上推動了AI 數據行業的規范化發展。
不過總體來看,整個數據領域的水平還有待發展,還有大量良莠不齊的外包團隊,進行一些游擊戰式的數據標注服務,但隨著企業對數據標準要求的提升,數據標注向著更專業的方向發展是大勢所趨,因為這樣才能建立真正的人工智能壁壘,畢竟最好的建筑材料才能建設起最堅固的房子。云測數據總經理曾說過,“以人臉識別為例,以前的需求是拉框、標注五官,現在需要標注幾百個點,精確到3-5像素以內。而諸如智能駕駛領域的3D點云標注、和家居、金融等領域涉及的NLP標注等,對數據標注的整體能力也有更高的要求”這種級別的數據服務,門檻還是相當高的。
其實從社會發展來看,倒也有很多相似之處,之前我們追求經濟發展的速度,現在則追求經濟發展的質量,只有速度沒有質量,最后還是沙上建塔,經不起風浪的沖刷。而中國人工智能行業如果想要真正實現彎道超車和逆襲,對數據標注方面的專業度提升和投入,還是要加大關注。而云測數據這樣的專業機構,也會迎來更大的發展空間。
-
數據
+關注
關注
8文章
7247瀏覽量
91282 -
移動互聯網
+關注
關注
5文章
600瀏覽量
34597 -
AI
+關注
關注
88文章
34520瀏覽量
276020
發布評論請先 登錄
評論