擁有超過10萬員工的阿里集團,其平臺交易總金額已經占到了中國社會消費品零售總額的13%,創造就業超過4000萬。這個龐大的數字經濟體,今年即將迎來二十歲生日。
鮮為人知的是,這個數字經濟體之所以能夠順利走到今天,離不開其花了一半時光所打造的業務與技術底座——那朵伴隨著成長陣痛而扶搖直上的阿里云,今年也已經十周歲。
2019年3月,虎嗅專訪了阿里云智能基礎產品事業部總經理蔣江偉(花名小邪)、資深技術專家鐘華(花名古謙)。不出意外,采訪內容印證了我們此前的猜測:如果要從磅礴繁雜的阿里經濟體中,找出一條讀懂“昨天,今天,明天”的業務線索,阿里云恐怕是不二之選。
煙囪
“即便你僅僅訪問一次淘寶的首頁,所涉及的技術和系統規模都是你完全無法想象的,是淘寶2000多名頂級的工程師們的心血結晶,其中甚至包括長江學者、國家科學技術最高獎得主等眾多牛人。”——卡特《你剛才在淘寶上買了一件東西》
2008年初,淘寶的程序員撞到了墻上,心驚膽戰。
那時候,淘寶在技術層面上,是一個由200多個功能模塊組成的代碼壓縮包,體積大概有幾百兆字節。其復雜程度已經“超出人類的認知負載”,沒有人能完全掌握內部邏輯和關聯。“改動商品相關代碼,發現交易出問題了,改了論壇上的代碼,結果旺旺出問題了”。
這還是“幾個月就翻倍”的業務快速發展期。淘寶在峰值時的數據庫連接數量已經超過5000個,數據庫服務器的CPU占用率常常超過90%,且無法擴容。
實際上,早在4個月前的一次戰略會上,阿里決策層已經看到問題所在。
那個會的召集人是馬云。平時戰略會都在西湖,那次他說找個看海的地方,思路開闊一些。但是當時秘書對寧波不熟,訂錯了地方,結果一群高管在一個海在哪里都看不到的屋子里,“不接地氣”地吵了兩天兩夜。
在最后一天晚上深夜,大家歷經爭吵終于畫出一張圖。圖上示意,信息流、資金流和物流將形成統一的數據智能,基本勾勒了12年后阿里現在的樣子。
流淌在各個業務中的數據要做到“大一統”,項目被命名為“登月計劃”。
但,月亮美好,卻太遙遠。眼下的現實是,淘寶底層技術基礎已經危如累卵,已經是出了名的“改這里、錯那里”。
要上線“淘寶旅行”和“***”。為了“不給主站添亂”,技術人員就另起爐灶重新做了這兩個系統。哪怕有很多重復功能,比如用戶、交易、查詢、評價等功能。
重復建設還只是成本的問題。一個個獨立的業務就是一根根獨立的煙囪,都長在同一片地里,但各冒各的煙。數據大一統,無從談起。
連業務屬性最一致的兩個業務——淘寶和淘寶商城(天貓的前身)都像兩個獨立的國家。
他們有很多共同的用戶、共同的商家,但車不同軌、書不同文,載著數據的“火車”到了“國界線”,必須要通過復雜的架構手段,“找一個翻譯”或者“換一個火車頭”。
再加上,阿里的地里長了這么多煙囪,無數的火車頭和翻譯,復雜得不成樣子。
建設煙囪本來就是多年來的企業IT模式:你起一個業務,底下給你弄一套系統;再起一個業務,我再給你弄一套系統。設計、生產、供應、物流、訂單、庫存、分銷、客服……每個功能再一套系統,企業就是一片煙囪田。
這是工業流水線被發明之后,管理界的金科玉律:理順、分配、不斷優化每個封閉的業務流程,通過每個工序和業務流程的效率提高,進而提升整個企業的效率。
然而,當數字化信息取代實物,成為最重要的生產資料后,工業流水線在數字化時代的弱勢便被無限放大——內部各環節之間只能是串聯的,且對外部完全封閉,恰似一根根煙囪。
“你會發現轉不動了,新業務不斷出現,所有人都找IT部門要資源,看起來你挺牛,但其實你拖慢了所有人的節奏。”
“互聯網這種速度,生死都是一瞬間。慢下來就掛了。”
雖然決策層看到問題所在,也遙遠地指了一下月亮。但就像人類真的登上月球要付出沉重的代價,阿里的“登月”也談何容易。
補天
“中國電商行業能有今天,上百萬淘寶店主都應該感謝秦始皇書同文車同軌,感謝高考語文考卷上的普通話發音題。”——馬平《為了我們雙11“剁手”,中國準備了2000年》
2007年底,有程序員想了個辦法:將每個煙囪都必備,且邏輯最獨立簡單的用戶信息模塊拆了出來,將其獨立成為單個公共模塊。這一嘗試后效果還不錯,淘寶又將交易模塊也獨立了出來。
2008年10月,基于此前的成功嘗試,阿里進行了一次被稱為“給高速飛行的飛機換發動機”的大手術。
這個名為“五彩石”(即女媧煉石補天用的石頭)的項目,其核心訴求就是要將淘寶與天貓在數據和業務層面完全打通。
當時的解法具有了后來中臺的影子:
1、抽離出每個業務的共性功能,如交易、支付、會員等等,打包成“磚塊”,房子千奇百怪,但磚頭都是一樣的。做一個新業務就變得非常容易。
2、讓數據沉淀到統一的池子,為之后喂養數據智能奠定基礎。
“大多數產品,產業共性70%,行業共性20%,真正和同行不一樣的,恐怕只有10%”,阿里資深技術專家古謙在見過上百家各行業龍頭企業后,這樣總結到。
而這一塊補天之石的影響,遠不止于此。
2009年初,五彩石項目結束,這個一共動用了200多人的公司級大項目(此前阿里超過10人的技術項目就不小了),最終為阿里沉淀了一套中間件技術,這個詞后來在技術圈普及,成為“拆煙囪”的標準。
(阿里云飛天研發團隊合影)
同樣在2009年,王堅率領的飛天團隊,正式掛出了阿里云的牌子。
在寧波的戰略會上,決策層們打算為“登月計劃”找個負責人,后來找來了王堅。
王堅人稱“博士”,不過在很長的時間里,博士都有一副類似“騙子”的面孔。
馬云說給阿里云每年投10億,投個10年,做不出來再說。但阿里內部論壇上討伐的聲音一浪高過一浪,花錢又不出成績,這哪是一個商業公司該干的事情。
其實,這恰好說明阿里云的確生于疼痛,生于業務壓力:
第一、“登月”要解決算力的問題,現成的IOE模式完全不適用;
第二、“五彩石”補天之后,要有與之匹配的分布式底座。
2013年,飛天單一集群能力達到5000臺,成為全球第一家對外提供這一能力的公司,算力的底座宣告建成。
到2018年底,阿里云在中國市場份額已經超過2到8名總和。同時,阿里宣布組織架構調整,阿里云升級為阿里云智能,將中臺能力與云全面結合。阿里云正式成為阿里經濟體的技術底座,以及全集團的技術能力出口。
而阿里云智能總裁,恰是十年前“五彩石”項目的負責人,“行癲”張建鋒。
今年3月21日,張建鋒首次在公開場合闡述了升級之后的阿里云智能戰略。至此,開端于2007年寧波海邊的故事,閉環完美劃上。“登月”的另一條隱線浮出水面。
阿里云此前被外界感知的,更多是算力與資源調度能力,以及自主知識產權研發。卻少有人知曉,阿里云的壯大與發展,伴隨著集團的每次業務陣痛與瓶頸突破,更與中臺戰略密不可分——
從五彩石到阿里云,這不是某種巧合,而是同一邏輯下的自然延展。可以說,中臺戰略與阿里云,就是互為因果,互為充要條件,缺一不可,非你不可的關系。
這不止是一朵能計算的云,更是一朵可以解決實際業務問題的云。因為,阿里云生于疼痛。而阿里集團的那次疼痛,又比絕大多數中國企業早了十年。
1000個BUG
“犯了足夠多的錯誤,你跌倒,你站起來。所有的錯誤都是進賬,都是很棒的收入。”
——馬云演講
“沒被洪水倒灌過,你怎么能證明這個城市的下水道架構是合理的呢?”
阿里云智能基礎產品事業部總經理小邪給我們講了這樣一個故事,2013年,阿里模擬出遠超過雙11壓力的流量,這股洪水灌下去之后,淹出來1000多個BUG。
“像這種非常極端而極致的BUG,沒有這么大的流量,是沖不出來的。即便招無數聰明的腦袋,也沒辦法解決的。”
這也是阿里不同于其他公司的地方,它具備互聯網的規模、金融級的準確性、企業級的復雜程度。
在很多年前,有一個互聯網圈流行的詞匯,叫“鼠標加水泥”,其含義是傳統商業模式與互聯網的結合。這些能夠做面對面生意的“重資產互聯網企業”,就屬于“水泥公司”,和那些只靠屏幕就能滿足用戶的“鼠標公司”截然不同。
而阿里早在十幾年前,就是中國第一代“水泥公司”。這是其業務性質決定的,和BAT另外兩家的“鼠標業務”完全不同。
比如,搜索是可以有一定模糊范圍的,搜不出來幾個鏈接也沒關系,但電商不行,哪件商品搜不出來,商家都會電話投訴的。不僅內容上不能有偏差,每次交易的數字都代表著真金白銀,差一分商家也是不干的。
再比如,社交行為基本是可以預見的,很難出現巨大的起伏跌宕。而電商用戶就如同12306一樣,面臨巨大的彈性,算力放多了浪費,放少了崩潰……
而且,其它互聯網企業的業務基本是比較清晰的,多是圍繞著一個主流量核心再去設置支流業務。而阿里則從一開始就像個傳統企業,要把一個產品或服務從生產設計、庫存運輸、分銷推廣再到客服分析全鏈路包含,其業務復雜度遠超過同體量互聯網企業。
高精準度、高復雜度以及難以預測的高并發,共同構成了阿里的技術瓶頸。這也是當業界大佬認為云計算“新瓶裝舊酒”時,馬云堅稱“不做云計算,阿里會死”的原因。
同期的其它幾家知名電商企業,依然在采購IBM的框架,甚至從Oracle請來了CTO。隨后,這些企業的技術端紛紛在現實磨難中各種崩盤,而且對這種崩潰的彌補,很難得到系統性的提升。
十年后的2018,騰訊、美團、京東等企業,或多或少都放出了中臺戰略和TO B戰略的消息,而云計算也逐漸成為了各家的當紅業務線。
當然,還有更多傳統企業,在近幾年的市場挑戰中,逐漸發現了自身原本信息系統建設的滯后性,開始求教于阿里技術團隊。
這些事實無不印證著那個判斷:阿里并不是多聰明或多奇怪,只是比其它企業提前很多年就遇到了挑戰。而現在,大部分企業也走到了那個挑戰的門口。
讓天下沒有難碰的運氣
“我們必須承認各種不確定性,利用數據和信息消除它們,而不是采用過去那種來自頂層的設計方式去解決問題。”——吳軍《硅谷之謎》
在采訪中,古謙向我們展示了一組術語:VUCA。
這組術語包含四個詞,即Volatility(易變性)、Uncertainty(不確定性)、Complexity(復雜性)、Ambiguity(模糊性)。可以充分概括這個商業時代的特征。
企業商業模式的轉型,已經從電氣時代的30年一個生命周期,到信息化時代的10年,到互聯網時代的5年,直至今天DT時代的2~3年的生命周期。
不確定性成為時代主題。生死都是一瞬間,就是這么VUCA。
商業本質從未改變:信息不對稱牟利的產品或服務,加上時代機遇,也可以稱為運氣。而在這個不確定的VUCA時代,機遇變成一個變幻莫測的東西。告別工業時代的“看十年做十年”的戰略思維,快速試錯和數據智能才是VUCA時代的王道。
這也恰恰是阿里中臺能力的價值,阿里的聚劃算業務只需要7個人花一個半月就能開發出來,飛豬、釘釘、盒馬等商業新物種頻繁涌現。很多阿里內部幾個人幾星期做的事情,放在外部企業中,至少要幾十人干半年。哪怕方向錯了,從頭再來,成本也要低很多。
企業能做的第二件事,就是形成數據的統一,挖掘智能的“石油”。
比如波司登連續兩年利潤猛増。這其中一大原因,就是利用中臺策略,實時監控全國3000多家門店的庫存和銷售情況,進而降低庫存壓力和物流成本,提升商品售罄率。
這一升一降間,對于一家銷售額數十億的企業而言,只要物流成本降10%,利潤很可能就會多出一兩個億。
一些咨詢機構則看得更長遠。比如埃森哲、畢馬威、德勤紛紛來找阿里云合作,就是希望可以幫助企業數字化轉型,并通過數據智能支撐商業決策。
阿里本身也是用機器做決策最多的公司,從阿里小貸,到手淘千人千面,如果沒有AI能力,幾百人肯定無法運營這個萬億規模平臺。
前谷歌云首席科學家李飛飛曾多次說過,云是人工智能落地的最好平臺。這也是40%的中國500強企業、近一半中國上市公司、80%中國科技類公司齊聚阿里云的重要原因。
結語
二十年前,在湖畔花園那間漏水的民宅里,這家企業的基因就決定了后來的故事。它的根須在中國經濟社會的根須之間。受難于此,也反哺于此。
早于社會十年,阿里遇到巨大困境。也由此筑起了巨大的壁壘,來自別人所未長的見識,和不能承受的痛苦。
變身阿里云智能之后,阿里的苦,要去解決社會的苦,將自己十年來在企業運營和商業實踐中總結的方法論和技術架構,打包成產品和商品,賦能整個經濟社會。
二十年前,阿里在報紙上發出半個版的招聘廣告,那句廣告詞如今已經成為它的企業文化,“If not now, When? If not me , Who?”(此時此刻,非我莫屬)。
疼痛本就是先行者的必然經歷。世界在質疑,而你走了過去。
-
阿里云
+關注
關注
3文章
1001瀏覽量
43804 -
電商
+關注
關注
1文章
468瀏覽量
29023 -
數字經濟
+關注
關注
2文章
1082瀏覽量
18642
原文標題:生于疼痛的阿里云
文章出處:【微信號:industry4_0club,微信公眾號:工業4俱樂部】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
數字化引擎再升級:小匠物聯十周年慶典與全鏈路創新實踐

阿里云是什么?企業不可不知的云端架構服務!
德賽電池自研云平臺 與時間賽跑的那朵“云”
阿里云代理有哪些?
初心不改,星辰大海丨航智7歲生日快樂


SPEA蘇州新廠房盛大開業暨十周年慶典圓滿舉行

評論