2022云棲大會上,阿里巴巴宣布自研CPU倚天710已大規模應用。
編解碼場景實現80%的性價比提升,數據庫場景、AI推理場景、大數據場景也都分別有著30%、70%、50%的性價比有效提升。
天貓雙 11 核心交易系統平滑遷移至倚天 710 云實例,算力性價比提升30%;匯量科技廣告推理業務使用倚天 710 云實例,性能和網絡帶寬雙雙提升,性價比提升 40%以上。
今天就來說說,這些蹭蹭蹭的性價比提升,阿里云ECS倚天實例是怎么實現的呢?
?
第一個秘密武器是平頭哥自研的倚天芯片本身。
倚天710芯片采用無超線程的設計,讓計算性能更高。
無超線程設計,是不是有點懵?我們先來了解一下計算機的“大腦”CPU芯片平時是怎么工作的。CPU里面有兩個比較重要的分工:
?
計算,主要CPU核里面的執行單元負責,數量越多往往算得越快,主頻則是影響計算速度,越高算得越快;
?
緩存,則是暫時存數據的歇腳點,比如說你要算A+B=?,就需要先把A和B暫時存著,等到算的時候才用上。
后來,技術人員發現,大部分情況,一個應用都用不完一整個物理核,導致CPU有很大一分部分是“閑置”的。
于是,就有廠商設計了超線程概念,也就是把一份物理核變成2個vCPU(虛擬CPU),就可以“同時”運行兩個應用進程。傳統架構的CPU就是這樣。
這兩個vCPU,因為是在共用一個物理核和緩存,就會導致來自不同vCPU的計算指令要排隊被“計算”,同樣的緩存里面等待的時候也是一樣的。
這樣導致的壞處是,因為相互爭搶和影響,所以vCPU性能波動較為嚴重,單個進程也因為要排隊,計算速度變慢。
無超線程的設計意味著ECS倚天實例采用的是獨享物理核心方式,這可以讓算力密集的計算指令不必排隊、不必爭搶,計算速度更快。
?
倚天芯片的ARM架構與生產工藝讓功耗更小,運算速度更快、更穩定。
倚天處理器采用的是ARM架構,采用更精簡的指令集,本來功耗就比傳統架構低,加上先進制程工藝,倚天710的功耗是主流架構的1/6,優勢十分明顯。
一般來說芯片制程越小,功耗越小,性能越高。
生產制程指的是芯片表面晶體管的尺寸,寬度越小電流通過時的損耗越小,功耗越小;更小尺寸也意味著在同等面積中可以塞入更多的晶體管,而作為運算芯片的基本組成部分,更多的晶體管數量顯然能夠提供更好的性能。
加更多的晶體管,要怎么加也是很有學問的。一般來說架構越新性能越高、能力也更豐富。倚天芯片采用的是最新的ARM v9架構,比之前提供了更多執行單元,也增加安全性、機器學習等新能力。
除了算得快,倚天還功耗低,意味著成本低。功耗大不僅意味著成本,可能還會影響計算性能的平穩。傳統CPU架構功耗大,導致計算負載過重時溫度上升,為了避免高溫造成的功能失效,會主動降低主頻,進而影響了性能。倚天就沒有任何降頻問題。
?
倚天云服務器性價比高的第二個秘密武器,就是阿里云的數據中心處理器,CIPU。
CIPU開創了不同的硬件架構,讓服務器以CIPU為中心。
CIPU連接2顆或者更多倚天的芯片,讓多個芯片共享一臺服務器,這樣降低了成本,使得倚天實例更有競爭力。
同時,各個倚天芯片在各自主板上,一旦某個零件出問題,不會影響同一個機器上的另一張芯片,會讓產品更為穩定。這樣的設計叫多單路的硬件機型設計。
雙路設計,單個CPU損壞將波及同一主板的CPU
依靠CIPU實現雙單路設計,低成本+高可用
最后,CIPU將虛擬化與IO轉發等數據面卸載到專用硬件上進行加速,消除了原來虛擬化損耗與性能爭搶,并大幅加速了IO,也會使得整體性能更高;VPC環境下支持彈性RDMA加速能力,相比TCP時延降低70%以上。
-
cpu
+關注
關注
68文章
10904瀏覽量
213026 -
緩存
+關注
關注
1文章
241瀏覽量
26758 -
阿里巴巴
+關注
關注
7文章
1619瀏覽量
47524 -
云棲大會
+關注
關注
0文章
33瀏覽量
8681 -
平頭哥
+關注
關注
0文章
65瀏覽量
9135
原文標題:小漫畫帶你看懂倚天云實例
文章出處:【微信號:gh_65bdec3412bd,微信公眾號:平頭哥半導體】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論