12月11日, 在北京國際飯店舉行的2018中國存儲與數(shù)據(jù)峰會(DATA & STORAGE SUMMIT 2018)上,新華三集團存儲產(chǎn)品部總經(jīng)理徐潤安以“閃存新紀元-- Memory-Driven的存儲新常態(tài)”為題發(fā)表主題演講。以下內(nèi)容根據(jù)速記整理,未經(jīng)本人審定。
新華三存儲產(chǎn)品部總經(jīng)理徐潤安
徐潤安:各位嘉賓大家下午好,感謝鄭總和大會給新華三一個機會來分享給大家我們對于下一個存儲紀元的理解。
大家記得這個圖嗎?一年前,也是在這個峰會上,我們就談到了關(guān)于這一副清明上河圖,一千多年前的生活常態(tài)在現(xiàn)在已經(jīng)發(fā)生了更多的改變,有好事者在網(wǎng)上P了一個新的清明上河圖。
歲歲年年花相似,年年歲歲人不同,存儲市場也是這個樣子,可能有客戶的需求從來就沒有變過,我們要的就是更快、更大、更可靠的存儲,而實際上真正承載這樣的一個技術(shù)的底層的技術(shù),都在不斷的發(fā)生變革和革新。
金光飛航是往返于港珠澳之間基本的交通工具,在之前我們往返于香港、澳門、珠海都要靠船,這個船很小,如果遇到大風(fēng)浪,我們都經(jīng)常會停航,船有時候也非常的顛簸,坐的非常不舒服,但是大家知道在今年,我們在港珠澳之間通行了港珠澳大橋,林總工程師設(shè)計了這樣一個港珠澳大橋,把整個港珠澳之間的通行變得非常的便利,兩岸的同胞們通行起來更加的便利,這成為了港珠澳三地群眾的新的生活常態(tài),一個大橋改變了所有的東西。當(dāng)然這個大橋也用到了非常多先進的技術(shù)。
傳統(tǒng)的機械盤到NANASSD、SCM,一直有一個像港珠澳的延時,非常大,用什么樣的技術(shù)可以抵消這部分的延時?那就是英特爾和我們給大家?guī)淼?DXpoint,我很自豪的和大家宣布,12月4日這款產(chǎn)品正式的商用,也就是大家可以在新華三的平臺上享受到SCM(Storage Class Memory)帶來的便利,這樣的技術(shù)真的彌補了延遲之間的差距。
首先SCM的技術(shù)基于兩點,一個是介質(zhì)的技術(shù),另一個是NVMe。
可以看到NVMe的v1.3最新的版本是17年發(fā)布的,未來所有基于SAS.SATA的協(xié)議都會被NVMe取代,這個趨勢是不可逆的,所以很多的平臺都是NVMe平臺實現(xiàn),另外NVMe的生態(tài)系統(tǒng)逐漸的完善,從操作系統(tǒng)、虛機等等。
我今天想強調(diào)的是NVMe的技術(shù)對SCM提供的更好的舞臺,正是因為有了NVMe,才可以讓其他的東西真正的發(fā)揮作用。它可以將SAS和SATA之間的瓶頸消除掉,帶來更強的并行處理和輸出的能力,從而改變現(xiàn)在的存儲市場和產(chǎn)品。
新華三是第一個采用SCM技術(shù)、利用NVMe來實現(xiàn)的一個廠商。
來看看NVMe的SCM給大家?guī)砹耸裁春锰帲繄D的最左側(cè),是傳統(tǒng)的介質(zhì),磁盤,延遲是10毫秒,所有的控制器和軟件延遲都比較高,第一步的變革,就是全閃存時代的到來,換成了SSD NAND的技術(shù),延遲一下子降到了0.1毫秒,我們可以看到在附加SAS控制器的延遲成本,可以看到NVMe的SSD也會帶來更進一步的延時的減少,一部分體現(xiàn)在介質(zhì)上,另外一部分體現(xiàn)在控制器和軟件上。SCM,將延時再下降了十倍,這個技術(shù)是革命性的,真正的橋接了CPU、MAND和SSD之間的延遲,所以新華三也是HPE在全球第一個推出了SCM解決的方案。
當(dāng)然,全閃接下來在市場的發(fā)展和系統(tǒng)健壯性方面還有很多的疑問,需要各個廠家和所有工作者共同努力,就是比如NVMe對于現(xiàn)有的架構(gòu)會有多大的影響,也是需要我們考慮的。
操作系統(tǒng)的支持,我們需要去考慮,以及社會的多路徑管理等等,所有的這些技術(shù)我相信在今后的一兩年之內(nèi)會逐漸的完善起來,然后去滿足客戶的需要。
客戶在選擇所有全閃存的時候,也可以對這些問題做適當(dāng)?shù)年P(guān)注,當(dāng)然也歡迎給到我們更多的輸入,告訴我們你們更喜歡什么樣的NVMe技術(shù),你們更喜歡什么樣的全閃。
簡單來看,大家最熟悉的NVMe和NANDSSD是很普遍的技術(shù),我們帶來的是NVMeon storageClassMemory,會有一個很大的性能改變。
這是我們自己的系統(tǒng)上做的延時的測試,可以看到整個的系統(tǒng)的平均延時下降了50%甚至更低,大家可以看到幾乎所有的I/O都會在0.3毫秒以內(nèi),95%,這是SCM帶來的真正的價值,不僅僅是峰值,而是所有的。
SCM下一步的發(fā)展會是什么樣的?我們的觀點是,在現(xiàn)有這個階段,SCM將會被用于數(shù)據(jù)閃存,存儲系統(tǒng)里面的閃存.
隨著SCM的技術(shù)逐漸的進一步的完善以及體系架構(gòu)的改變,原數(shù)據(jù)可以更多的存放在SCM上,當(dāng)SCM的成本降到足夠低的時候,SCM甚至可以將整個陣列的所有數(shù)據(jù)存放上去,屆時這就是下一個閃存紀元。
總結(jié)我們的方向,首先是SCM,讓Memory-Driven可以給大家?guī)砀嗟母斓难訒r,并行處理的協(xié)議包括NVMe,包括由此帶來的革新性的全閃存的系統(tǒng)。
談到Memory-Driven,大家也可以看一個例子, DZNE公司采用了我們Memory-Driven的技術(shù)以后整個的研究成本降低了60%,研究速度提升了一百倍,當(dāng)所有的運算不再依靠磁盤介質(zhì),而變成NAND介質(zhì)甚至是SCM介質(zhì)的時候,帶來的計算的速度會成倍的增加,從而帶來成本的進一步下降,這是給大家?guī)淼臉I(yè)務(wù)價值.
所以我們說,新的閃存紀元不僅僅是要求更多更大的IOPS,可能更快速的響應(yīng),更低的延時。
今天這個大會的主旨“DataIntelligence”,我們的存儲能不能“Intelligence”?給大家分享一個小例子。
前一段時間去美國的時候,我用了導(dǎo)航軟件,因為谷歌不可用,所以當(dāng)?shù)氐呐笥淹扑]了我用waze,這個工具非常好的一點,除了有我們現(xiàn)在百度高德所有的功能外,它提供的非常豐富的反饋功能,也就是作為用戶可以實時反饋你在路上看到的情況,大家知道當(dāng)一條道路顯示紅色的時候,往往是因為這里的平均車速比較低,但在美國很多的情況是因為有Parkingload有車停在路邊,也會導(dǎo)致平均速度降低,駕駛者可把信息提供到軟件上,我這里碰到了事故,整個系統(tǒng)學(xué)習(xí)了這些數(shù)據(jù)以后,會反饋給路過這條路上的所有駕駛員,這是一個擁有反饋機制的人工智能。
waze還有一個非常大的好處,因為到美國一個新的城市可能路不是很熟悉,waze就會做出推薦,他會問你出行的時間是什么,如果是中午,他會給你推薦最適合中午出行的路線,晚上會推薦你晚上出行的路線,告訴你這條路大概要花多長時間,它不僅僅是基于現(xiàn)在的數(shù)據(jù),它基于歷史的數(shù)據(jù)驅(qū)分析出來一個結(jié)果,反饋給有相同使用需求的人。
存儲可不可以?我的答案一定是可以的,我們帶來的系統(tǒng)就是這樣的,首先根據(jù)我們所有的歷史狀況,發(fā)現(xiàn)真正跟存儲相關(guān)的報錯錯誤,其實只有46%和本身存儲有關(guān),更多的是非存儲的原因,比如最佳實踐和資源沖突以及兼容性的問題,過去往往沒有人關(guān)注這一點。通過人工智能可以把這些問題全都分析出來。
我們InfoSight人工智能系統(tǒng)上線以后一定是一個閉環(huán),從洞察這些問題,到機器學(xué)習(xí),然后到預(yù)報,同時還可以做推薦,還有執(zhí)行,所有的整個一套系統(tǒng)我們是閉環(huán)進行的。這套系統(tǒng)上線以后,85%的問題被自動診斷并且解決,5000多個案子被成功避免,所以新華三的服務(wù)部門非常開心,工作量一下子減少了,當(dāng)然對于客戶而言,79%的日常IT維護的工作沒有了,可以投入更多精力在IT的創(chuàng)新,而不是復(fù)雜的運維。
現(xiàn)在我們已經(jīng)將InfoSight智能系統(tǒng)運行到了我們的平臺上運行到了所有HPE服務(wù)器上,也就是說整個的InfoSight系統(tǒng)已經(jīng)被IT基礎(chǔ)架構(gòu)平臺上使用,這是簡單使用以后的數(shù)據(jù)。
11倍的高效非常有趣,有一個客戶有多臺陣列,但是多臺陣列之間的負載是不均衡的,有些陣列用滿了,有些沒有,單用戶本身是不知道的,他也沒有明確的感知,也不知道是哪個應(yīng)用把哪臺陣列用滿了。上線InfoSight以后就給了他建議,某幾個應(yīng)用已經(jīng)遇到了瓶頸,某臺設(shè)備也遇到了瓶頸,應(yīng)該把一些應(yīng)用和虛機遷移到另一臺陣列上,所有的這些工作就可以幫助用戶正確的診斷出系統(tǒng)里真正的問題到底在哪里。
另外我們也是全球首創(chuàng)一個飽和度的分析結(jié)果,這種分析以前可能是不可想象得,可能我們要咨詢團隊入住用戶的現(xiàn)場待上幾個月觀察你所有的數(shù)據(jù),現(xiàn)在就是一份報告,通過我們的InfoSight系統(tǒng),綠線是OK,紅線就是有問題。
不僅僅是讓用戶發(fā)現(xiàn)問題,而且知道故障是什么原因?qū)е碌模约叭绾谓鉀Q。
另外,InfoSight還可以推薦結(jié)果,當(dāng)有客戶在一個環(huán)境里碰到了問題,并且最終找到了解決方案解決以后,整個解決方案會通過這一套智能系統(tǒng)推送到所有有類似環(huán)境的客戶里,告訴他們說有類似的潛在風(fēng)險,需要做一定的升級或采取一定的措施。
當(dāng)然也有這樣的情況,我最近也碰到一些客戶經(jīng)常會問我,現(xiàn)在陣列的分布的版本經(jīng)常有更新,那作為一個客戶我怎么知道現(xiàn)在是不是需要升級系統(tǒng)?InfoSight可以告訴你,這次版本的升級,升級了哪幾個補丁,主要為了修復(fù)哪些環(huán)境上的問題,再檢測環(huán)境里是不是有類似的潛在風(fēng)險,如果有就跟你說你需要升級,如果沒有就說不用。
所以你可以看到整個有一個反饋的積極正向的反饋機制給到用戶,告訴用戶你的系統(tǒng)應(yīng)該怎樣的調(diào)整。
大家看一下我們的性能分析和處理的大概的流程,包括異常的檢測,熱點發(fā)現(xiàn),壓力評估,社區(qū)學(xué)習(xí),存儲的負載的性能評估,壓力的預(yù)報,未來的性能走向都會通過InfoSight給到大家一個分析,這樣讓用戶的存儲更加的智能,不需要花太多的時間關(guān)心運維存儲本身,而可以去關(guān)注業(yè)務(wù)。
這個是InfoSight上線以后的情況,我們可以直接升級到L3,小于一分鐘的響應(yīng)時間,93%的案子會被自動處理,客戶滿意度大大的提升,所有的這些東西智能存儲,給我們和客戶帶來了更多的價值。
所以就像大會說的一樣,DataIntelligence,包括所有的功能帶給客戶,我相信我們準備好了,我們一樣把這個會帶給大家。
這里是我們整個新華三的存儲家族,都會被InfoSight覆蓋,變成一個智能的IT設(shè)備,我們一直在前行。
評論