在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

非結構化數據存儲的六大挑戰(zhàn)及解決方法

IBM中國 ? 來源:IBM中國 ? 作者:王伯韜 ? 2022-06-10 09:51 ? 次閱讀

專家介紹:王伯韜

24年IT行業(yè)經驗。1998年加入國際商業(yè)機器(中國)有限公司,先后在中國技術支持中心、系統(tǒng)和科技事業(yè)部、企業(yè)IT架構師團隊、IBM中國系統(tǒng)中心等部門工作。獲得IBM高級認證系統(tǒng)架構師(Senior Certified IT Architect),參與過國內多家電信企業(yè)、大型公共服務機構的IT系統(tǒng)架構設計項目。目前擔任IBM中國科技事業(yè)部存儲團隊架構師。

真實經歷引發(fā)的思考

2022年5月2日下午12:05 我收到了以下流調短信與電話:

[北京市疾控中心提示]您好!根據市衛(wèi)健委通報的新冠疫情,經流行病學調查,您與感染者存在時空交集,有感染風險。請您及時向所在社區(qū)和單位報告....

此時,發(fā)現北京健康寶已彈窗,隨后接到流調工作人員電話。

流調員:“請問您4月30日下午2點是否去過朝陽區(qū)xx商場,xx餐館”

我:“稍等我看一下……,當時沒有去過您提到的幾個地點,但是去過幾個街區(qū)之外的xx吃飯,不過有可能開車經過了您提到的地方”

流調員:“好的,那您去所在社區(qū)居委會報備,說明情況,持24小時核酸并簽署承諾書,然后可以解除彈窗。”

疫情期間當我們的身邊發(fā)現確診病例,大家都希望看到這些人的行動軌跡,如果發(fā)生了時空關聯,就會收到上面的信息和電話。目前,疫情防控已經變成了我們生活的一部分。大家都希望通過精準科學的方式找到疫情防控和正常生活的平衡點,但又談何容易。我們可以從數據流向推測和分析事件的成因。然而極致的“精準”,需要數據量足夠多,包括手機位置信息,流調人員的排查信息,現場流調信息等等。同時,數據量暴漲也是需要面對的問題。

其實,近年來各個行業(yè)的數據量都呈幾何級增長。如今,隨著傳統(tǒng)業(yè)務轉型,新時代業(yè)務云計算、大數據分析、人工智能等新一代應用的出現,非結構化數據并行文件存儲給各行各業(yè)帶來了諸多挑戰(zhàn)。

一家人工智能芯片的企業(yè)于2017年流片量產了中國首款邊緣AI芯片,2019年量產了中國首款車規(guī)級AI芯片,憑借30億美金估值成為全球估值最高的AI芯片獨角獸企業(yè)。然而,隨著企業(yè)逐漸從初創(chuàng)企業(yè)走向成熟,其在數據存儲、管理和調度等方面遇到了一些難題。

其中一個比較突出的問題是數據豎井。在發(fā)展初期,往往以項目方式組織資源和部署數據結構,很多項目各有數據集群,形成了一個個數據豎井,或說數據孤島。對于需要“小步快跑”的初創(chuàng)企業(yè)而言,這種方式無可厚非,但隨著企業(yè)規(guī)模擴大,這些相互獨立的數據豎井就會給數據管理帶來比較大的挑戰(zhàn)。

從更大的層面看,他們也面臨跨多云數據調度的難題。對于AI企業(yè)而言,提高模型訓練效率是至關重要的,但訓練效率的提高不僅僅依賴于計算資源,也離不開數據的及時調度。由于GPU資源分布在多個公有云上和本地,當GPU資源不斷變化時,如何讓數據也能快速地跟隨變化隨需調度,也成為企業(yè)在數據管理方面的一個核心需求。

此外,隨著數據規(guī)模的快速增長,數據管理成本也與日俱增。之前是采用算存一體的方式,計算和存儲在一個一體機上實現,隨著數據規(guī)模增長,這種方案不僅會降低計算設備運行效率,而且成本也會高企不下,因此需要性價比更高的數據存儲方案來支持企業(yè)的長遠發(fā)展。

在醫(yī)療行業(yè),信息化起步較早,在長期的發(fā)展過程中,各業(yè)務系統(tǒng)都針對初始單個業(yè)務模塊的需求陸續(xù)建設了很多“煙囪工程“。此外,醫(yī)療行業(yè)對數據合規(guī)要求有其特殊性,門診電子病歷往往需要保留15年以上。數據量的增長使得存儲成本難以控制,同時管理、擴展和維護數據在線訪問的復雜性大大提高。新一代工作負載,面臨數據存儲、數據集成、數據可訪問性、應用程序數據集成等問題,無法實現現代化應用程序;環(huán)境數據分散,存儲在太多不同的地理位置,沒有數據集成,沒有通用的管理能力,數據孤島使得數據查詢和使用異常困難。這就需要一個企業(yè)級的、真正的全球共享數據湖基礎架構,更快交付洞察,底層存儲必須同時支持新時代的大數據和傳統(tǒng)的應用,具備安全性、可靠性和高性能。

數據管理之六大挑戰(zhàn)

為了應對云計算、大數據分析、人工智能等新一代應用,我們的企業(yè)往往在非結構化數據存儲中遇到諸多挑戰(zhàn):

挑戰(zhàn)1:當前架構無法應對海量數據增長,無序擴展,存在嚴重的性能瓶頸。傳統(tǒng)的SAN文件系統(tǒng)和NAS文件系統(tǒng),受限于其單個控制器的性能和元數據的處理方式,無法提供更高性能的IO訪問,NAS文件系統(tǒng)擴展方式是按照SAN或者NAS的控制器擴展,控制器之間不能實現并行IO操作,無法避免單機頭帶來的性能瓶頸,并因為文件目錄的名稱改變而導致應用重新定義。

挑戰(zhàn)2:數據孤島。企業(yè)超過50%的數據存放在離散的存儲系統(tǒng)中,企業(yè)環(huán)境的數據分散,存儲在太多不同的地理位置,數據孤島使得數據查詢和使用異常困難。數據量的增長使得存儲成本難以控制,同時管理、擴展和維護數據在線訪問的復雜性大大提高。

挑戰(zhàn)3:缺乏企業(yè)級的統(tǒng)一數據管理平臺。傳統(tǒng)的SAN文件系統(tǒng)和NAS文件系統(tǒng)本身不具備智能的、基于策略自動執(zhí)行的生命周期管理,需要借助單獨的軟件或者硬件實現數據的分層和備份,導致數據管理困難。

挑戰(zhàn)4:無法為未來前沿技術提供有效存儲支撐。如云計算的數據需求并行存儲能夠支持多云架構,統(tǒng)一資源管理,數據安全和高可用。人工智能需求海量數據集存儲,大算力。大數據分析業(yè)務需求高效分析和高可用。

挑戰(zhàn)5:新技術帶來的潛在的基礎架構“割裂”,沒有全局的統(tǒng)一命名空間,難以實現數據共享和安全共享。

挑戰(zhàn)6:無可靠的高可用、完整性。不能統(tǒng)一管理和部署,提升運維復雜度。不能支持存儲異構,不同NAS機頭無法統(tǒng)一存儲空間。故障數據重構開銷大,對性能影響較大。

高性能ESS給出最優(yōu)解

為了應對以上挑戰(zhàn),IBM最新發(fā)布了基于 Spectrum Scale 的ESS3500,它包括以下特點:

1. 極致的性能和可擴展性:可以從小規(guī)模開始構建,然后逐步擴展性能和容量,無任何瓶頸,能夠提供極致的數據、元數據和閃存可擴展性。無瓶頸的架構提高了性能,從而實現極大的吞吐量和低延遲訪問。IBM ESS 3500在每個單一節(jié)點上提供1PBe,吞吐量高達91GB/秒。

2. 統(tǒng)一存儲,適用于集群、HDFS、文件、對象與容器環(huán)境。

3. 加速AI訓練:配合 NVIDIA DGX 系統(tǒng),AI訓練時間縮短 140%。

4. 統(tǒng)一命名空間。實現全球協(xié)作:Spectrum Scale 通過主動文件管理分布式磁盤高速緩存技術,跨不同存儲和位置隨時隨地訪問數據,在數據中心或全球范圍內實現應用加速。

5. 數據完整性和安全性:認證、加密、安全和復制選項,用于滿足業(yè)務和法規(guī)需求。

最后,我想說的是……

各行各業(yè)的數字化難題不斷涌現,IBM伴隨很多客戶,一步步突破最新的AI和云計算的性能極限,成就了他們的創(chuàng)新和發(fā)展。疫情防控也一樣,不僅需要技術的支撐,也需要各方的共同努力、每個人的積極配合,希望世界早日恢復生機蓬勃。

原文標題:我們期望的 “精準”,談何容易

文章出處:【微信公眾號:IBM中國】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • IBM
    IBM
    +關注

    關注

    3

    文章

    1768

    瀏覽量

    74870
  • 數據管理
    +關注

    關注

    1

    文章

    300

    瀏覽量

    19684
  • 數據存儲
    +關注

    關注

    5

    文章

    984

    瀏覽量

    51077

原文標題:我們期望的 “精準”,談何容易

文章出處:【微信號:IBMGCG,微信公眾號:IBM中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    彈性云服務器通過什么存儲數據和文件?

    彈性云服務器通過多種存儲方式存儲數據和文件,包括云硬盤、對象存儲服務、分布式文件系統(tǒng)和數據庫服務。云硬盤提供高性能的塊
    的頭像 發(fā)表于 01-13 09:50 ?118次閱讀

    IBM Storage -?支持AI應用場景的數據存儲軟硬件解決方案

    為了解決數據和工作負載在各地分散的現狀,需要實現對存儲在分布式文件和對象存儲系統(tǒng)中的大量結構化數據
    的頭像 發(fā)表于 12-30 15:00 ?187次閱讀
    IBM Storage -?支持AI應用場景的<b class='flag-5'>數據</b><b class='flag-5'>存儲</b>軟硬件解決方案

    戴爾數據湖倉助力企業(yè)數字轉型

    在數字轉型的浪潮下,企業(yè)正面臨著前所未有的數據挑戰(zhàn)。從傳統(tǒng)的結構化數據到如今的
    的頭像 發(fā)表于 12-20 09:31 ?172次閱讀

    AIGC與傳統(tǒng)內容生成的區(qū)別 AIGC的優(yōu)勢和挑戰(zhàn)

    、AIGC與傳統(tǒng)內容生成的區(qū)別 數據類型與處理 : AIGC主要面向結構化數據的生成,如自然語言文本、圖像、音頻、視頻等。這類數據規(guī)模更大
    的頭像 發(fā)表于 11-22 16:04 ?450次閱讀

    結構化布線在AI數據中心的關鍵作用

    AI 正在不斷顛覆各行各業(yè),推動從電影制作到金融行業(yè)等各個領域的創(chuàng)新。而在 AI 系統(tǒng)的背后,隱藏著這樣一位無名英雄:結構化布線。
    的頭像 發(fā)表于 11-21 16:51 ?466次閱讀

    戴爾升級結構化存儲數據管理,AI創(chuàng)新引領新變革

    在快速演進的人工智能(AI)與數據驅動的時代,企業(yè)唯有不斷追逐技術創(chuàng)新的浪潮,方能搶占先機,引領行業(yè)前行。戴爾科技,作為AI就緒型數據平臺的領航者,近期對其Dell PowerScale及數據管理產品組合進行了全面升級,旨在通過
    的頭像 發(fā)表于 10-29 16:52 ?634次閱讀

    基于分布式對象存儲WDS的信托結構化數據整合平臺

    基于分布式對象存儲WDS的信托結構化數據整合平臺
    的頭像 發(fā)表于 08-28 09:56 ?414次閱讀
    基于分布式對象<b class='flag-5'>存儲</b>WDS的信托<b class='flag-5'>非</b><b class='flag-5'>結構化</b><b class='flag-5'>數據</b>整合平臺

    定期維護結構化布線對于辦公室得重要性

    最大限度地減少網絡停機時間,確保最佳性能,并延長基礎設施的使用壽命。忽視維護可能會導致連接問題、數據傳輸速度變慢,甚至整個系統(tǒng)故障。 投入時間和資源進行結構化布線維護是一種積極主動的方法,從長遠來看,可以節(jié)省
    的頭像 發(fā)表于 06-14 10:44 ?287次閱讀

    電路板檢查故障的六大方法有哪些

    在這篇文章中,我們將詳細介紹檢查電路板故障的六大方法。這些方法將幫助大家更有效地診斷和修復電路板問題。以下是電路板檢查故障的六大方法: 視覺檢查 測量電壓和電流 電阻測試 電容測試 信號追蹤
    的頭像 發(fā)表于 05-29 14:54 ?7249次閱讀

    態(tài)勢數據存儲方式有哪些

    數據庫通過定義數據表、字段、數據類型以及表之間的關系,確保數據的完整性、一致性和安全性。這種存儲方式在需要頻繁查詢和更新
    的頭像 發(fā)表于 04-22 19:28 ?383次閱讀

    什么是結構化網絡布線?結構化網絡布線有哪些好處?

    在電纜領域,結構化網絡布線這個術語經常被提及。人們將其用作流行語,但它的真正含義是什么?結構化布線到底是什么? 為了了解真正的含義,讓我們看它的一些相關定義。 根據光纖協(xié)會的說法,結構化布線是由
    的頭像 發(fā)表于 04-11 11:54 ?594次閱讀

    結構化布線的好處多嗎

    結構化布線是網絡系統(tǒng)中的重要組成部分,因為它為數據傳輸提供了強大、可擴展且可靠的基礎。通過遵守全球公認的標準,結構化布線可促進高速連接、簡化故障排除并確保未來的可擴展性。考慮到這些優(yōu)勢,企業(yè)應優(yōu)先
    的頭像 發(fā)表于 04-07 11:15 ?496次閱讀

    什么是網絡系統(tǒng)中的結構化布線?

    結構化布線在網絡系統(tǒng)中發(fā)揮著至關重要的作用,為組織內的無縫通信和數據傳輸提供了堅實的基礎。這種綜合基礎設施旨在支持廣泛的應用程序和技術。本文將深入探討它是什么、為什么它很重要以及它為組織提供的好處
    的頭像 發(fā)表于 04-07 10:58 ?479次閱讀

    華為數據存儲伙伴賦能六大亮點解讀

    精彩回顧 | 華為數據存儲伙伴賦能六大亮點解讀
    的頭像 發(fā)表于 03-28 11:33 ?607次閱讀
    華為<b class='flag-5'>數據</b><b class='flag-5'>存儲</b>伙伴賦能<b class='flag-5'>六大</b>亮點解讀

    華為推出數據湖解決方案及全閃存存儲新品

    此次發(fā)布的新品包括OceanStor Dorado 2100,這是業(yè)界首款面向結構化數據設計的A-A架構入門級全閃存NAS,還有對應升級的SAN存儲OceanStor Dorado
    的頭像 發(fā)表于 02-20 14:18 ?595次閱讀
    主站蜘蛛池模板: 91伊人网| 欧美色惰aⅴ | 色婷婷精品综合久久狠狠 | 色视频在线观看 | 午夜视频在线观看一区二区 | 狠狠色噜噜狠狠狠狠97老肥女 | 日韩精品亚洲一级在线观看 | 亚洲综合精品成人啪啪 | 久久久久久国产精品免费 | 天天操天天爱天天干 | 午夜寂寞影院视频观看 | 色在线视频播放 | 人人草人人爱 | 福利片在线播放 | 特级片毛片 | 555成人免费影院 | 张柏芝三级无删减在线观看 | 国产一区二区在线不卡 | 九九热在线视频观看 | 日本亚洲成人 | 666精品国产精品亚洲 | 波多野结衣三个女人蕾丝边 | 天天干天天操天天摸 | 5060精品国产福利午夜 | 婷婷国产成人久久精品激情 | 成人精品视频一区二区三区 | 男人j桶进女人免费视频 | 日韩免费高清一级毛片在线 | 亚洲激情婷婷 | 99久久精品免费看国产免费 | 天堂电影免费在线观看 | 国产亚洲综合视频 | 一区二区在线免费视频 | 欧美午夜视频一区二区三区 | 国产一区二区三区在线观看视频 | 精品一区 二区三区免费毛片 | 性免费视频 | 欧美极品另类 | 农村苗族一级特黄a大片 | 亚洲另类电击调教在线观看 | 欧美综合成人网 |