在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

50億海量數據如何高效存儲和分析? 華為云數據庫GaussDB (for Cassandra) 3個秘訣搞定

IT科技蘇辭 ? 來源:IT科技蘇辭 ? 作者:IT科技蘇辭 ? 2022-12-01 21:36 ? 次閱讀

50億海量數據如何高效存儲和分析?

華為云數據庫GaussDB (for Cassandra) 3個秘訣搞定

當下,信息社會正在從互聯網時代走向物聯網時代,信息交互變得更加龐雜、高效和智能。對于互聯網公司IOT企業來說,既是機遇,也是挑戰。因為,企業不可避免的要面對數據量劇增帶來的一系列問題:如何高效存儲和擴容,如何在對原有業務改動最小的情況下做到智能化和實時分析。

針對挑戰,華為云GaussDB (for Cassandra)為客戶提供了強擴展、高存儲、高效導入/導出和實時分析等一系列能力,并成功服務了眾多互聯網公司和IOT企業,獲得了客戶的高度認可和支持。本文將以其中一個客戶業務的痛點問題舉例,聊聊高效存儲和實時分析的3個秘訣。

海量存儲,PB級無感擴展

該用戶在線下本地化部署使用數據庫或者使用其他的存儲為云盤的數據庫時,常常需要在容量達到閾值時,提前規劃和申購存儲資源,可能還需要連帶擴容不必要的計算資源。而使用GaussDB (for Cassandra)之后,便再無此煩惱。GaussDB (for Cassandra)采用存算分離架構,可單獨擴展存儲,高效擴容,業務無感,最高可擴展到PB級。

此外,客戶為了做大數據分析,將數據庫中的數據再寫入一份到HDFS中,供MapReduce和Spark分析,同時需要維護兩套資源,維護和資源成本成為了痛點。而客戶使用GaussDB (for Cassandra)之后,可以僅采用GaussDB (for Cassandra)即可完成數據庫存儲和對接大數據分析的功能,同時GaussDB (for Cassandra)提供了更為易用的CQL接口,讓用戶更加專注功能開發,而不是資源管理。

數據變更捕獲和實時分析

客戶的一個使用場景需要將爬蟲或用戶輸入的數據,進行在線分析和實時推薦業務,該業務中全量數據達到了50億條,但增量數據不足5億,分析對象主要是每日新增數據。在這個場景中,GaussDB (for Cassandra)為客戶提供了streaming服務+實時分析解決方案,在損失小部分讀寫性能的前提下,客戶端無需改造即可做到數據讀寫和實時分析并行,解決方案如下圖,該解決方案主要有以下幾個階段:

1.客戶業務用過開源驅動寫入數據到GaussDB (for Cassandra)

2.GaussDB (for Cassandra)對外提供streaming接口,該接口可獲取數據變更捕獲

3.客戶構建的流服務組件讀取streaming接口數據寫入到指定的Kafka隊列

4.Kafka隊列將streaming數據寫入到Spark或者Flink中

5.客戶在Spark中可對增量數據做分析,也可合并之后做全量分析

pYYBAGOIraiAcczoAAKXPqDFmpM013.png

全量數據導出分析

客戶的另一個業務需要周期性對全量數據進行分析和處理,但不想影響在線業務,希望在閑時處理。GaussDB (for Cassandra)提供了全量數據導出和分析解決方案,可在業務低峰期觸發任務進行數據導出和冷數據分析,數據導出速率是開源的10+倍,同時做到對業務讀寫基本無影響。如下為互聯網客戶每周定期導出數據分析用戶畫像的解決方案,該方案有以下幾個階段:

1.客戶根據需求配置ECS規格,并掛載obsfs并行文件系統

2.客戶在DLF上配置導出作業,包括ECS信息,導出參數和定時任務

3.CDM下發作業任務

4.ECS上的導出任務將GaussDB (for Cassandra)中的指定表指定條件的數據導出到obsfs

5.Spark從obsfs中讀取全量數據進行數據分析

pYYBAGOIrbCABT61AATHjGVJFJs439.png

通過這3個秘訣,華為云GaussDB (for Cassandra)完美解決了難擴展、高成本、變更不及時等問題,實現了海量數據的高效存儲和實時分析,為互聯網公司和IOT企業的數字化發展提供了更多可能。

審核編輯黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 華為云
    +關注

    關注

    3

    文章

    2691

    瀏覽量

    17590
收藏 人收藏

    評論

    相關推薦

    分布式數據庫有哪些類型

    分布式數據庫有哪些類型?分布式數據庫主要類型包括:關系型分布式數據庫、非關系型分布式數據庫
    的頭像 發表于 01-15 09:43 ?111次閱讀

    構建數據庫解決方案,基于華為 Flexus X 實例容器化 MySQL 主從同步架構

    前言**** 華為 Flexus X 實例,融合柔性算力與智能調度,為數據庫解決方案帶來全新突破。采用容器化 MySQL 主從同步架構,實現數據
    的頭像 發表于 01-07 17:22 ?200次閱讀
    構建<b class='flag-5'>數據庫</b>解決方案,基于<b class='flag-5'>華為</b><b class='flag-5'>云</b> Flexus X 實例容器化 MySQL 主從同步架構

    數據庫是哪種數據庫類型?

    數據庫是一種部署在虛擬計算環境中的數據庫,它融合了計算的彈性和可擴展性,為用戶提供高效、靈活的數據庫
    的頭像 發表于 01-07 10:22 ?143次閱讀

    使用華為 X 實例部署圖數據庫 Virtuoso 并存儲 6500 萬條大數據的完整過程與性能測評

    前言 ? 1. 部署Virtuoso圖數據庫的準備工作 ? 1.1 選擇華為X實例的原因 ? 1.2 Virtuoso圖數據庫簡介 ? 1.3 環境準備與系統配置 ? 2. Virt
    的頭像 發表于 12-25 17:51 ?294次閱讀
    使用<b class='flag-5'>華為</b><b class='flag-5'>云</b> X 實例部署圖<b class='flag-5'>數據庫</b> Virtuoso 并<b class='flag-5'>存儲</b> 6500 萬條大<b class='flag-5'>數據</b>的完整過程與性能測評

    數據庫主機哪個好一點?

    數據庫主機哪個好一點?主機和數據庫各有優勢,選擇哪個更好取決于具體需求。
    的頭像 發表于 12-04 13:50 ?176次閱讀

    數據庫數據恢復—通過拼接數據庫碎片恢復SQLserver數據庫

    運行在存儲上的SQLServer數據庫,有1000多個文件,大小幾十TB。數據庫每10天生成一NDF文件,每個NDF幾百GB大小。
    的頭像 發表于 10-31 13:21 ?338次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—通過拼接<b class='flag-5'>數據庫</b>碎片恢復SQLserver<b class='flag-5'>數據庫</b>

    數據庫可以租用嗎?完整租用流程來了

    數據庫是可以租用的,這是一種合法且便捷的數據存儲和管理方式。數據庫
    的頭像 發表于 10-28 09:54 ?214次閱讀

    恒訊科技分析數據庫rds和redis區別是什么如何選擇?

    數據庫RDS(Relational Database Service)和Redis是兩種不同類型的數據庫服務,它們有各自的特點和適用場景: 1、數據模型:RDS是一種關系型
    的頭像 發表于 08-19 15:31 ?469次閱讀

    基于分布式存儲WDS的金融信創承載數據庫類關鍵應用

    基于分布式存儲WDS的金融信創承載數據庫類關鍵應用
    的頭像 發表于 08-16 09:42 ?327次閱讀
    基于分布式<b class='flag-5'>存儲</b>WDS的金融信創<b class='flag-5'>云</b>承載<b class='flag-5'>數據庫</b>類關鍵應用

    數據庫數據恢復—raid5陣列上層Sql Server數據庫數據恢復案例

    數據庫數據恢復環境: 5塊硬盤組建一組RAID5陣列,劃分LUN供windows系統服務器使用。windows系統服務器內運行了Sql Server數據庫,存儲空間在操作系統層面劃分
    的頭像 發表于 05-08 11:43 ?580次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—raid5陣列上層Sql Server<b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復案例

    華為GaussDB數據庫基礎版發布:旗艦性能、價格下降超60%

    高性價比:相比企業版,華為 GaussDB 基礎版價格大幅下調(降幅達 60%-70%),且支持全場景數據壓縮,具有“超高壓縮比”,性能影響僅為 5%-10%,
    的頭像 發表于 05-07 14:21 ?698次閱讀

    時序數據庫是什么?時序數據庫的特點

    時序數據庫是一種在處理時間序列數據方面具有高效和專門化能力的數據庫。它主要用于存儲和處理時間序列數據
    的頭像 發表于 04-26 16:02 ?707次閱讀

    華為多模數據庫 GeminiDB 架構與應用實踐直播問答實錄

    多模數據庫作為一種新興的數據管理解決方案,正在受到越來越多的關注。而華為多模數據庫 GeminiDB 基于云原生
    的頭像 發表于 04-08 18:25 ?1209次閱讀

    華為云原生多模數據庫 GeminiDB 架構與應用實踐

    近日,2023 全球分布式大會·深圳站順利召開,華為 NoSQL 數據庫研發總監余汶龍在會上發表了題為《華為云原生多模
    的頭像 發表于 04-08 18:23 ?1227次閱讀
    <b class='flag-5'>華為</b>云原生多模<b class='flag-5'>數據庫</b> GeminiDB 架構與應用實踐

    選擇 KV 數據庫最重要的是什么?

    經常有客戶提到 KV 數據庫,但卻偏偏“不要 Redis”。比如有做安全威脅分析平臺的客戶,他們明確表示自己對可靠性要求非常高,需要的不是開源 Redis 這種內存緩存,而是 KV
    的頭像 發表于 03-28 22:11 ?746次閱讀
    選擇 KV <b class='flag-5'>數據庫</b>最重要的是什么?
    主站蜘蛛池模板: aaa网站| 色5566| 天天摸日日 | 亚洲综合色dddd26 | 免费人成在线观看视频色 | 推倒都市极品贵妇 | 国产成人永久免费视频 | 美女午夜 | 欧美午夜色视频国产精品 | 高清视频免费 | 三级在线观看 | 一区二区视屏 | 日本一本在线视频 | 色批网站| 天天曰夜夜曰 | 亚洲精品视频专区 | www深夜视频在线观看高清 | 亚州第一视频 | 456影院第一| 特级一级毛片 | 糖心vlog麻豆精东影业传媒 | 一级午夜免费视频 | 国产美女一级片 | 日韩一级生活片 | 欧洲亚洲国产精华液 | 日韩欧美卡一卡二卡新区 | 不卡一区二区在线观看 | 国产精品久久久久久久久福利 | aaaa视频| 亚洲欧洲第一页 | 真人午夜a一级毛片 | 欧美怡红院免费全部视频 | 欧美一级日韩一级亚洲一级 | 性欧美video视频另类 | 国产男人午夜视频在线观看 | 手机在线看片你懂的 | 国产在线播放你懂的 | 拍拍拍无挡视频免费全程1000 | 日本色视 | 亚洲国产婷婷香蕉久久久久久 | 韩国三级在线不卡播放 |