在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

揭秘湖倉一體:大數(shù)據(jù)演進(jìn)的未來趨勢與影響

OSC開源社區(qū) ? 來源:OSC開源社區(qū) ? 2024-01-29 14:17 ? 次閱讀

隨著信息時(shí)代的興起,數(shù)據(jù)已成為推動(dòng)業(yè)務(wù)決策和創(chuàng)新的核心要素;結(jié)構(gòu)化、半結(jié)構(gòu)化等多種類型的數(shù)據(jù)呈現(xiàn)爆炸式增長,如何高效處理和分析海量數(shù)據(jù)已經(jīng)成為關(guān)鍵挑戰(zhàn)。

當(dāng)前業(yè)界構(gòu)建數(shù)據(jù)分析的技術(shù)棧,有兩條典型的路線,一個(gè)是數(shù)倉路線,一個(gè)是數(shù)據(jù)湖的路線。 數(shù)據(jù)倉庫的路線,數(shù)據(jù)先通過 ETL 統(tǒng)一寫入到數(shù)倉進(jìn)行管理,然后構(gòu)建數(shù)據(jù)集市來滿足 BI 分析的各種需求;優(yōu)勢是數(shù)據(jù)質(zhì)量高、查詢性能高、具備實(shí)時(shí)分析的能力、數(shù)據(jù)治理功能完善等。 而數(shù)據(jù)湖的路線,通常是未經(jīng)加工的數(shù)據(jù)先統(tǒng)一存儲(chǔ)在數(shù)據(jù)湖,作為企業(yè)數(shù)據(jù)的 single sourth of truth,然后按需的使用數(shù)據(jù),構(gòu)建數(shù)據(jù)應(yīng)用;優(yōu)勢是通開放生態(tài)、擴(kuò)展性強(qiáng),性價(jià)比高。 數(shù)據(jù)倉庫

d8fe6670-b524-11ee-8b88-92fbcf53809c.png

數(shù)據(jù)倉庫是一種將來自不同源的數(shù)據(jù)聚合到單個(gè)集中式一致數(shù)據(jù)存儲(chǔ)中的系統(tǒng),以支持企業(yè)報(bào)表、數(shù)據(jù)分析、數(shù)據(jù)挖掘、人工智能機(jī)器學(xué)習(xí)等應(yīng)用。數(shù)據(jù)倉庫技術(shù)經(jīng)過幾十年的發(fā)展,產(chǎn)品架構(gòu)已經(jīng)經(jīng)過了多輪的迭代:

1.早期分析場景比較簡單,業(yè)務(wù)采用 Oracle/MySQL 為代表的關(guān)系型數(shù)據(jù)庫,在線處理與數(shù)據(jù)分析在一套系統(tǒng)里完成;但隨著數(shù)據(jù)分析場景的越來越復(fù)雜多樣化,這種方案的挑戰(zhàn)非常大,一是兩種負(fù)載會(huì)相互影響,同時(shí)數(shù)據(jù)分析的性能也不能滿足需求。

2.以 Teradata 、Oracle EDW 為代表的商用數(shù)據(jù)倉庫應(yīng)運(yùn)而生,專門針對(duì)大規(guī)模數(shù)據(jù)的管理與價(jià)值挖掘,這類數(shù)倉產(chǎn)品功能強(qiáng)大,但其商業(yè)成本太高,導(dǎo)致技術(shù)無法普及使用。

3.以 Hadoop( Hive) 為代表的開源數(shù)倉,基于開源組件構(gòu)建大數(shù)據(jù)平臺(tái);Hadoop 生態(tài)讓大數(shù)據(jù)變成普惠技術(shù),企業(yè)能夠低成本的基于開源 Hadoop 生態(tài),構(gòu)建企業(yè)級(jí)數(shù)倉平臺(tái)。

4.Hadoop 生態(tài)使用門檻低,但因?yàn)榻M件繁多,維護(hù)代價(jià)非常高,隨著新技術(shù)的發(fā)展,Hadoop 生態(tài)各組件的技術(shù)競爭力也在持續(xù)下降,以 Snowflake、Redshift、Bigquery 為代表云原生數(shù)倉,幫助企業(yè)構(gòu)建一體化的數(shù)據(jù)處理與分析平臺(tái)。 數(shù)據(jù)湖

d912f11c-b524-11ee-8b88-92fbcf53809c.png

數(shù)據(jù)湖是以原始格式存儲(chǔ)數(shù)據(jù)的存儲(chǔ)庫或系統(tǒng),它按原樣存儲(chǔ)數(shù)據(jù),無需事先對(duì)數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理。

?數(shù)據(jù)湖通常采用 S3 對(duì)象存儲(chǔ)或 HDFS 分布式文件系統(tǒng)作為底層統(tǒng)一存儲(chǔ),并作為 Single source of truth。 ?數(shù)據(jù)湖通常采用開放的數(shù)據(jù)格式,同時(shí)滿足結(jié)構(gòu)化、半結(jié)構(gòu)化等數(shù)據(jù)等存儲(chǔ)需求,并 ACID、Upsert、Time travle 等高級(jí)特性,滿足企業(yè)數(shù)據(jù)管理方面的各種訴求。 ?業(yè)界常見的數(shù)據(jù)湖包括 Apache Iceberg、Apache Hudi、Delta、Apache Paimon 等,業(yè)務(wù)采用 Trino、Presto、Impala 等引擎按需分析數(shù)據(jù)湖上的數(shù)據(jù)。 企業(yè)未來數(shù)據(jù)架構(gòu)應(yīng)該是建倉,還是建湖? 其實(shí),大家之所以有現(xiàn)在的糾結(jié),是因?yàn)閿?shù)據(jù)倉庫和數(shù)據(jù)湖各有優(yōu)劣,如果能將優(yōu)勢兼具,IT 架構(gòu)工程師們也不必一定要選擇是湖還是倉。

目前在業(yè)界,很多企業(yè)正在不斷探索湖倉融合的路徑。 ?湖上建倉:企業(yè)的數(shù)據(jù)先進(jìn)入到數(shù)據(jù)湖統(tǒng)一存儲(chǔ),湖上直接性能不足,此時(shí)可以采用湖上建倉的方案,將查詢性能要求高的部分通過 ETL 導(dǎo)入到新的數(shù)據(jù)倉庫提供服務(wù)。 ?倉外掛湖:部分?jǐn)?shù)據(jù)倉庫產(chǎn)品,例如 Redshift、Bigquery 等,開始擴(kuò)展查詢外部數(shù)據(jù)湖(Hive、Iceberg 等)的能力,實(shí)現(xiàn)計(jì)算層的統(tǒng)一。 不管是湖上建倉、還是倉外掛湖的方案,本質(zhì)上數(shù)據(jù)都是分開存儲(chǔ),可能還會(huì)通過不同的引擎服務(wù)不同場景的查詢,更好的方案是實(shí)現(xiàn)湖倉一體化,讓數(shù)據(jù)分析的架構(gòu)更加簡單。那到底什么是湖倉一體?

湖倉一體 當(dāng)互聯(lián)網(wǎng)規(guī)模發(fā)展至一定程度后,企業(yè)數(shù)據(jù)的使用場景發(fā)生巨大變化,需求開始從離線轉(zhuǎn)而要求實(shí)時(shí)的數(shù)據(jù)分析,同時(shí)隨著企業(yè)數(shù)據(jù)規(guī)模極速增長,企業(yè)對(duì)于實(shí)時(shí)數(shù)據(jù)治理提出更高的要求,要求業(yè)務(wù)端數(shù)據(jù)能夠?qū)崟r(shí)處理,進(jìn)一步滿足基于數(shù)據(jù)的實(shí)時(shí)分析和決策。 湖倉一體是通過一套架構(gòu),滿足所有的分析需求,抽象化的描述,要能實(shí)現(xiàn) One Data、All Analytics 的業(yè)務(wù)價(jià)值。

1.統(tǒng)一數(shù)據(jù)存儲(chǔ):在湖倉一體架構(gòu)下,數(shù)據(jù)要統(tǒng)一存儲(chǔ)管理,一份數(shù)據(jù)作為 Single source of truth,避免導(dǎo)來導(dǎo)去,造成數(shù)據(jù)冗余,分析口徑不一致等問題;存儲(chǔ)層通常采用 S3/HDFS 作為數(shù)據(jù)存儲(chǔ)底層,并采用開放數(shù)據(jù)湖或者私有的數(shù)據(jù)格式去管理數(shù)據(jù)。

2.極速查詢引擎:基于統(tǒng)一的數(shù)據(jù)存儲(chǔ),湖倉一體架構(gòu)要能滿足所有的業(yè)務(wù)分析場景的訴求,包括 BI 報(bào)表、交互式分析、實(shí)時(shí)分析、ETL 數(shù)據(jù)加工等場景,這就要求必須要有一個(gè)足夠強(qiáng)大的分析引擎,能同時(shí)滿足這些場景的查詢需求。

3.按需查詢加速:對(duì)于部分業(yè)務(wù)場景特別復(fù)雜的查詢,數(shù)據(jù)源數(shù)據(jù)組織未針對(duì)分析優(yōu)化,直接分析不一定能滿足查詢延時(shí)的需求,湖倉一體架構(gòu)要具備通用的數(shù)據(jù)查詢加速的能力,并且不破壞 Single source of truth 的原則。

d923b04c-b524-11ee-8b88-92fbcf53809c.png

目前, StarRocks 3.x 推出了存算分離、湖倉分析、物化視圖等重量級(jí)特性,能夠很好的幫助企業(yè)構(gòu)建湖倉一體平臺(tái),微信、攜程、小紅書等數(shù)十家大型企業(yè)進(jìn)行實(shí)踐后,收獲極大的簡化數(shù)據(jù)平臺(tái)的技術(shù)棧,同時(shí)提升的服務(wù)性能。

d93b5a62-b524-11ee-8b88-92fbcf53809c.png

那么,如何構(gòu)建湖倉一體平臺(tái)? 用戶可以將 StarRocks 當(dāng)作一站式湖倉,數(shù)據(jù)統(tǒng)一導(dǎo)入到 StarRocks ,借助存算分離的架構(gòu),實(shí)現(xiàn)低成本的數(shù)據(jù)存儲(chǔ),然后利用 StarRocks 查詢引擎來服務(wù)全場景的數(shù)據(jù)分析應(yīng)用; 如果用戶的數(shù)據(jù)已經(jīng)在開放數(shù)據(jù)湖(Hive、Hudi、Iceberg、Paimon),就可以通過 StarRocks 直接分析數(shù)據(jù)湖,同樣能獲得極高的查詢性能。 不管數(shù)據(jù)統(tǒng)一存儲(chǔ)在開放數(shù)據(jù)湖里還是 StarRocks 里,當(dāng)查詢性能不足時(shí),都可以利用物化視圖加速查詢性能。

基于此,用戶可以方便地構(gòu)建湖倉一體平臺(tái),實(shí)現(xiàn) One Data、All Analytics 的業(yè)務(wù)價(jià)值。 當(dāng)然,對(duì)于有數(shù)據(jù)的安全、權(quán)限管理需要的企業(yè),可以選擇基于 StarRocks 開發(fā)的企業(yè)級(jí)產(chǎn)品鏡舟湖倉分析引擎。 鏡舟湖倉分析引擎能夠兼容并加速企業(yè)已有的大數(shù)據(jù)架構(gòu)如Hive、Iceberg、Hudi、Deltalake、MySQL 和 Oracle 等,有效幫助企業(yè)節(jié)省傳統(tǒng)架構(gòu)中數(shù)據(jù)搬運(yùn)的時(shí)間與成本, 通過簡化數(shù)據(jù)鏈路,實(shí)現(xiàn)數(shù)據(jù)分析性能指數(shù)級(jí)提升。同時(shí),鏡舟湖倉分析引擎部署簡單、運(yùn)維便捷,在為企業(yè)提速的同時(shí)降低系統(tǒng)及人力成本。 企業(yè)可以通過鏡舟湖倉分析引擎,支撐不同團(tuán)隊(duì)和角色的數(shù)據(jù)使用訴求,在報(bào)表查詢、用戶畫像與行為分析、自助指標(biāo)分析、實(shí)時(shí)風(fēng)控等業(yè)務(wù)場景實(shí)現(xiàn)加速,給業(yè)務(wù)團(tuán)隊(duì)帶來極速查詢、分析體驗(yàn),快速響應(yīng)市場變化,為解決企業(yè)數(shù)據(jù)治理需求和數(shù)據(jù)集成提供更優(yōu)解。

審核編輯:黃飛

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)存儲(chǔ)

    關(guān)注

    5

    文章

    997

    瀏覽量

    51642
  • MySQL
    +關(guān)注

    關(guān)注

    1

    文章

    849

    瀏覽量

    27656
  • 數(shù)據(jù)倉庫
    +關(guān)注

    關(guān)注

    0

    文章

    62

    瀏覽量

    10670
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8953

    瀏覽量

    139668

原文標(biāo)題:大數(shù)據(jù)演進(jìn)觀察:到底什么是湖倉一體?

文章出處:【微信號(hào):OSC開源社區(qū),微信公眾號(hào):OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    21.5寸觸摸一體機(jī):便捷互動(dòng)的新窗口

    一體機(jī)
    朗銳智科
    發(fā)布于 :2025年04月10日 15:34:00

    智慧園區(qū)一體化管理平臺(tái)的功能應(yīng)用

    在信息化、智能化高速發(fā)展的時(shí)代,智慧園區(qū)作為城市發(fā)展的新型單元,正逐步成為推動(dòng)產(chǎn)業(yè)升級(jí)、提升城市管理效能的關(guān)鍵力量。智慧園區(qū)一體化管理平臺(tái),作為這趨勢下的核心支撐,不僅整合了園區(qū)內(nèi)各類資源,通過
    的頭像 發(fā)表于 11-23 17:21 ?523次閱讀

    YC-3615充磁測磁一體機(jī)運(yùn)行流程#永磁#充磁

    一體機(jī)
    jf_97022714
    發(fā)布于 :2024年11月19日 08:53:51

    OBOO鷗柏丨LCD全戶外高亮廣告屏一體機(jī)信息發(fā)布系統(tǒng)

    一體機(jī)
    鷗柏科技
    發(fā)布于 :2024年11月11日 17:15:41

    思道SEEKVIEU一體機(jī)電腦

    一體機(jī)
    jf_69621499
    發(fā)布于 :2024年09月03日 08:50:17

    一體成型功率電感漏感原因大揭秘

    一體成型功率電感漏感原因大揭秘gujing 編輯:谷景電子 一體成型功率電感也就是我們常說的棒型電感,它在電子電路中扮演者非常重要的角色。在一體成型功率電感的實(shí)際應(yīng)用中,有時(shí)候可能會(huì)出
    的頭像 發(fā)表于 08-19 21:45 ?598次閱讀

    谷景揭秘一體成型電感外殼破了有影響嗎

    谷景揭秘一體成型電感外殼破了有影響嗎 編輯:谷景電子 一體成型電感作為電子電路中非常重要的種電子元器件,它對(duì)于維護(hù)整個(gè)電路的穩(wěn)定運(yùn)行有著非常重要的作用。在
    的頭像 發(fā)表于 08-14 20:45 ?619次閱讀

    一體成型電感感值低的原因

    12、谷景揭秘一體成型電感感值低的
    發(fā)表于 07-30 10:41 ?0次下載

    什么是一體成型電感?一體成型電感概述

    什么是一體成型電感?一體成型電感概述
    的頭像 發(fā)表于 07-20 13:56 ?1140次閱讀
    什么是<b class='flag-5'>一體</b>成型電感?<b class='flag-5'>一體</b>成型電感概述

    揭秘一體成型電感和功率電感的區(qū)別

    一體成型電感和功率電感都是近年來比較大火的電感產(chǎn)品,很多人分不清楚一體成型電感和功率電感,本篇我們就來簡單探討下它們的區(qū)別,方便大家了解和認(rèn)識(shí)這兩種電感。 、什么是
    的頭像 發(fā)表于 07-08 10:58 ?1125次閱讀

    啟揚(yáng)多尺寸安卓屏一體機(jī),助力水肥一體機(jī)實(shí)現(xiàn)智能化農(nóng)田管理

    隨著科技的飛速發(fā)展,農(nóng)業(yè)現(xiàn)代化已然成為趨勢。在農(nóng)業(yè)領(lǐng)域,水肥一體機(jī)通過引入傳感器、物聯(lián)網(wǎng)、大數(shù)據(jù)等信息技術(shù),精準(zhǔn)控制水肥配比與投放,為作物提供精準(zhǔn)的水肥管理方案,提高作物產(chǎn)量,改善農(nóng)產(chǎn)品品質(zhì),降低
    的頭像 發(fā)表于 07-06 08:00 ?672次閱讀
    啟揚(yáng)多尺寸安卓屏<b class='flag-5'>一體</b>機(jī),助力水肥<b class='flag-5'>一體</b>機(jī)實(shí)現(xiàn)智能化農(nóng)田管理
    主站蜘蛛池模板: 欧美潘金莲一级风流片a级 欧美片欧美日韩国产综合片 | 岛国午夜| 免费啪视频在线观看 | bt天堂在线最新版在线 | 国产嫩草影院精品免费网址 | 一区二区三区四区国产精品 | 丝袜美女被 | 综合婷婷| 丁香九月婷婷 | 三级网站在线免费观看 | 一级毛片视屏 | 日韩免费观看一级毛片看看 | 婷婷六月久久综合丁香一二 | 欧美黑人性色黄在线视频 | 亚洲欧美成人在线 | 国产午夜小视频 | 亚欧成人中文字幕一区 | 噜噜噜噜影院 | 天天摸日日舔 | 国产精品久久久久乳精品爆 | 大量国产后进翘臀视频 | 免费看欧美一级特黄a大片一 | 午夜毛片在线观看 | 一夜七次郎久久综合伊人 | 国产精品视频你懂的 | 日本黄视频在线播放 | 性欧美大战久久久久久久 | 国产叼嘿视频网站在线观看 | 免费看欧美一级特黄a大片 免费看欧美一级特黄a大片一 | 九色视频在线播放 | 你懂的视频在线观看资源 | 久久国产精品岛国搬运工 | 天天干天天干天天天天天天爽 | 欧美日韩精品乱国产 | 国产裸体美女视频全黄 | 亚洲日本免费 | 最新免费jlzzjlzz在线播放 | 一区在线观看 | 很黄很暴力 很污秽的小说 很黄很黄叫声床戏免费视频 | 国产免费久久 | 日本人xxxxxxxxxⅹ68 |