在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Spark結構化流中的加水位線方法

汽車玩家 ? 來源:今日頭條 ? 作者:聞數起舞 ? 2020-05-03 17:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

對于流處理引擎來說,處理延遲到達的事件是至關重要的功能。 解決這個問題的方法是加水位線的概念。 從Spark 2.1開始,結構化流API就支持它。

什么是水位線?

加水位線是一種有用的方法,可幫助流處理引擎處理延遲。 基本上,水印是一個閾值,用于指定系統等待延遲事件的時間。 如果到達事件位于水位線之內,它將用于更新查詢。 否則,如果它早于水位線,它將被丟棄,并且流引擎不會對其進行進一步處理。

> Flooding watermarks

如何使用它?

自Spark 2.1起,水位線被引入到結構化流API中。 您可以通過將withWatermark-Operator添加到查詢中來啟用它:

withWatermark(eventTime:String,delayThreshold:String):數據集[T]

它需要兩個參數,a)一個事件時間列(必須與聚合正在處理的列相同)和b)一個閾值,用于指定應處理多長時間的延遲數據(以事件時間為單位)。 然后,Spark將維持聚合狀態,直到max eventTime — delayThreshold> T,其中max eventTime是引擎看到的最新事件時間,T是窗口的開始時間。 如果后期數據落入此閾值之內,則查詢將最終得到更新(下圖中的右圖)。 否則,它將被丟棄,并且不會觸發任何重新處理(下圖中的左圖)。

Spark結構化流中的加水位線方法

Spark結構化流中的加水位線方法

> Late donkey in structured word count: event dropped (left), event within watermark updates Window

值得一提的是,查詢的輸出模式必須設置為"追加"(默認)或"更新"。完全模式不能與設計中的水印結合使用,因為它需要所有 要保存的數據,用于將整個結果表輸出到接收器。

可以在這里找到如何在簡單的Spark結構化流應用程序中使用該概念的快速演示-它是字數統計(對NLP進行了一些小的增強),還有其他:D

但是,為什么我要關心?

在分布式和聯網的系統中,總會有中斷的機會-節點故障,傳感器丟失連接等等。 因此,不能保證數據將按創建順序到達流處理引擎。 為了容錯,因此有必要處理此類亂序數據。

為了解決此問題,必須保留聚合狀態。 如果發生延遲事件,則可以重新處理查詢。 但這意味著所有聚合的狀態必須無限期地保持,這也導致內存使用量也無限期地增長。 除非系統具有無限的資源(即無限的預算),否則在現實世界中這是不切實際的。 因此,加水位線是一個有用的概念,可以通過設計約束系統并防止其在運行時爆炸。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • API
    API
    +關注

    關注

    2

    文章

    1570

    瀏覽量

    63746
  • SPARK
    +關注

    關注

    1

    文章

    106

    瀏覽量

    20510
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    投入式水位計:助力水資源規劃與結構安全

    在水資源管理與巖土工程安全監測領域,水位數據的實時性和準確性直接影響決策的科學性與工程可靠性。投入式水位計作為一種高精度、耐用的監測工具,正成為水利工程、地下結構物安全評估及水資源規劃
    的頭像 發表于 06-19 13:17 ?159次閱讀
    投入式<b class='flag-5'>水位</b>計:助力水資源規劃與<b class='flag-5'>結構</b>安全

    DDN攜手NVIDIA釋放非結構化數據的AI價值

    DDN 通過與 NVIDIA AI 數據平臺的合作,推出聯合解決方案,簡化了企業對非結構化數據的存儲、訪問和激活方式,助力客戶釋放生成式 AI 的巨大商業潛能。DDN 全球合作伙伴負責人
    的頭像 發表于 06-10 10:31 ?309次閱讀

    雷達水位站:水位雨量監測一體設備

    在惡劣天氣頻發、水旱災害風險加劇的背景下,精準、高效的水文監測成為防汛抗旱、水資源管理的核心需求。雷達水位站通過集成非接觸式水位測量與高精度雨量監測功能,打造了一體智慧設備,實現“水位
    的頭像 發表于 06-09 14:38 ?167次閱讀

    從零到一:如何利用非結構化數據臺快速部署AI解決方案

    在企業數字轉型的浪潮,AI已從概念走向落地應用。然而,真正能高效、安全地部署AI解決方案的企業仍屬少數,瓶頸往往出在“數據”——尤其是非結構化數據的管理與應用上。文件、音頻、視頻、圖像、郵件
    的頭像 發表于 04-14 13:50 ?244次閱讀

    VirutualLab Fusion應用:結構光照明的顯微鏡系統

    摘要 與阿貝理論預測的分辨率相比,用于熒光樣品的結構照明顯微鏡系統可以將顯微鏡系統的分辨率提高2倍。 VirutualLab Fusion提供了一種通過入射波屬性來研究結構化照明模式的快速方法
    發表于 03-21 09:26

    結構化數據臺:企業AI應用安全落地的核心引擎

    在數字轉型浪潮,非結構化數據(如文檔、圖片、音視頻等)已成為企業核心資產,其價值挖掘能力直接影響AI應用的效能與安全性。然而,數據分散、多模態處理復雜、安全合規風險高等問題,嚴重制約了企業AI
    的頭像 發表于 02-27 17:06 ?470次閱讀

    ShiMetaOS | 怎樣免費調用人臉識別模塊以及視頻結構化分析軟件API

    ShiMetaOS內置視美泰自研人臉識別模塊及視頻結構化分析軟件API,可在設備端免費實現本地智能安防服務:涵蓋精準人臉檢測跟蹤、高速人臉搜索比對、活體及人證精準比對、人臉屬性精細識別,能實時預警
    的頭像 發表于 02-05 17:09 ?559次閱讀
    ShiMetaOS  | 怎樣免費調用人臉識別模塊以及視頻<b class='flag-5'>結構化</b>分析軟件API

    河道水位流量一體在線監測系統:快速響應水位變化,保障城市安全

    河道,是城市生態的重要脈絡,其水位流量的變化與城市安全息息相關。極端天氣增多,河道水情越發復雜,傳統監測方式難以及時準確掌握動態。河道水位流量一體在線監測系統應運而生,以快速響應水位
    的頭像 發表于 01-13 09:42 ?398次閱讀
    河道<b class='flag-5'>水位</b>流量一體<b class='flag-5'>化</b>在線監測系統:快速響應<b class='flag-5'>水位</b>變化,保障城市安全

    結構化布線在AI數據中心的關鍵作用

    AI 正在不斷顛覆各行各業,推動從電影制作到金融行業等各個領域的創新。而在 AI 系統的背后,隱藏著這樣一位無名英雄:結構化布線。
    的頭像 發表于 11-21 16:51 ?876次閱讀

    投入式水位計如何監測河湖水位

    在對河湖水位進行監測的眾多手段,投入式水位計發揮著重要作用。那么,投入式水位計究竟是如何實現對河湖水位的準確監測呢?下面是南京峟思工程儀器
    的頭像 發表于 11-18 16:42 ?491次閱讀
    投入式<b class='flag-5'>水位</b>計如何監測河湖<b class='flag-5'>水位</b>

    水位雨量監測設備生產廠家推薦,水位雨量在線監測系統介紹

    隨著全球氣候變化的加劇和城市進程的推進,水位雨量監測成為防洪減災、水資源管理以及生態環境保護不可或缺的一環。水位雨量在線監測系統作為現代
    的頭像 發表于 10-21 10:49 ?563次閱讀
    <b class='flag-5'>水位</b>雨量監測設備生產廠家推薦,<b class='flag-5'>水位</b>雨量在線監測系統介紹

    基于分布式對象存儲WDS的信托非結構化數據整合平臺

    基于分布式對象存儲WDS的信托非結構化數據整合平臺
    的頭像 發表于 08-28 09:56 ?629次閱讀
    基于分布式對象存儲WDS的信托非<b class='flag-5'>結構化</b>數據整合平臺

    雷達水位計(雷達液位計)在河道的應用

    雷達水位計是一種常用的水位監測設備,通過利用雷達波束測量水面與雷達傳感器之間的距離,從而實現對河道水位的準確監測。以下是雷達水位計在河道
    的頭像 發表于 08-13 09:56 ?792次閱讀
    雷達<b class='flag-5'>水位</b>計(雷達液位計)在河道<b class='flag-5'>中</b>的應用

    工業數據臺的功能和應用場景

    。 實時數據處理和批量數據處理。 2.數據存儲與管理: 提供分布式存儲解決方案,如Hadoop、HBase等。 數據湖和數據倉庫建設,支持結構化、半結構化和非結構化數據存儲。 3.數
    的頭像 發表于 07-04 16:18 ?754次閱讀

    spark運行的基本流程

    前言: 由于最近對spark的運行流程非常感興趣,所以閱讀了《Spark大數據處理:技術、應用與性能優化》一書。通過這本書的學習,了解了spark的核心技術、實際應用場景以及性能優化的方法
    的頭像 發表于 07-02 10:31 ?725次閱讀
    <b class='flag-5'>spark</b>運行的基本流程
    主站蜘蛛池模板: 夜夜夜夜夜夜夜猛噜噜噜噜噜噜 | 婷婷在线五月 | 久久精品国产乱子伦多人 | 俺也射 | 女bbwxxxx非洲黑人 | 四虎影院免费观看 | 一级特黄aa毛片免费观看 | 国产精品成人一区二区 | 4虎影视国产在线观看精品 4虎影院永久地址www | 黑粗硬大欧美视频 | 国产农村三片免费网站 | 日本理论在线 | 网站一级片 | 网友偷自拍原创区 | 在线天堂中文www官网 | 好黄好猛好爽好痛的视频 | 精品一区亚洲 | 国产又黄又爽又猛的免费视频播放 | 激情爱爱的免费视频 | 欧美色亚洲图 | 亚洲a毛片| 一本高清在线 | 国产高清一区二区 | 国产单男| 亚洲一区二区三区免费在线观看 | 爱操成人网 | 欧美特黄一免在线观看 | 亚洲精品久久片久久 | 国内色综合精品视频在线 | 香蕉久久夜色精品国产2020 | 丁香婷婷影院 | 狠狠色噜噜狠狠狠狠米奇7777 | aaa一级片| 女同性大尺度床戏视频 | 六月婷婷网 | 激情福利 | 中文字幕1区2区 | 色婷婷影院在线视频免费播放 | 在线观看深夜观看网站免费 | 在线啪 | 91国在线啪精品一区 |