91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

國際紙業:為機器學習魔獸饋送數據

倩倩 ? 來源:lq ? 作者:國際紙業流程信息 ? 2019-09-20 11:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

國際紙業公司擁有 55,000 名員工,年銷售額超過 210 億美元,是世界上最大的紙漿和造紙公司。大規模的生產也會帶來大規模的數據:該公司目前跟蹤著全球 37 家工廠,近 200 萬個活躍的數據點。國際紙業公司的 PI System會產生大量的數據,可以從這些生產數據中挖掘業務洞察力。通過使用 PI System工具深入研究如何收集和組織數據,工程師們能夠將數據處理時間縮短 80% 以上,從而使公司新推出的機器學習計劃能夠更快執行。

國際紙業訓練機器算法,作為其“未來之戰”現代化計劃的一部分

國際紙業公司的工程師致力于高效地處理他們正在使用和生成的海量數據?!拔覀兊墓こ處焸冃枰ㄙM他們 80% 到 90%的時間來檢索和清理數據,”國際紙業公司的化學工程師和流程信息經理Rick Smith 在 OSIsoft 的 PI World 2018 舊金山大會上這樣說?!拔覀冎Ц豆べY讓他們進行決策并改進我們的流程。我們需要以適當的頻率向工程師提供正確的數據,以便于他們工作。”

幾年前,公司在減少數據檢索時間方面做了一些努力。使用 PI OLEDB 工具后,工程師可以將 PI System 數據存檔視為關系數據庫。通過運行 SQL 查詢可以將提取出來的數據自動填充到 Microsoft Excel 電子表格中,而無需在 Excel 內運行耗時的計算。采用這種方法后,國際紙業能夠將審計中經常使用的數據檢索過程從 3-12小時縮短到 15-45 分鐘。

這是一個良好的開端,但后面還有更大的挑戰。2017 年,國際紙業發起了一個以數據和機器學習為核心的試點項目,作為其“未來之戰”現代化計劃的一部分。為了訓練機器算法,工程師需要同時在數千個標簽上提取幾年的歷史數據并將這些數據輸入機器學習引擎。

為了獲取數據檢索過程所需的時間值,Smith提出了一個他稱之為“年標簽”的時間單位:即從單個 PI 數據標簽中檢索一年的信息所需的時間。因為不同的標簽收集數據的間隔不同,所以各個標簽的“年標簽”值不盡相同,有些甚至差異極大。

Smith 有關檢索數據所需時間的初步估計發人深省。使用 10,000 個數據標簽一到三年的數據,數據采集間隔為一分鐘,會產生大約 160 億行數據,整個過程需要耗時數月。

“對于我們的數據標簽,如果所有標簽都是上面這種情形,那么讀取三年的數據,將需要100 到 200 天的時間來檢索數據。我不了解其他公司的情況,但我們的副總裁可不想等待200 天才開始這個項目,” Smith 說。

國際紙業創建了另外的數據標簽,每隔一分鐘而不是每隔 1-2 秒寫一次數據,從而簡化了大數據機器學習的數據提取過程。

優秀的數據管理員的價值

使用 PI System 工具,Smith 開始研究數據,探索如何能減少不必要的存儲與數據處理。他發現,在一家造紙廠,不到百分之一的數據標簽占據了存檔空間的近 37%。對于不同類型的分析,可能需要以不同的頻率采集數據。Smith 采用 Asset framework(PI Server 的一部分)為采集頻率密集的標簽同時設置了較低的采集頻率,以較長的間隔來收集相同的數據,在確保數據存檔豐富性的同時,實現更快的檢索速度。

對于某些數據標簽,密集的數據收集頻率對于存檔很重要,但并非所有分析都需要細粒度的數據。在對一組數據標簽進行分析時,Smith發現,與一秒鐘間隔的數據相比,一分鐘間隔的數據其數據讀取時間可以減少 85%。

對數據進行適當的管理和組織,也會使數據檢索時間在原來長度的基礎上大幅減少。在一項分析中,Smith 使用了 50 個數據標簽并在Asset framework 為它們構建了一個結構,這一舉措將讀取一年數據的時間從 15 分鐘以上縮短到 5 分鐘以內。通過使用數據平均值而不是工廠儀表上傳感器的原始值,將另一項分析的時間從 14 小時縮短到 40 秒。

仔細研究公司的數據如何生成、存儲和處理,這一工作平淡無奇,但它所產生的結果卻令人矚目。

“所有系統都需要管理者,”Smith 說?!懊總€人都想成為架構師。但我們更需要腳踏實地的數據管理員?!?/p>

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4711

    瀏覽量

    95446
  • 數據采集
    +關注

    關注

    40

    文章

    7196

    瀏覽量

    116558
  • 機器學習
    +關注

    關注

    66

    文章

    8505

    瀏覽量

    134677
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    FPGA在機器學習中的具體應用

    隨著機器學習和人工智能技術的迅猛發展,傳統的中央處理單元(CPU)和圖形處理單元(GPU)已經無法滿足高效處理大規模數據和復雜模型的需求。FPGA(現場可編程門陣列)作為一種靈活且高效的硬件加速平臺
    的頭像 發表于 07-16 15:34 ?621次閱讀

    **【技術干貨】Nordic nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合**

    【技術干貨】nRF54系列芯片:傳感器數據采集與AI機器學習的完美結合 近期收到不少伙伴咨詢nRF54系列芯片的應用與技術細節,今天我們整理幾個核心問題與解答,帶你快速掌握如何在nRF54上部署AI
    發表于 04-01 00:00

    機器學習模型市場前景如何

    當今,隨著算法的不斷優化、數據量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發廣闊。下面,AI部落小編將探討機器學習模型市場
    的頭像 發表于 02-13 09:39 ?368次閱讀

    傳統機器學習方法和應用指導

    用于開發生物學數據機器學習方法。盡管深度學習(一般指神經網絡算法)是一個強大的工具,目前也非常流行,但它的應用領域仍然有限。與深度學習相比
    的頭像 發表于 12-30 09:16 ?1198次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    如何選擇云原生機器學習平臺

    當今,云原生機器學習平臺因其彈性擴展、高效部署、低成本運營等優勢,逐漸成為企業構建和部署機器學習應用的首選。然而,市場上的云原生機器
    的頭像 發表于 12-25 11:54 ?461次閱讀

    cmp在機器學習中的作用 如何使用cmp進行數據對比

    機器學習領域,"cmp"這個術語可能并不是一個常見的術語,它可能是指"比較"(comparison)的縮寫。 比較在機器學習中的作用 模型評估 :比較不同模型的性能是
    的頭像 發表于 12-17 09:35 ?889次閱讀

    ??低晹y手太陽紙業共推造紙行業數字化轉型

    近日,海康威視高級副總裁徐習明帶隊赴山東濟寧太陽紙業,與太陽紙業管理團隊探討交流未來合作方向。后續,雙方將基于造紙行業生產、運營環節中的實際需求,探索場景落地數字化應用,共同推動造紙行業數字化轉型。
    的頭像 發表于 11-19 11:12 ?722次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    計算機系統自身的性能”。事實上,由于“經驗”在計算機系統中主要以數據的形式存在,因此機器學習需要設法對數據進行分析學習,這就使得它逐漸成為智
    的頭像 發表于 11-16 01:07 ?970次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門深度學習
    的頭像 發表于 11-15 09:19 ?1240次閱讀

    eda在機器學習中的應用

    機器學習項目中,數據預處理和理解是成功構建模型的關鍵。探索性數據分析(EDA)是這一過程中不可或缺的一部分。 1. 數據清洗
    的頭像 發表于 11-13 10:42 ?916次閱讀

    人工智能、機器學習和深度學習存在什么區別

    人工智能指的是在某種程度上顯示出類似人類智能的設備。AI有很多技術,但其中一個很大的子集是機器學習——讓算法從數據學習。
    發表于 10-24 17:22 ?2999次閱讀
    人工智能、<b class='flag-5'>機器</b><b class='flag-5'>學習</b>和深度<b class='flag-5'>學習</b>存在什么區別

    【「時間序列與機器學習」閱讀體驗】時間序列的信息提取

    方法該時間序列填充缺失值。 時間序列的縮放是指對原有的時間序列數據進行數據范圍的調整,以便更好地完成后續的數據分析或機器
    發表于 08-17 21:12

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的分析和預測任務,可以
    發表于 08-14 18:00

    【「時間序列與機器學習」閱讀體驗】+ 簡單建議

    這本書以其系統性的框架和深入淺出的講解,讀者繪制了一幅時間序列分析與機器學習融合應用的宏偉藍圖。作者不僅扎實地構建了時間序列分析的基礎知識,更巧妙地展示了機器
    發表于 08-12 11:21

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    收到《時間序列與機器學習》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發燒友提供了一個讓我學習時間序列及應用的機會! 前言第一段描述了編寫背景: 由此可知,這是一本關于時間序列進行大
    發表于 08-11 17:55
    主站蜘蛛池模板: 2022年永久免费观看 | 五月综合色 | 嘿嘿嘿视频在线观看网站 | 99久久99久久精品免费看子伦 | 一级看片免费视频 | 黄色午夜网站 | 色福利在线 | 性无码专区无码 | 毛片网站免费在线观看 | 看a网站| 免费观看四虎精品成人 | 欧美无遮挡国产欧美另类 | 天堂w| 亚洲天堂电影在线观看 | 久久99国产精品免费观看 | 一级特黄高清完整大片 | 亚洲福利视频网址 | 成年午夜一级毛片视频 | 国产色秀视频 | 九九免费久久这里有精品23 | 午夜精品在线观看 | 在线黄视频 | 大片免费看 | 成人夜夜嗨 | 日韩午夜在线视频不卡片 | 免看一级a一片成人123 | 天天综合久久久网 | 国产乱码1卡一卡二卡 | www.xxx日本人| 91大神在线精品视频一区 | 欧美zo | 永久福利盒子日韩日韩免费看 | 国产综合第一页在线视频 | 日本黄色大全 | 韩国三级无遮挡床戏视频 | 国产三级视频 | 亚洲成年 | 欧美亚洲综合另类成人 | 色婷婷视频在线 | 欧美a视频| 毛色毛片免费观看 |