在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

RAPIDS cuDF將pandas提速近150倍

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2024-11-20 09:52 ? 次閱讀

在 NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當前已能夠為 950 萬 pandas 用戶帶來 GPU 加速,且無需修改代碼。

目前,NVIDIA 再次對這一應用進行了更新:現在無需在 Google Colab 中修改代碼,即可直接使用 RAPIDS cuDF 為 pandas 提供加速。現在即可嘗試在 Colab notebook 中使用這一教程

pandas 是一個靈活且強大的 Python 數據分析和處理程序庫,因其是易于使用的 API,已成為數據科學家的首選。但隨著數據集規模的擴大,其在僅使用 CPU 的系統中的處理速度和效率方面遇到了挑戰。

RAPIDS 是一套開源的 GPU 加速 Python 程序庫,旨在改進數據科學和分析工作流。RAPIDS cuDF 是一個 GPU DataFrame 程序庫,其提供了一個類似 pandas 的 API,用于加載、過濾和操作數據。cuDF 的早期版本只適用于 GPU 開發工作流程。

去年秋季,RAPIDS 發布了 cuDF 版本。該版本通過開放測試版中統一的 CPU/GPU 用戶體驗,在不修改代碼的情況下將加速計算引入到 pandas 工作流中。在 GTC 2024 上,NVIDIA 宣布在新發布的 RAPIDS v24.02 中正式推出 cuDF 加速 pandas 功能。NVIDIA AI Enterprise 5.0 將在晚些時候支持這一功能。

兩個相同的 pandas 工作流在 Jupyter notebook 中并列運行。其中一個使用了僅搭載 CPU 的 pandas,另一個則加載了 cudf.pandas 擴展,以便可以使用 RAPIDS cuDF 加速 pandas。

將統一的 CPU/GPU 體驗

引入 pandas 工作流

cuDF 一直使用類似于 pandas 的 API 為用戶提供卓越的 DataFrame 程序庫性能。但使用 cuDF 有時需要采取變通方法:

對 cuDF 中尚未實現或支持的任何 pandas 功能采取變通方法。

在必須在異構硬件上運行的代碼庫中,為執行 CPU 和 GPU 設計單獨的代碼路徑。

在與其他 PyData 程序庫或專為 pandas 設計的、特定于組織的工具進行交互時,需要手動切換 cuDF 和 pandas。

在 24.02 版本中,除了提供現有的僅 GPU 使用體驗外,cuDF 還能在無需更改代碼的情況下加速 pandas,以應對這些挑戰。

該功能專為數據科學家而設計,旨在即使數據規模增長到千兆字節、性能降低時仍然可以繼續使用 pandas。當 cuDF 加速 pandas 時,在可能的情況下操作將在 GPU 上運行,否則將在(使用 pandas 的)CPU 上運行。這實現了統一的 CPU/GPU 體驗,為用戶自己的 pandas 工作流帶來了領先的性能。

隨著 GA 版本的發布,cuDF 可提供以下功能:

無需更改代碼的加速:只需加載 cuDF Jupyter Notebook 擴展或使用cuDF Python 模塊選項。

兼容第三方程序庫:pandas 加速器模式與大多數在 pandas 對象上運行的第三方程序庫兼容,甚至可以加速這些庫中的 pandas 操作。

統一的 CPU/GPU 工作流:使用單一代碼路徑進行開發、測試和生產運行,不受硬件限制。

如要將 GPU 加速功能引入 Jupyter notebook 中的 pandas 工作流,請加載 cudf.pandas 擴展:

%load_ext cudf.pandas
import pandas as pd

如要在運行 Python 腳本時訪問,請使用 cudf.pandas 模塊選項:

python -m cudf.pandas script.py

為 pandas 工作流帶來頂尖的性能

當數據規模達到千兆字節時,pandas 往往會因為性能較慢而變得在使用過程中面臨較多挑戰,導致一些數據科學家不得不放棄他們喜愛的 pandas API。有了新的 RAPIDS cuDF,就可以繼續將 pandas 作為主要工具使用并獲得頂尖的性能。

用戶可以通過運行流行的 DuckDB Database-like Ops Benchmark 中的 pandas 部分來了解這一點,該基準測試最初由 H2o.ai 開發。DuckDB 的基準測試方式是將一系列常見分析任務,例如將數據連接在一起或計算每組的統計量作為基準,來比較基于 CPU 的流行 DataFrame 和 SQL 引擎的性能。

在數據量為 5 GB 的情況下,pandas 的性能大幅下降,變得非常慢,僅僅執行一系列連接和高級分組操作就需要數分鐘時間。

以往使用 cuDF 代替 pandas 運行此基準測試時,需要更改代碼并解決功能缺失的問題?,F在,借助 cuDF 的全新 pandas 加速模式,這個問題迎刃而解。用戶可以在不改變pandas基準代碼的情況下運行該基準測試,而且速度將大幅提升。其中的大部分操作由 GPU 執行,小部分操作由 CPU 執行,保證了工作流的順利操作。

這樣操作所取得的結果非常出色。cuDF 的統一 CPU/GPU 體驗無需更改代碼,即可將處理時間從原本幾分鐘縮短至 1 到 2 秒(圖 1)。

7ae65380-a016-11ef-93f3-92fbcf53809c.png

圖 1.cuDF.pandas 與傳統 pandas v2.2 在標準 DuckDB 數據基準測試(5 GB)中的性能比較

硬件:NVIDIA Grace Hopper;CPU:英特爾 Xeon Platinum 8480C|軟件:pandas v2.2、RAPIDS cuDF 23.10

結語

pandas 是 Python 生態系統中最流行的 DataFrame 程序庫,但它的速度會隨著 CPU 上數據量的增加而變慢。

現在只需一條命令,用戶就可以在無需更改代碼的情況下,使用 cuDF 將加速計算引入到其 pandas 工作流中。根據數據集大小為 5 GB 的分析基準測試結果,處理時間縮短到原來的 150 分之一。

您可參考詳細的教程在 Google Colab 上的免費 GPU 環境中試用 cuDF 的 pandas 加速功能。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11051

    瀏覽量

    216176
  • NVIDIA
    +關注

    關注

    14

    文章

    5267

    瀏覽量

    105874
  • 代碼
    +關注

    關注

    30

    文章

    4891

    瀏覽量

    70317

原文標題:無需更改代碼,RAPIDS cuDF 將 pandas 提速近 150 倍

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    Python利用pandas讀寫Excel文件

    使用pandas模塊讀取Excel文件可以更為方便和快捷。pandas可以Excel文件讀取為一個DataFrame對象,方便進行數據處理和分析。
    的頭像 發表于 12-16 11:22 ?1905次閱讀
    Python利用<b class='flag-5'>pandas</b>讀寫Excel文件

    Sapphire Rapids與OpenVINO?工具套件是否兼容?

    無法確定 Sapphire Rapids 與 OpenVINO? 工具套件的兼容性
    發表于 03-05 06:55

    pandas是什么?

    系列文章目錄提示:寫完文章后,目錄可以自動生成,如何生成可參考右邊的幫助文檔文章目錄系列文章目錄前言一、pandas是什么?二、使用步驟1.引入庫2.讀入數據總結前言提示:這里可以添加本文要記錄
    發表于 07-14 07:48

    pandas是什么

    提示:文章寫完后,目錄可以自動生成,如何生成可參考右邊的幫助文檔文章目錄前言一、pandas是什么?二、使用步驟1.引入庫2.讀入數據總結前言提示:這里可以添加本文要記錄的大概內容:例如:隨著
    發表于 08-09 07:39

    pandas使用步驟

    提示:文章寫完后,目錄可以自動生成,如何生成可參考右邊的幫助文檔文章目錄前言一、pandas是什么?二、使用步驟1.引入庫2.讀入數據總結學習內容:學習時間:學習產出:前言一、pandas是什么?二
    發表于 08-10 07:50

    pandas是什么?

    文章目錄前言一、pandas是什么?二、使用步驟1.引入庫2.讀入數據總結前言一、pandas是什么?二、使用步驟1.引入庫代碼如下(示例):import numpy as npimport
    發表于 01-11 07:53

    pandas是什么?

    提示:文章寫完后,目錄可以自動生成,如何生成可參考右邊的幫助文檔文章目錄前言一、pandas是什么?二、使用步驟1.引入庫2.讀入數據總結前言提示:這里可以添加本文要記錄的大概內容:例如:隨著
    發表于 01-12 07:53

    pandas怎么使用

    文檔文章目錄系列文章目錄前言一、pandas是什么?二、使用步驟1.引入庫 2.讀入數據 總結前言本例子主要進行PMS150G PWM輸出測試提示:以下是本篇文章正文內容,下面案例可供參考一、TM2PWM計數器產生PWM波形并通過引腳輸出T
    發表于 01-18 09:07

    如何使用RAPIDS和CuPy時加速Gauss 秩變換

    展示如何使用 RAPIDS cuDF 和 Chainer CuPy 實現 GPU 加速的 Gauss 秩變換,并使用 pandas 和 NumPy 替換來實現 100 倍加速 。
    的頭像 發表于 04-20 10:37 ?1871次閱讀
    如何使用<b class='flag-5'>RAPIDS</b>和CuPy時加速Gauss 秩變換

    NVIDIA深度學習加速數據科學教材套滿足教學需求

      第一個基于 Jupyter 筆記本電腦的實驗室之一讓學生使用 pandascuDF 直接進入 RAPIDSpandas 是一個建立在 Python 編程語言之上的數據分
    的頭像 發表于 04-20 14:49 ?937次閱讀
    NVIDIA深度學習加速數據科學教材套滿足教學需求

    使用RAPID cuDF處理時間序列數據的常見步驟

    加速數據分析:使用 RAPID cuDF 進行更快的時間序列分析
    的頭像 發表于 07-05 16:30 ?727次閱讀

    如何用基于NVIDIA GPU的RAPIDS cuML實現取代KRR?

    使用 NVIDIA RAPIDS cuML 實現 100 更快的單電池模式預測
    的頭像 發表于 07-05 16:30 ?930次閱讀
    如何用基于NVIDIA GPU的<b class='flag-5'>RAPIDS</b> cuML實現取代KRR?

    超強圖解Pandas,建議收藏

    Pandas是數據挖掘常見的工具,掌握使用過程中的函數是非常重要的。本文借助可視化的過程,講解Pandas的各種操作。
    的頭像 發表于 08-29 15:15 ?941次閱讀
    超強圖解<b class='flag-5'>Pandas</b>,建議收藏

    Python GPU DataFrame庫cuDF介紹

    cuDF (Pandas GPU 平替),用于加載、連接、聚合、過濾和其他數據操作。
    的頭像 發表于 12-20 15:05 ?972次閱讀
    Python GPU DataFrame庫<b class='flag-5'>cuDF</b>介紹

    NVIDIA加速計算引入Polars

    Polars 近日發布了一款由 RAPIDS cuDF 驅動的全新 GPU 引擎,該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 ,使數據科學家僅在一
    的頭像 發表于 11-20 10:03 ?643次閱讀
    <b class='flag-5'>將</b>NVIDIA加速計算引入Polars
    主站蜘蛛池模板: 亚洲精品成人a | 亚洲天堂成人网 | 中日韩精品视频在线观看 | 成人精品亚洲人成在线 | 亚洲 丝袜 制服 欧美 另类 | 天天插日日干 | 免费爱爱小视频 | 欧洲性freefree大白屁股 | 男女无遮挡一进一出性视频 | 久久夜色精品国产噜噜 | 欧美αv | 深夜国产成人福利在线观看女同 | 久久视频精品线视频在线网站 | 成人在线综合网 | 又污又黄的网站 | 国产亚洲精品仙踪林在线播放 | 国产高清不卡一区二区 | 国产午夜爽爽窝窝在线观看 | 男男np主受高h啪啪肉 | 欧美一区二区影院 | 久久亚洲综合中文字幕 | 久久三级毛片 | 美女全黄网站免费观看 | 亚洲欧美精品成人久久91 | 日本特黄a级高清免费酷网 日本特黄色大片 | 依人成人 | 天天操天天摸天天干 | 亚洲欧洲一区 | 欧美精品一区二区三区视频 | 2021国产精品自在拍在线播放 | 精品一区亚洲 | 天天撸夜夜操 | 欧美成人午夜不卡在线视频 | 亚色在线 | 免费在线看片网站 | 成人欧美一区二区三区白人 | 日韩精品免费一级视频 | 新版bt天堂资源在线 | 天天免费| 视频在线观看一区二区 | 亚洲一本之道在线观看不卡 |