在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用NVIDIA RAPIDS cuDF加速預處理工作流

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 2024-11-19 15:58 ? 次閱讀

本文屬于《解碼 AI》系列欄目,該系列的目的是讓技術更加簡單易懂,從而解密 AI,同時向 RTX 工作站和 PC 用戶展示全新硬件、軟件、工具和加速特性。

AI 正幫助各行各業(yè)推動創(chuàng)新和提高效率,但要充分發(fā)揮其潛力,必須基于海量的高質量數(shù)據(jù)對各種模型進行訓練。數(shù)據(jù)科學家在準備這類數(shù)據(jù)方面發(fā)揮著關鍵作用,在專業(yè)數(shù)據(jù)(通常為專有數(shù)據(jù))對于增強 AI 功能至關重要的特定領域尤其如此。

為了幫助數(shù)據(jù)科學家應對日益增長的工作負載需求,NVIDIA 發(fā)布了 RAPIDS cuDF 庫,以便用戶更輕松地處理數(shù)據(jù),并且無需更改代碼即可加速 pandas 軟件庫。Pandas 是面向 Python 的一個靈活、功能強大的熱門數(shù)據(jù)分析和處理庫。借助 cuDF,數(shù)據(jù)科學家現(xiàn)在可以在他們首選的代碼庫上全速運行數(shù)據(jù)處理。

NVIDIA RTX AI 硬件和技術也可以加速數(shù)據(jù)處理。這包括強大的 GPU,可提供在各個層面快速高效地加速 AI 所需的計算性能 — 從數(shù)據(jù)科學工作流到 PC 和工作站上的模型訓練和定制。

數(shù)據(jù)科學的瓶頸

最常用的數(shù)據(jù)格式是按行和列組織的表格數(shù)據(jù)。小型數(shù)據(jù)集可以使用 Excel 等電子表格工具進行管理,但是,包含數(shù)千萬行的數(shù)據(jù)集和建模工作流通常依賴于采用了例如 Python 等編程語言的 DataFrame 程序庫。

Python 是進行數(shù)據(jù)分析時的熱門選擇,主要是因為 pandas 庫采用易于使用的應用編程接口(API)。然而,隨著數(shù)據(jù)集的規(guī)模不斷增長,pandas 在純 CPU 系統(tǒng)中難以實現(xiàn)理想的處理速度和效率。該庫在處理文本密集型數(shù)據(jù)集時的性能也為人所詬病,而對大語言模型來說,這是一種重要的數(shù)據(jù)類型。

當數(shù)據(jù)需求超出 pandas 的能力時,數(shù)據(jù)科學家會面臨兩難境地:要么忍受緩慢的處理速度,要么采取復雜且成本高昂的措施,即轉而采用更高效但對用戶不夠友好的工具。

使用 RAPIDS cuDF加速預處理工作流

RAPIDS cuDF 配合 RTX AI PC 和工作站,可為熱門的 pandas 軟件庫提供最高達 100 倍加速

借助 RAPIDS cuDF,數(shù)據(jù)科學家現(xiàn)在可以在他們首選的代碼庫上全速運行數(shù)據(jù)處理。RAPIDS 是一套開源 GPU 加速的 Python 庫,旨在改進數(shù)據(jù)科學和分析工作流。cuDF 是一個 GPU DataFrame 庫,可提供類似于 pandas 的 API 來加載、過濾和操作數(shù)據(jù)。

使用 cuDF 的“pandas 加速器模式”,數(shù)據(jù)科學家可以在 GPU 上運行現(xiàn)有的 pandas 代碼,充分利用強大的并行處理功能,并可放心的將代碼在必要時移植到 CPU 上。這種互通性提供了出色、可靠的性能。

最新版本的 cuDF 支持更大規(guī)模的數(shù)據(jù)集和數(shù)十億行的表格文本數(shù)據(jù)。這樣,數(shù)據(jù)科學家就能夠使用 pandas 代碼來預處理生成式 AI 的數(shù)據(jù)。

在 NVIDIA RTX 加持的 AI 工作站

和 PC 上加速數(shù)據(jù)科學

最近的一項研究表明,57% 的數(shù)據(jù)科學家使用 PC、臺式機或工作站等本地資源來執(zhí)行數(shù)據(jù)科學任務。

從 NVIDIA GeForce RTX 4090 GPU 開始,數(shù)據(jù)科學家可以實現(xiàn)顯著的速度提升。隨著數(shù)據(jù)集規(guī)模不斷增長,處理工作占用更多內存,相比于基于傳統(tǒng) CPU 的解決方案,在工作站中配合使用 cuDF 和 NVIDIA RTX 5880 Ada 架構 GPU,可以將性能提升多達 100 倍。

ea062c2c-9ffd-11ef-93f3-92fbcf53809c.png

y 軸表示兩種常見的數(shù)據(jù)科學操作—“join”和“groupby”,而 x 軸顯示運行每項操作所需的時間

數(shù)據(jù)科學家可以在 NVIDIA AI Workbench 上輕松開始使用 RAPIDS cuDF。利用這個基于容器的免費開發(fā)者環(huán)境管理器,數(shù)據(jù)科學家和開發(fā)者可以跨 GPU 系統(tǒng)創(chuàng)建、遷移 AI 和數(shù)據(jù)科學工作負載并進行協(xié)作。用戶可以從 NVIDIA GitHub 倉庫中提供的幾個示例項目開始,例如 cuDF AI Workbench 項目。

HP AI Studio 也默認支持 cuDF,這是一個集中式數(shù)據(jù)科學平臺,旨在幫助 AI 開發(fā)者將其開發(fā)環(huán)境從工作站無縫復制到云端。這便于他們創(chuàng)建、開發(fā)項目并進行協(xié)作,而無需管理多個環(huán)境。

在 RTX 加持的 AI PC 和工作站上,cuDF 的優(yōu)勢并不僅限于提升原始性能。還包括:

在強大的 GPU 上進行固定成本的本地開發(fā),并可以無縫復制到本地部署的服務器或云實例,從而節(jié)省時間和支出。

加快數(shù)據(jù)處理以實現(xiàn)更快迭代,以便數(shù)據(jù)科學家以交互式的速度進行實驗、優(yōu)化并從數(shù)據(jù)集中產生洞察。

實現(xiàn)更有效的數(shù)據(jù)處理,以在后續(xù)工作流獲得更好的模型結果。

數(shù)據(jù)科學的新時代

隨著 AI 和數(shù)據(jù)科學的不斷發(fā)展,快速處理和分析大量數(shù)據(jù)集的能力將成為各行業(yè)實現(xiàn)突破的關鍵差異化因素。無論是開發(fā)復雜的機器學習模型、執(zhí)行復雜的統(tǒng)計分析還是探索生成式 AI,RAPIDS cuDF 都可為新一代數(shù)據(jù)處理奠定基礎。

NVIDIA 正通過增加對最熱門的 DataFrame 工具的支持來鞏固這一基礎,其中包括 Polars,它是增長最快的 Python 庫之一,與其他開箱即用的純 CPU 工具相比,可幫助顯著加速數(shù)據(jù)處理。

Polars 本月宣布推出由 RAPIDS cuDF 提供支持的 Polars GPU 引擎公開測試版。Polars 用戶現(xiàn)在可以將本已極快的 DataFrame 庫性能提升多達 13 倍。

RTX AI 為未來的工程師創(chuàng)造無限可能

無論在大學數(shù)據(jù)中心、GeForce RTX 筆記本電腦還是 NVIDIA RTX 工作站上運行,NVIDIA GPU 都可加速學習過程。數(shù)據(jù)科學領域及其他領域的學生將增強其學習體驗,并通過廣泛應用于現(xiàn)實世界應用的硬件獲得實戰(zhàn)經驗。

生成式 AI 正在深入改變游戲、視頻會議和各種交互體驗。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5178

    瀏覽量

    105279
  • AI
    AI
    +關注

    關注

    87

    文章

    33281

    瀏覽量

    273608
  • 工作流
    +關注

    關注

    0

    文章

    45

    瀏覽量

    12578

原文標題:解密 AI 如何加速數(shù)據(jù)科學工作流

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NX CAD軟件:數(shù)字化工作流程解決方案(CAD工作流程)

    NXCAD——數(shù)字化工作流程解決方案(CAD工作流程)使用西門子領先的產品設計軟件NXCAD加速執(zhí)行基于工作流程的解決方案。我們在了解行業(yè)需求方面累積了多年的經驗,并據(jù)此針對各個行業(yè)的
    的頭像 發(fā)表于 02-06 18:15 ?210次閱讀
    NX CAD軟件:數(shù)字化<b class='flag-5'>工作流</b>程解決方案(CAD<b class='flag-5'>工作流</b>程)

    NVIDIA RAPIDS cuDF如何賦能AI加速數(shù)據(jù)科學

    隨著 AI 正幫助各行各業(yè)推動創(chuàng)新和提高效率,基于海量的高質量數(shù)據(jù)來訓練各種模型是充分發(fā)揮 AI 應用潛力的必經之路,正因如此,數(shù)據(jù)科學家們面臨著日益增長的工作負載需求,迫切需求尋找高效趁手的工具以應對挑戰(zhàn)。
    的頭像 發(fā)表于 01-24 09:26 ?413次閱讀

    AI工作流自動化是做什么的

    AI工作流自動化是指利用人工智能技術,對工作流程中的重復性、規(guī)則明確的任務進行自動化處理的過程。那么,AI工作流自動化是做什么的呢?接下來,AI部落小編為您分享。
    的頭像 發(fā)表于 01-06 17:57 ?481次閱讀

    NVIDIA助力西門子醫(yī)療加速醫(yī)學影像AI部署

    MONAI 集成現(xiàn)已上線西門子醫(yī)療 Digital Marketplace,加速 AI 在臨床工作流中的應用落地。
    的頭像 發(fā)表于 12-06 11:51 ?605次閱讀

    數(shù)據(jù)科學工作流原理

    數(shù)據(jù)科學工作流包括數(shù)據(jù)收集、數(shù)據(jù)預處理、數(shù)據(jù)探索與可視化、特征選擇與工程、模型選擇與訓練、模型評估與優(yōu)化、結果解釋與報告、部署與監(jiān)控等環(huán)節(jié)。
    的頭像 發(fā)表于 11-20 10:36 ?402次閱讀

    NVIDIA加速計算引入Polars

    Polars 近日發(fā)布了一款由 RAPIDS cuDF 驅動的全新 GPU 引擎,該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使數(shù)據(jù)科學家僅在一
    的頭像 發(fā)表于 11-20 10:03 ?498次閱讀
    將<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>計算引入Polars

    RAPIDS cuDF將pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當前已能夠為 950 萬 pandas 用戶帶來 GPU 加速
    的頭像 發(fā)表于 11-20 09:52 ?461次閱讀
    <b class='flag-5'>RAPIDS</b> <b class='flag-5'>cuDF</b>將pandas提速近150倍

    NVIDIA發(fā)布全新AI和仿真工具以及工作流

    NVIDIA 在本周于德國慕尼黑舉行的機器人學習大會(CoRL)上發(fā)布了全新 AI 和仿真工具以及工作流。機器人開發(fā)者可以使用這些工具和工作流,大大加快 AI 機器人(包括人形機器人)的開發(fā)
    的頭像 發(fā)表于 11-09 11:52 ?585次閱讀

    全新NVIDIA AI工作流可檢測信用卡欺詐交易

    工作流由 AWS 上 的 NVIDIA AI 平臺驅動,可幫助金融服務機構節(jié)省資金并降低風險。
    的頭像 發(fā)表于 10-30 11:41 ?687次閱讀

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

    DolphinDB 是一家高性能數(shù)據(jù)庫研發(fā)企業(yè),也是 NVIDIA 初創(chuàng)加速計劃成員,其開發(fā)的產品基于高性能分布式時序數(shù)據(jù)庫,是支持復雜計算和數(shù)據(jù)分析的實時計算平臺,適用于金融、電力、物聯(lián)網和零售等行業(yè)。
    的頭像 發(fā)表于 09-09 09:57 ?663次閱讀
    利用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>DolphinDB Shark平臺提升計算性能

    行云流水線 滿足你對工作流編排的一切幻想~skr

    的核心組成部分,旨在加速軟件交付、提高質量和實現(xiàn)持續(xù)改進。流水線的核心是流水線模型,是實現(xiàn)工作流編排,執(zhí)行的重要基石,一個優(yōu)秀的流水線模型可以覆蓋用戶更多的實踐場景,按照用戶的所思所想支持編排相應的工作流程,通過模型的分層設計,
    的頭像 發(fā)表于 08-05 13:42 ?420次閱讀

    電子制造商采用NVIDIA AI和 Omniverse助力工廠提高運營效率并降低成本

    。 ? NVIDIA 宣布,各大電子制造商正在使用 NVIDIA 的技術并借助新的參考工作流將其工廠改造成具有更高自主化水平的設施。該工作流結合了
    的頭像 發(fā)表于 06-04 10:22 ?761次閱讀

    MathWorks 與 NVIDIA 聯(lián)手加速醫(yī)療技術領域中軟件定義工作流的開發(fā)

    到 GPU?加速NVIDIA Holoscan?算子中以進行實時數(shù)據(jù)處理和推斷,從而加速數(shù)據(jù)分析和可視化應用程序的開發(fā)與部署。 醫(yī)療設
    的頭像 發(fā)表于 05-17 10:36 ?529次閱讀
    MathWorks 與 <b class='flag-5'>NVIDIA</b> 聯(lián)手<b class='flag-5'>加速</b>醫(yī)療技術領域中軟件定義<b class='flag-5'>工作流</b>的開發(fā)

    MathWorks與NVIDIA攜手革新醫(yī)療技術工作流

    在醫(yī)療科技領域,軟件定義工作流正迎來新的突破。全球知名的數(shù)學計算軟件巨頭MathWorks與圖形處理器領導者NVIDIA近日宣布達成深度合作,將MATLAB?軟件成功集成至NVIDIA
    的頭像 發(fā)表于 05-11 10:17 ?496次閱讀

    MathWorks聯(lián)手NVIDIA加速醫(yī)療技術領域中軟件定義工作流的開發(fā)

    先的數(shù)學計算軟件開發(fā)商 MathWorks 宣布,MATLAB 已成功集成到 NVIDIA Holoscan 平臺。
    的頭像 發(fā)表于 05-09 11:45 ?1910次閱讀
    MathWorks聯(lián)手<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>醫(yī)療技術領域中軟件定義<b class='flag-5'>工作流</b>的開發(fā)
    主站蜘蛛池模板: 欧美性生活网站 | 午夜影院在线观看视频 | 免费看你懂的 | 特级黄色毛片 | 国产精品推荐天天看天天爽 | 日本三级香港三级三级人!妇久 | 亚洲天堂亚洲天堂 | 最新色网站 | 欧美日韩国产一区 | 免费鲁丝片一级观看 | 欧美午夜精品一区二区三区 | 亚洲国产精品乱码一区二区三区 | 被公侵犯肉体中文字幕一区二区 | 久久久久久久久久久9精品视频 | 国产情侣真实露脸在线最新 | 色两性网欧美 | 免费国产一区二区三区 | 欧美一区二区三区免费高 | 人人弄| 亚洲高清色 | 天天摸天天做天天爽天天弄 | 成人免费精品视频 | 婷婷中文字幕 | 午夜啪视频| 午夜一区二区免费视频 | 理论片午夜 | 成人a毛片手机免费播放 | 欧美一级视频在线 | 日日插夜夜爽 | 四虎在线电影 | 色五五月| 色多多福利网站 | 浓厚な接吻と肉体の交在线观看 | 免费日本黄色网址 | 午夜影视啪啪免费体验区深夜 | 波多野结衣在线视频观看 | 亚洲国产网址 | 性欧美精品久久久久久久 | 最新丁香六月 | 欧美人与z0xxxx另类 | 狠狠躁夜夜躁人人爽天天段 |