在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用NVIDIA RAPIDS cuDF加速預(yù)處理工作流

NVIDIA英偉達(dá) ? 來(lái)源:NVIDIA英偉達(dá) ? 2024-11-19 15:58 ? 次閱讀

本文屬于《解碼 AI》系列欄目,該系列的目的是讓技術(shù)更加簡(jiǎn)單易懂,從而解密 AI,同時(shí)向 RTX 工作站和 PC 用戶(hù)展示全新硬件、軟件、工具和加速特性。

AI 正幫助各行各業(yè)推動(dòng)創(chuàng)新和提高效率,但要充分發(fā)揮其潛力,必須基于海量的高質(zhì)量數(shù)據(jù)對(duì)各種模型進(jìn)行訓(xùn)練。數(shù)據(jù)科學(xué)家在準(zhǔn)備這類(lèi)數(shù)據(jù)方面發(fā)揮著關(guān)鍵作用,在專(zhuān)業(yè)數(shù)據(jù)(通常為專(zhuān)有數(shù)據(jù))對(duì)于增強(qiáng) AI 功能至關(guān)重要的特定領(lǐng)域尤其如此。

為了幫助數(shù)據(jù)科學(xué)家應(yīng)對(duì)日益增長(zhǎng)的工作負(fù)載需求,NVIDIA 發(fā)布了 RAPIDS cuDF 庫(kù),以便用戶(hù)更輕松地處理數(shù)據(jù),并且無(wú)需更改代碼即可加速 pandas 軟件庫(kù)。Pandas 是面向 Python 的一個(gè)靈活、功能強(qiáng)大的熱門(mén)數(shù)據(jù)分析和處理庫(kù)。借助 cuDF,數(shù)據(jù)科學(xué)家現(xiàn)在可以在他們首選的代碼庫(kù)上全速運(yùn)行數(shù)據(jù)處理。

NVIDIA RTX AI 硬件和技術(shù)也可以加速數(shù)據(jù)處理。這包括強(qiáng)大的 GPU,可提供在各個(gè)層面快速高效地加速 AI 所需的計(jì)算性能 — 從數(shù)據(jù)科學(xué)工作流到 PC 和工作站上的模型訓(xùn)練和定制。

數(shù)據(jù)科學(xué)的瓶頸

最常用的數(shù)據(jù)格式是按行和列組織的表格數(shù)據(jù)。小型數(shù)據(jù)集可以使用 Excel 等電子表格工具進(jìn)行管理,但是,包含數(shù)千萬(wàn)行的數(shù)據(jù)集和建模工作流通常依賴(lài)于采用了例如 Python 等編程語(yǔ)言的 DataFrame 程序庫(kù)。

Python 是進(jìn)行數(shù)據(jù)分析時(shí)的熱門(mén)選擇,主要是因?yàn)?pandas 庫(kù)采用易于使用的應(yīng)用編程接口(API)。然而,隨著數(shù)據(jù)集的規(guī)模不斷增長(zhǎng),pandas 在純 CPU 系統(tǒng)中難以實(shí)現(xiàn)理想的處理速度和效率。該庫(kù)在處理文本密集型數(shù)據(jù)集時(shí)的性能也為人所詬病,而對(duì)大語(yǔ)言模型來(lái)說(shuō),這是一種重要的數(shù)據(jù)類(lèi)型。

當(dāng)數(shù)據(jù)需求超出 pandas 的能力時(shí),數(shù)據(jù)科學(xué)家會(huì)面臨兩難境地:要么忍受緩慢的處理速度,要么采取復(fù)雜且成本高昂的措施,即轉(zhuǎn)而采用更高效但對(duì)用戶(hù)不夠友好的工具。

使用 RAPIDS cuDF加速預(yù)處理工作流

RAPIDS cuDF 配合 RTX AI PC 和工作站,可為熱門(mén)的 pandas 軟件庫(kù)提供最高達(dá) 100 倍加速

借助 RAPIDS cuDF,數(shù)據(jù)科學(xué)家現(xiàn)在可以在他們首選的代碼庫(kù)上全速運(yùn)行數(shù)據(jù)處理。RAPIDS 是一套開(kāi)源 GPU 加速的 Python 庫(kù),旨在改進(jìn)數(shù)據(jù)科學(xué)和分析工作流。cuDF 是一個(gè) GPU DataFrame 庫(kù),可提供類(lèi)似于 pandas 的 API 來(lái)加載、過(guò)濾和操作數(shù)據(jù)。

使用 cuDF 的“pandas 加速器模式”,數(shù)據(jù)科學(xué)家可以在 GPU 上運(yùn)行現(xiàn)有的 pandas 代碼,充分利用強(qiáng)大的并行處理功能,并可放心的將代碼在必要時(shí)移植到 CPU 上。這種互通性提供了出色、可靠的性能。

最新版本的 cuDF 支持更大規(guī)模的數(shù)據(jù)集和數(shù)十億行的表格文本數(shù)據(jù)。這樣,數(shù)據(jù)科學(xué)家就能夠使用 pandas 代碼來(lái)預(yù)處理生成式 AI 的數(shù)據(jù)。

在 NVIDIA RTX 加持的 AI 工作站

和 PC 上加速數(shù)據(jù)科學(xué)

最近的一項(xiàng)研究表明,57% 的數(shù)據(jù)科學(xué)家使用 PC、臺(tái)式機(jī)或工作站等本地資源來(lái)執(zhí)行數(shù)據(jù)科學(xué)任務(wù)。

從 NVIDIA GeForce RTX 4090 GPU 開(kāi)始,數(shù)據(jù)科學(xué)家可以實(shí)現(xiàn)顯著的速度提升。隨著數(shù)據(jù)集規(guī)模不斷增長(zhǎng),處理工作占用更多內(nèi)存,相比于基于傳統(tǒng) CPU 的解決方案,在工作站中配合使用 cuDF 和 NVIDIA RTX 5880 Ada 架構(gòu) GPU,可以將性能提升多達(dá) 100 倍。

ea062c2c-9ffd-11ef-93f3-92fbcf53809c.png

y 軸表示兩種常見(jiàn)的數(shù)據(jù)科學(xué)操作—“join”和“groupby”,而 x 軸顯示運(yùn)行每項(xiàng)操作所需的時(shí)間

數(shù)據(jù)科學(xué)家可以在 NVIDIA AI Workbench 上輕松開(kāi)始使用 RAPIDS cuDF。利用這個(gè)基于容器的免費(fèi)開(kāi)發(fā)者環(huán)境管理器,數(shù)據(jù)科學(xué)家和開(kāi)發(fā)者可以跨 GPU 系統(tǒng)創(chuàng)建、遷移 AI 和數(shù)據(jù)科學(xué)工作負(fù)載并進(jìn)行協(xié)作。用戶(hù)可以從 NVIDIA GitHub 倉(cāng)庫(kù)中提供的幾個(gè)示例項(xiàng)目開(kāi)始,例如 cuDF AI Workbench 項(xiàng)目。

HP AI Studio 也默認(rèn)支持 cuDF,這是一個(gè)集中式數(shù)據(jù)科學(xué)平臺(tái),旨在幫助 AI 開(kāi)發(fā)者將其開(kāi)發(fā)環(huán)境從工作站無(wú)縫復(fù)制到云端。這便于他們創(chuàng)建、開(kāi)發(fā)項(xiàng)目并進(jìn)行協(xié)作,而無(wú)需管理多個(gè)環(huán)境。

在 RTX 加持的 AI PC 和工作站上,cuDF 的優(yōu)勢(shì)并不僅限于提升原始性能。還包括:

在強(qiáng)大的 GPU 上進(jìn)行固定成本的本地開(kāi)發(fā),并可以無(wú)縫復(fù)制到本地部署的服務(wù)器或云實(shí)例,從而節(jié)省時(shí)間和支出。

加快數(shù)據(jù)處理以實(shí)現(xiàn)更快迭代,以便數(shù)據(jù)科學(xué)家以交互式的速度進(jìn)行實(shí)驗(yàn)、優(yōu)化并從數(shù)據(jù)集中產(chǎn)生洞察。

實(shí)現(xiàn)更有效的數(shù)據(jù)處理,以在后續(xù)工作流獲得更好的模型結(jié)果。

數(shù)據(jù)科學(xué)的新時(shí)代

隨著 AI 和數(shù)據(jù)科學(xué)的不斷發(fā)展,快速處理和分析大量數(shù)據(jù)集的能力將成為各行業(yè)實(shí)現(xiàn)突破的關(guān)鍵差異化因素。無(wú)論是開(kāi)發(fā)復(fù)雜的機(jī)器學(xué)習(xí)模型、執(zhí)行復(fù)雜的統(tǒng)計(jì)分析還是探索生成式 AI,RAPIDS cuDF 都可為新一代數(shù)據(jù)處理奠定基礎(chǔ)。

NVIDIA 正通過(guò)增加對(duì)最熱門(mén)的 DataFrame 工具的支持來(lái)鞏固這一基礎(chǔ),其中包括 Polars,它是增長(zhǎng)最快的 Python 庫(kù)之一,與其他開(kāi)箱即用的純 CPU 工具相比,可幫助顯著加速數(shù)據(jù)處理。

Polars 本月宣布推出由 RAPIDS cuDF 提供支持的 Polars GPU 引擎公開(kāi)測(cè)試版。Polars 用戶(hù)現(xiàn)在可以將本已極快的 DataFrame 庫(kù)性能提升多達(dá) 13 倍。

RTX AI 為未來(lái)的工程師創(chuàng)造無(wú)限可能

無(wú)論在大學(xué)數(shù)據(jù)中心、GeForce RTX 筆記本電腦還是 NVIDIA RTX 工作站上運(yùn)行,NVIDIA GPU 都可加速學(xué)習(xí)過(guò)程。數(shù)據(jù)科學(xué)領(lǐng)域及其他領(lǐng)域的學(xué)生將增強(qiáng)其學(xué)習(xí)體驗(yàn),并通過(guò)廣泛應(yīng)用于現(xiàn)實(shí)世界應(yīng)用的硬件獲得實(shí)戰(zhàn)經(jīng)驗(yàn)。

生成式 AI 正在深入改變游戲、視頻會(huì)議和各種交互體驗(yàn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5085

    瀏覽量

    103881
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31821

    瀏覽量

    270588
  • 工作流
    +關(guān)注

    關(guān)注

    0

    文章

    44

    瀏覽量

    12458

原文標(biāo)題:解密 AI 如何加速數(shù)據(jù)科學(xué)工作流

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NX CAD軟件:數(shù)字化工作流程解決方案(CAD工作流程)

    NXCAD——數(shù)字化工作流程解決方案(CAD工作流程)使用西門(mén)子領(lǐng)先的產(chǎn)品設(shè)計(jì)軟件NXCAD加速執(zhí)行基于工作流程的解決方案。我們?cè)诹私庑袠I(yè)需求方面累積了多年的經(jīng)驗(yàn),并據(jù)此針對(duì)各個(gè)行業(yè)的
    的頭像 發(fā)表于 02-06 18:15 ?63次閱讀
    NX CAD軟件:數(shù)字化<b class='flag-5'>工作流</b>程解決方案(CAD<b class='flag-5'>工作流</b>程)

    NVIDIA RAPIDS cuDF如何賦能AI加速數(shù)據(jù)科學(xué)

    隨著 AI 正幫助各行各業(yè)推動(dòng)創(chuàng)新和提高效率,基于海量的高質(zhì)量數(shù)據(jù)來(lái)訓(xùn)練各種模型是充分發(fā)揮 AI 應(yīng)用潛力的必經(jīng)之路,正因如此,數(shù)據(jù)科學(xué)家們面臨著日益增長(zhǎng)的工作負(fù)載需求,迫切需求尋找高效趁手的工具以應(yīng)對(duì)挑戰(zhàn)。
    的頭像 發(fā)表于 01-24 09:26 ?212次閱讀

    AI工作流自動(dòng)化是做什么的

    AI工作流自動(dòng)化是指利用人工智能技術(shù),對(duì)工作流程中的重復(fù)性、規(guī)則明確的任務(wù)進(jìn)行自動(dòng)化處理的過(guò)程。那么,AI工作流自動(dòng)化是做什么的呢?接下來(lái),AI部落小編為您分享。
    的頭像 發(fā)表于 01-06 17:57 ?193次閱讀

    NVIDIA助力西門(mén)子醫(yī)療加速醫(yī)學(xué)影像AI部署

    MONAI 集成現(xiàn)已上線(xiàn)西門(mén)子醫(yī)療 Digital Marketplace,加速 AI 在臨床工作流中的應(yīng)用落地。
    的頭像 發(fā)表于 12-06 11:51 ?402次閱讀

    數(shù)據(jù)科學(xué)工作流原理

    數(shù)據(jù)科學(xué)工作流包括數(shù)據(jù)收集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)探索與可視化、特征選擇與工程、模型選擇與訓(xùn)練、模型評(píng)估與優(yōu)化、結(jié)果解釋與報(bào)告、部署與監(jiān)控等環(huán)節(jié)。
    的頭像 發(fā)表于 11-20 10:36 ?261次閱讀

    NVIDIA加速計(jì)算引入Polars

    Polars 近日發(fā)布了一款由 RAPIDS cuDF 驅(qū)動(dòng)的全新 GPU 引擎,該引擎可將 NVIDIA GPU 上的 Polars 工作流速度最高提速 13 倍,使數(shù)據(jù)科學(xué)家僅在一
    的頭像 發(fā)表于 11-20 10:03 ?315次閱讀
    將<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>計(jì)算引入Polars

    RAPIDS cuDF將pandas提速近150倍

    NVIDIA GTC 2024 上,NVIDIA 宣布,RAPIDS cuDF 當(dāng)前已能夠?yàn)?950 萬(wàn) pandas 用戶(hù)帶來(lái) GPU 加速
    的頭像 發(fā)表于 11-20 09:52 ?304次閱讀
    <b class='flag-5'>RAPIDS</b> <b class='flag-5'>cuDF</b>將pandas提速近150倍

    NVIDIA發(fā)布全新AI和仿真工具以及工作流

    NVIDIA 在本周于德國(guó)慕尼黑舉行的機(jī)器人學(xué)習(xí)大會(huì)(CoRL)上發(fā)布了全新 AI 和仿真工具以及工作流。機(jī)器人開(kāi)發(fā)者可以使用這些工具和工作流,大大加快 AI 機(jī)器人(包括人形機(jī)器人)的開(kāi)發(fā)
    的頭像 發(fā)表于 11-09 11:52 ?369次閱讀

    全新NVIDIA AI工作流可檢測(cè)信用卡欺詐交易

    工作流由 AWS 上 的 NVIDIA AI 平臺(tái)驅(qū)動(dòng),可幫助金融服務(wù)機(jī)構(gòu)節(jié)省資金并降低風(fēng)險(xiǎn)。
    的頭像 發(fā)表于 10-30 11:41 ?527次閱讀

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺(tái)提升計(jì)算性能

    DolphinDB 是一家高性能數(shù)據(jù)庫(kù)研發(fā)企業(yè),也是 NVIDIA 初創(chuàng)加速計(jì)劃成員,其開(kāi)發(fā)的產(chǎn)品基于高性能分布式時(shí)序數(shù)據(jù)庫(kù),是支持復(fù)雜計(jì)算和數(shù)據(jù)分析的實(shí)時(shí)計(jì)算平臺(tái),適用于金融、電力、物聯(lián)網(wǎng)和零售等行業(yè)。
    的頭像 發(fā)表于 09-09 09:57 ?542次閱讀
    利用<b class='flag-5'>NVIDIA</b> <b class='flag-5'>RAPIDS</b><b class='flag-5'>加速</b>DolphinDB Shark平臺(tái)提升計(jì)算性能

    行云流水線(xiàn) 滿(mǎn)足你對(duì)工作流編排的一切幻想~skr

    的核心組成部分,旨在加速軟件交付、提高質(zhì)量和實(shí)現(xiàn)持續(xù)改進(jìn)。流水線(xiàn)的核心是流水線(xiàn)模型,是實(shí)現(xiàn)工作流編排,執(zhí)行的重要基石,一個(gè)優(yōu)秀的流水線(xiàn)模型可以覆蓋用戶(hù)更多的實(shí)踐場(chǎng)景,按照用戶(hù)的所思所想支持編排相應(yīng)的工作流程,通過(guò)模型的分層設(shè)計(jì),
    的頭像 發(fā)表于 08-05 13:42 ?341次閱讀

    電子制造商采用NVIDIA AI和 Omniverse助力工廠(chǎng)提高運(yùn)營(yíng)效率并降低成本

    。 ? NVIDIA 宣布,各大電子制造商正在使用 NVIDIA 的技術(shù)并借助新的參考工作流將其工廠(chǎng)改造成具有更高自主化水平的設(shè)施。該工作流結(jié)合了
    的頭像 發(fā)表于 06-04 10:22 ?662次閱讀

    MathWorks 與 NVIDIA 聯(lián)手加速醫(yī)療技術(shù)領(lǐng)域中軟件定義工作流的開(kāi)發(fā)

    到 GPU?加速NVIDIA Holoscan?算子中以進(jìn)行實(shí)時(shí)數(shù)據(jù)處理和推斷,從而加速數(shù)據(jù)分析和可視化應(yīng)用程序的開(kāi)發(fā)與部署。 醫(yī)療設(shè)
    的頭像 發(fā)表于 05-17 10:36 ?437次閱讀
    MathWorks 與 <b class='flag-5'>NVIDIA</b> 聯(lián)手<b class='flag-5'>加速</b>醫(yī)療技術(shù)領(lǐng)域中軟件定義<b class='flag-5'>工作流</b>的開(kāi)發(fā)

    MathWorks與NVIDIA攜手革新醫(yī)療技術(shù)工作流

    在醫(yī)療科技領(lǐng)域,軟件定義工作流正迎來(lái)新的突破。全球知名的數(shù)學(xué)計(jì)算軟件巨頭MathWorks與圖形處理器領(lǐng)導(dǎo)者NVIDIA近日宣布達(dá)成深度合作,將MATLAB?軟件成功集成至NVIDIA
    的頭像 發(fā)表于 05-11 10:17 ?428次閱讀

    MathWorks聯(lián)手NVIDIA加速醫(yī)療技術(shù)領(lǐng)域中軟件定義工作流的開(kāi)發(fā)

    先的數(shù)學(xué)計(jì)算軟件開(kāi)發(fā)商 MathWorks 宣布,MATLAB 已成功集成到 NVIDIA Holoscan 平臺(tái)。
    的頭像 發(fā)表于 05-09 11:45 ?1827次閱讀
    MathWorks聯(lián)手<b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>醫(yī)療技術(shù)領(lǐng)域中軟件定義<b class='flag-5'>工作流</b>的開(kāi)發(fā)
    主站蜘蛛池模板: 国产jzjzjz免费大全视频 | 午夜美女视频在线观看高清 | 久久97精品久久久久久久看片 | 色综合色综合色综合色综合 | 久久亚洲aⅴ精品网站婷婷 久久亚洲成人 | 特黄a大片免费视频 | 国产精品久久久久久久久免费 | 99热这里精品 | 免费在线看黄色 | 欧美视频一区二区三区四区 | 人与牲动交xxxxbbbb | 亚洲一成人毛片 | 午夜一级毛片看看 | 国产精品日韩欧美亚洲另类 | 成人午夜免费视频毛片 | 福利社藏经阁 | 日本在线一区二区 | 欧美色天使 | 黄色毛片大全 | 天天射天天舔 | 亚洲一本视频 | 五月婷婷久 | 久青草国产手机在线视频 | 国产经典三级 | 六月丁香激情综合成人 | 成年男人永久免费看片 | 日本高清视频wwww色 | 国产精品久久久久影院免费 | 久久狠狠干 | 91日韩精品天海翼在线观看 | 高清一级做a爱免费视 | 色碰人色碰人视频 | 色多多网址 | 神马电影天堂网 | 很黄很色的网站 | 亚洲色图图片专区 | 在线免费观看一级毛片 | 亚洲卡5卡6卡7国色天香 | 国产福利网站 | 手机在线你懂的 | 天天操天天射天天舔 |