HPE、IBM、Oracle、開(kāi)源社區(qū)、創(chuàng)業(yè)公司采用RAPIDS,顯著提升端到端預(yù)測(cè)數(shù)據(jù)分析能力。
NVIDIA今日發(fā)布了一款針對(duì)數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的GPU加速平臺(tái),該平臺(tái)已為多個(gè)行業(yè)領(lǐng)先者所采用,并能幫助超大規(guī)模公司以前所未有的速度分析海量數(shù)據(jù)并進(jìn)行精準(zhǔn)的業(yè)務(wù)預(yù)測(cè)。
RAPIDS? 開(kāi)源軟件幫助數(shù)據(jù)科學(xué)家顯著地提高了工作績(jī)效,對(duì)于這些數(shù)據(jù)科學(xué)家來(lái)說(shuō),種種業(yè)務(wù)挑戰(zhàn)應(yīng)接不暇,其中包括預(yù)估信用卡詐騙、預(yù)測(cè)零售存貨及理解顧客購(gòu)買行為等等。眾多公司——無(wú)論是Databricks和Anaconda等開(kāi)源社區(qū)先驅(qū)還是Hewlett Packard Enterprise、IBM和Oracle等技術(shù)領(lǐng)袖——在GPU對(duì)數(shù)據(jù)分析的重要性方面日益達(dá)成共識(shí),并對(duì)RAPIDS表現(xiàn)出越來(lái)越多的支持。
據(jù)分析師估計(jì),面向數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的服務(wù)器市場(chǎng)每年價(jià)值約為200億美元,加上科學(xué)分析和深度學(xué)習(xí)市場(chǎng),高性能計(jì)算市場(chǎng)總價(jià)值大約為360億美元。
“數(shù)據(jù)分析和機(jī)器學(xué)習(xí)是高性能計(jì)算市場(chǎng)中最大的細(xì)分市場(chǎng),不過(guò)目前尚未實(shí)現(xiàn)加速,”NVIDIA創(chuàng)始人兼首席執(zhí)行官黃仁勛在GPU技術(shù)大會(huì)主旨演講中發(fā)布RAPIDS時(shí)表示,“全球最大的行業(yè)均在海量服務(wù)器上運(yùn)行機(jī)器學(xué)習(xí)算法,目的在于了解所在市場(chǎng)和環(huán)境中的復(fù)雜模式,同時(shí)迅速、精準(zhǔn)地做出將直接影響其基礎(chǔ)的預(yù)測(cè) ?!?/p>
黃仁勛表示,“得益于CUDA及其全球生態(tài)系統(tǒng)以及與開(kāi)源社區(qū)緊密合作,我們已創(chuàng)建了RAPIDS GPU加速平臺(tái)。該平臺(tái)已與全球最流行的數(shù)據(jù)科學(xué)庫(kù)及工作流無(wú)縫整合,可加速機(jī)器學(xué)習(xí)。如同深度學(xué)習(xí)一樣,我們正在不斷地為機(jī)器學(xué)習(xí)提速?!?/p>
RAPIDS已為GPU加速分析和機(jī)器學(xué)習(xí)提供了一整套開(kāi)源庫(kù),數(shù)據(jù)可視化即將是下一個(gè)目標(biāo)。RAPIDS由NVIDIA工程師與主要的開(kāi)源貢獻(xiàn)者在過(guò)去兩年的合作成果。
RAPIDS第一次為數(shù)據(jù)科學(xué)家提供了他們需要用來(lái)在GPU上運(yùn)行整個(gè)數(shù)據(jù)科學(xué)管線的工具。最初的RAPIDS基準(zhǔn)分析利用了XGBoost機(jī)器學(xué)習(xí)算法在NVIDIA DGX-2? 系統(tǒng)上進(jìn)行訓(xùn)練,結(jié)果表明,與僅有CPU的系統(tǒng)相比,其速度能加快50倍。這可幫助數(shù)據(jù)科學(xué)家將典型訓(xùn)練時(shí)間從數(shù)天減少到數(shù)小時(shí),或者從數(shù)小時(shí)減少到數(shù)分鐘,具體取決于其數(shù)據(jù)集的規(guī)模。
與開(kāi)源社區(qū)開(kāi)展緊密合作
RAPIDS構(gòu)建于Apache Arrow、pandas和scikit-learn等流行的開(kāi)源項(xiàng)目之上,為最流行的Python數(shù)據(jù)科學(xué)工具鏈帶來(lái)了GPU提速。為了將更多的機(jī)器學(xué)習(xí)庫(kù)和功能引入RAPIDS,NVIDIA廣泛地與開(kāi)源生態(tài)系統(tǒng)貢獻(xiàn)者展開(kāi)合作 ,其中包括Anaconda、BlazingDB、Databricks、Quansight、scikit-learn、Ursa Labs 負(fù)責(zé)人兼Apache Arrow締造者Wes McKinney以及迅速增長(zhǎng)的Python數(shù)據(jù)科學(xué)庫(kù)pandas等等。
McKinney表示,“作為GPU加速的數(shù)據(jù)科學(xué)平臺(tái),RAPIDS是由Apache Arrow驅(qū)動(dòng)的新一代的計(jì)算生態(tài)系統(tǒng)。NVIDIA與Ursa Labs的合作將加速Arrow核心數(shù)據(jù)庫(kù)的創(chuàng)新步伐,并有助于大幅提升分析及特征工程的績(jī)效。”
為了推動(dòng)RAPIDS的廣泛應(yīng)用,NVIDIA正努力將RAPIDS與Apache Spark進(jìn)行整合,后者是分析及數(shù)據(jù)科學(xué)方面領(lǐng)先的開(kāi)源框架。
Databricks聯(lián)合創(chuàng)始人、首席技術(shù)官兼Apache Spark 創(chuàng)始人Matei Zaharia表示,“在Databricks公司中,我們對(duì)RAPIDS在加速Apache Spark工作量方面的潛力感到非常興奮。我們目前開(kāi)展的多個(gè)項(xiàng)目都意在將Spark更好地與本地加速器進(jìn)行整合,其中包括借助Project Hydrogen實(shí)現(xiàn)的Apache Arrow的支持以及GPU調(diào)度。我們相信,就擴(kuò)大我們客戶數(shù)據(jù)科學(xué)及AI工作量來(lái)說(shuō),RAPIDS將是全新的、振奮人心的機(jī)會(huì)。”
廣泛的生態(tài)系統(tǒng)支持及應(yīng)用
各個(gè)行業(yè)技術(shù)領(lǐng)先的企業(yè)均是NVIDIA GPU加速平臺(tái)及RAPIDS的率先應(yīng)用者。
沃爾瑪執(zhí)行副總裁兼首席技術(shù)官Jeremy King表示,“NVIDIA的GPU加速平臺(tái)及RAPIDS軟件極大改進(jìn)了我們使用數(shù)據(jù)的方式,幫助我們實(shí)現(xiàn)了復(fù)雜模式大規(guī)模地運(yùn)行,同時(shí)進(jìn)行更加精準(zhǔn)的預(yù)測(cè)。RAPIDS的應(yīng)用得益于NVIDIA和沃爾瑪工程師之間的深度合作,我們準(zhǔn)備繼續(xù)推進(jìn)這種合作關(guān)系?!?/p>
此外,一些全球領(lǐng)先的技術(shù)公司也力圖通過(guò)全新的系統(tǒng)、數(shù)據(jù)科學(xué)平臺(tái)和軟件解決方案支持RAPIDS:
“HPE致力于改進(jìn)客戶生活和工作的方式。人工智能、分析和機(jī)器學(xué)習(xí)技術(shù)能在揭示洞察方面扮演關(guān)鍵的角色,這有助于幫助客戶實(shí)現(xiàn)突破性的成果,同時(shí)改善我們所生存的世界。HPE提供全面的人工智能和數(shù)據(jù)分析解決方案并在市場(chǎng)中保持獨(dú)一無(wú)二的優(yōu)勢(shì),其中既包括戰(zhàn)略咨詢,也包括專為特定需求開(kāi)發(fā)的GPU加速器技術(shù)、運(yùn)行支持以及強(qiáng)大的伙伴生態(tài)系統(tǒng);我們旨在為每位客戶定制合適的解決方案。我們對(duì)與NVIDIA在RAPIDS方面的合作感到非常興奮,此舉能加快數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的應(yīng)用,推動(dòng)我們的客戶更快地實(shí)現(xiàn)更具洞察力的成果?!薄萜掌髽I(yè)首席執(zhí)行官Antonio Neri
“IBM已為企業(yè)人工智能構(gòu)建了全球領(lǐng)先的、在任何部署模式上均能運(yùn)行的平臺(tái)。我們期望能拓展與NVIDIA已有的成功合作,利用RAPIDS來(lái)為客戶提供全新的機(jī)器學(xué)習(xí)工具。”——Hybrid Cloud高級(jí)副總裁兼IBM Research董事 Arvind Krishna
“當(dāng)今的計(jì)算領(lǐng)域要要強(qiáng)大的處理能力,以便應(yīng)對(duì)數(shù)據(jù)科學(xué)和分析智能等紛繁復(fù)雜的工作,而這正是NVIDIA GPU的優(yōu)勢(shì)。RAPIDS正在不斷加速處理和機(jī)器學(xué)習(xí)培訓(xùn)的速度。能在Oracle Cloud Infrastructure上支持這套全新的開(kāi)源軟件讓我們感到非常興奮,我們也希望能與NVIDIA繼續(xù)合作,以在我們的Oracle Data Science Cloud等各種平臺(tái)上支持RAPIDS,并進(jìn)一步加速客戶端到端數(shù)據(jù)科學(xué)工作流。RAPIDS軟件在Oracle Cloud上無(wú)縫運(yùn)行,這使客戶得以支持各種高性能計(jì)算、人工智能和數(shù)據(jù)科學(xué)需求,同時(shí)利用Oracle Cloud Infrastructure 上可獲得的GPU實(shí)例組合?!薄狾racle Cloud Infrastructure軟件開(kāi)發(fā)部門高級(jí)副總裁Clay Magouyrk
本新聞稿得到包括Cisco、DELL EMC、聯(lián)想、NERSC, NetApp, Pure Storage, SAP和SAS等其它領(lǐng)先創(chuàng)新者以及諸多數(shù)據(jù)科學(xué)先驅(qū)的支持。
供貨
全套R(shí)APIDS開(kāi)源庫(kù)現(xiàn)在即可在http://www.rapids.ai上獲得,代碼經(jīng)Apache許可公布。容器化RAPIDS版本本周內(nèi)可在NVIDIA GPU Cloud container registry (https://www.nvidia.com/en-us/gpu-cloud/)上獲得。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5198瀏覽量
105554 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8482瀏覽量
133923
原文標(biāo)題:GTC Europe | NVIDIA針對(duì)大規(guī)模數(shù)據(jù)分析和機(jī)器學(xué)習(xí)推出RAPIDS開(kāi)源GPU加速平臺(tái)
文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
NVIDIA Isaac 是英偉達(dá)推出的綜合性機(jī)器人開(kāi)發(fā)平臺(tái)
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開(kāi)發(fā)
GPU加速計(jì)算平臺(tái)的優(yōu)勢(shì)
利用NVIDIA DPF引領(lǐng)DPU加速云計(jì)算的未來(lái)

NVIDIA發(fā)布Cosmos平臺(tái),加速物理AI開(kāi)發(fā)
NVIDIA Cosmos世界基礎(chǔ)模型平臺(tái)發(fā)布
NVIDIA助力FinCatch開(kāi)發(fā)智能投資輔助系統(tǒng)
《CST Studio Suite 2024 GPU加速計(jì)算指南》
將NVIDIA加速計(jì)算引入Polars

RAPIDS cuDF將pandas提速近150倍

AMD與NVIDIA GPU優(yōu)缺點(diǎn)
GPU加速計(jì)算平臺(tái)是什么
利用NVIDIA RAPIDS加速DolphinDB Shark平臺(tái)提升計(jì)算性能

NVIDIA全面轉(zhuǎn)向開(kāi)源GPU內(nèi)核模塊

NVIDIA 通過(guò) CUDA-Q 平臺(tái)為全球各地的量子計(jì)算中心提供加速

評(píng)論