在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

在幾個AWS實例上運行的XGBoost和LightGBM的性能比較

jf_9aVl32Dp ? 來源:Arm軟件開發者 ? 作者:Arm軟件開發者 ? 2022-10-24 10:24 ? 次閱讀

介紹

XGBoost(eXtreme Gradient Boosting)是一個在Gradient Boosting Decision Tree(GBDT)框架下的開源機器學習庫(https://github.com/dmlc/xgboost)。XGBoost用于使用機器學習解決數據科學中的回歸和分類問題。任務可以分布在一組機器上,以便更快地進行訓練和推理。例如,XGBoost4J-Spark(https://xgboost.readthedocs.io/en/latest/jvm/xgboost4j_spark_tutorial.html)是一個將XGBoost與Apache Spark集成的項目。

LightGBM(Light Gradient Boosting Machine)是微軟開發的另一款基于GDBT的開源工具(https://www.microsoft.com/en-us/research/project/lightgbm/),與XGBoost相比,它以更高效的訓練而聞名。與XGBoost類似,LightGBM培訓可以分布在一個節點集群上,并通過減少節點之間的通信來降低任務分配的成本。

這個博客比較了在幾個AWS實例上運行的XGBoost和LightGBM的性能。這些實例包括類型C5(Skylake SP或Cascade Lake)、C6i(Intel Ice Lake)、C6g(AWS Graviton2)和C7g(AWS Graviton3),大小為12xlarge。這些實例都配備了48個vCPU和96GB內存。

AWS Graviton3:第三代Graviton處理器系列

AWS Graviton2處理器是AWS使用Arm Neoverse內核設計的第二代處理器,與Amazon EC2中的x86實例相比,為不同的工作負載提供了廣泛的性價比改進。AWS Gravaton3是Graviton處理器系列的第三代,與第二代相比,計算性能提高了25%。特定計算的性能可以提高2到3倍,例如浮點運算和密碼運算,以及支持bfloat16的基于CPU的機器學習應用程序。與支持DDR4的實例相比,Graviton3對DDR5的支持將內存帶寬提高了50%。

基準環境

基準測試工具

XGBoost集成在一個流行的Python機器庫scikit-learn中。我們使用scikit-learn_bench對XGBoost進行基準測試,并對LightGBM進行少量修改。基準測試工具和參數在配置文件中傳遞。示例配置文件位于存儲庫的“config”目錄中。基準測試使用Python 3.10.4和以下版本的Python庫:

XGBoost: 1.6.2

LightGBM: 3.3.2

scikit-learn: 1.1.2

對于XGBoost,我們為以下數據集運行基準測試:

Airline(binary classification)(https://www.stat.purdue.edu/~sguha/rhipe/doc/html/airline.html)

Higgs(binary classification) (https://archive.ics.uci.edu/ml/datasets/HIGGS)

MSRank(multi-class classification)(https://www.microsoft.com/en-us/research/project/mslr/)


對于LightGBM,我們呈現Airline和Higgs數據集的結果。

基準測試使用的參數如下:

13cd15be-52c3-11ed-a3b6-dac502259ad0.png

XGBoost的“hist”樹方法類似于LightGBM的工作方式,可以提高訓練速度。估計器(estimators)的數量設置為100,這是XGBoost和LightGBM庫的默認值。線程數設置為實例上可用的vCPU數,對于12xlarge的實例為48。

性能比較

XGBoost訓練性能

下圖顯示了三個數據集和不同實例類型的訓練時間。結果表明,Graviton3實例的訓練時間比C5提高了52%,比C6i提高了36%,比Graviton2提高了37%。

140a735a-52c3-11ed-a3b6-dac502259ad0.jpg

圖1.XGBoost訓練時間比較


下表顯示了Airline、Higgs和MSRank數據集的XGBoost訓練時間。

142b818a-52c3-11ed-a3b6-dac502259ad0.png

XGBoost推理性能

圖2顯示了三個數據集和不同實例類型的推理時間。結果表明,Graviton3實例的推理時間比C5提高了45%,比C6i提高了26%,比Graviton2提高了32%。

146fa4aa-52c3-11ed-a3b6-dac502259ad0.jpg

圖2.XGBoost推理時間比較

下表顯示了三個數據集的XGBoost推理時間。

14ab62ce-52c3-11ed-a3b6-dac502259ad0.png

LightGBM訓練性能

圖3顯示了Airline和Higgs數據集以及不同實例類型的訓練時間。結果表明,Graviton3實例的訓練時間比C5提高了53%,比C6i提高了42%,比Graviton2提高了41%。

14ce21ce-52c3-11ed-a3b6-dac502259ad0.jpg

圖3.LightGBM訓練時間比較

下表顯示了Airline和Higgs數據集的LighttGBM訓練時間。

14f968d4-52c3-11ed-a3b6-dac502259ad0.png

LightGBM推理性能

圖4顯示了兩個數據集和不同實例類型的訓練時間。結果表明,Graviton3實例比C5提高了39%,比C6i提高了31%,比Graviton2提高了31%。

15223e58-52c3-11ed-a3b6-dac502259ad0.jpg

圖4.LightGBM推理時間比較

圖4中圖表的數據來自下表,顯示了LightGBM以及Airline和Higgs數據集的推理時間:

154f7472-52c3-11ed-a3b6-dac502259ad0.png

基準測試考慮因素

默認情況下,scikit_learn_bench 使用了Scikit-learn補丁,使用Intel(R)Extension for scikit learn(https://github.com/intel/scikit-learn-intelex)在支持SSE2、AVX、AVX2和AVX512的Intel處理器上優化ML性能。然而,在本博客發布時,該補丁不支持梯度增強算法

Intel提供oneAPI數據分析庫(oneDAL)(https://github.com/oneapi-src/oneDAL)來加速Intel機器上的ML算法。然而,它需要從標準XGBoost和LightGBM模型到OneDAL的代碼更改和轉換。在本測試中,我們沒有使用OneDAL轉換和測試這些模型。

結論

XGBoost基準測試表明,在選擇用于性能分析的三個數據集(Airline、Higgs和MSRank)中,Graviton3實例的性能優于Graviton2和x86實例。在某些情況下,Graviton3比x86高出50%。對于LightGBM以及Airline和Higgs這兩個數據集,在訓練和推理操作中,表現出了類似的性能增強。
審核編輯:彭靜

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 開源
    +關注

    關注

    3

    文章

    3515

    瀏覽量

    43210
  • 機器學習
    +關注

    關注

    66

    文章

    8476

    瀏覽量

    133755
  • AWS
    AWS
    +關注

    關注

    0

    文章

    435

    瀏覽量

    24878
  • XGBoost
    +關注

    關注

    0

    文章

    16

    瀏覽量

    2309

原文標題:在AWS Graviton3上部署時XGBoost和LightGBM的性能改進

文章出處:【微信號:Arm軟件開發者,微信公眾號:Arm軟件開發者】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    PWM信號的性能比較

    我正在研究一個項目,希望使用PWM信號,誰能給我性能比較?? 以上來自于百度翻譯 以下為原文 i am working on a project wich requries a use of a
    發表于 06-19 08:38

    ARM Neoverse IP的AWS實例etcd分布式鍵對值存儲性能提升

    是在給定時間段內完成的總操作數。本文中,我們比較AWS M6g實例(基于 Arm Neoverse IP的 Graviton2)與M5實例
    發表于 07-06 17:37

    Arm Neoverse V1的AWS Graviton3深度學習推理工作負載方面的作用

    機器學習 (ML) 是云和邊緣基礎設施中增長最快的部分之一。 ML 中,深度學習推理預計會增長得更快。本博客中,我們比較了三種 Amazon Web Services (AWS)
    發表于 08-31 15:03

    比較AWS M6g實例與M5實例的etcd吞吐量和延遲性能

    members)Table 5: etcdM5和M6g的時延性能結果 (Write to all members)下圖顯示了M5和M6g實例
    發表于 09-13 15:06

    討論使用TerraformAWS上部署Arm EC2實例

    于將 A1 實例部署到您的云基礎設施。除了選擇 A1 實例類型外,無需執行任何不同或特殊操作即可在 AWS 運行 A1
    發表于 09-16 14:53

    膠體電池與鉛酸電池性能比較

    膠體電池與鉛酸電池性能比較
    發表于 11-06 16:43 ?35次下載

    電感器磁芯材料性能比較

    電感器磁芯材料性能比較表 Iron Powder
    發表于 12-22 11:31 ?2609次閱讀

    不同材料的電池性能比較

    不同材料的電池性能比較 電池成份
    發表于 10-27 10:48 ?905次閱讀

    各種電子管的防雷器件性能比較

    各種電子管的防雷器件性能比較 下為常用防雷元器件性能比較: 火花間隙(Arc chopping)
    發表于 11-30 09:32 ?898次閱讀

    步進電機和交流伺服電機性能比較

    步進電機和交流伺服電機性能比較 步進電機和交流伺服電機性能比較 步進電機是一種離散運動的裝置,它和現代數字控制技術有著本質的聯系。目前國內的數字
    發表于 02-06 10:25 ?1020次閱讀

    基本放大電路性能比較

    基本放大電路性能比較,感興趣的小伙伴們可以瞧一瞧。
    發表于 11-18 17:19 ?0次下載

    基于 Boosting 框架的主流集成算法介紹(

    本文是決策樹的第三篇,主要介紹基于 Boosting 框架的主流集成算法,包括 XGBoostLightGBMXGBoost
    的頭像 發表于 02-17 15:57 ?1167次閱讀
    基于 Boosting 框架的主流集成算法介紹(<b class='flag-5'>上</b>)

    XGBoost 2.0介紹

    XGBoost是處理不同類型表格數據的最著名的算法,LightGBM 和Catboost也是為了修改他的缺陷而發布的。近日XGBoost發布了新的2.0版,本文除了介紹讓XGBoost
    的頭像 發表于 11-03 10:12 ?626次閱讀
    <b class='flag-5'>XGBoost</b> 2.0介紹

    xgboost圖像分類中的應用

    XGBoost(eXtreme Gradient Boosting)是一種高效的機器學習算法,它基于梯度提升框架,通過構建多個弱學習器(通常是決策樹)來提高模型的性能XGBoost因其出色的
    的頭像 發表于 01-19 11:16 ?635次閱讀

    xgboostLightGBM的優勢對比

    機器學習領域,集成學習算法因其出色的性能和泛化能力而受到廣泛關注。其中,XGBoostLightGBM是兩種非常流行的梯度提升框架。 1. 算法基礎
    的頭像 發表于 01-19 11:18 ?660次閱讀
    主站蜘蛛池模板: 久碰香蕉精品视频在线观看 | 午夜免费啪视频观看网站 | 亚州1区2区3区4区产品乱码2021 | 国产乱辈通伦影片在线播放 | 狠狠色噜噜狠狠狠狠黑人 | 欧美影欧美影院免费观看视频 | 日韩啪啪片| 亚洲一级影院 | 狠狠色丁香久久综合婷婷 | 天堂网. www在线资源 | 在线天堂中文 | 7m凹凸精品分类大全免费 | 五月婷婷六月丁香激情 | 无人码一区二区三区视频 | 亚洲国产成人最新精品资源 | 天天精品在线 | 日本5级床片全免费 | 野外啪啪抽搐一进一出 | 中国一级黄色毛片 | 国产美女免费观看 | 国产美女精品一区二区三区 | 色www永久免费| 天天综合色天天综合网 | 操夜夜| 色偷偷资源 | 天天躁夜夜躁狠狠躁躁 | 男女在线观看视频 | 男女啪视频大全1000 | 久久香蕉综合色一综合色88 | 免费的色网站 | 五月亭亭激情五月 | bt天堂bt在线网 | 香蕉成人999视频 | 午夜女上男下xx00xx00动态 | 日日操夜夜操狠狠操 | 欧美成人全部免费观看1314色 | 国产精品青草久久久久福利99 | 狠狠干夜夜 | 精品福利在线观看 | 一区二区在线免费观看 | 免费黄色在线观看 |