雪鹰领主,梦入神机,完美世界国际版下载

AutoML 是當(dāng)前深度學(xué)習(xí)領(lǐng)域的熱門話題。只需要很少的工作，AutoML 就能通過快速有效的方式，為你的 ML 任務(wù)構(gòu)建好網(wǎng)絡(luò)模型，并實(shí)現(xiàn)高準(zhǔn)確率。簡(jiǎn)單有效！數(shù)據(jù)預(yù)處理、特征工程、特征提取和特征選擇等任務(wù)皆可通過 AutoML 自動(dòng)構(gòu)建。

自動(dòng)機(jī)器學(xué)習(xí)（Automated Machine Learning， AutoML）是一個(gè)新興的領(lǐng)域，在這個(gè)領(lǐng)域中，建立機(jī)器學(xué)習(xí)模型來建模數(shù)據(jù)的過程是自動(dòng)化的。AutoML 使得建模更容易，并且每個(gè)人都更容易掌握。

在本文中，作者詳細(xì)介紹了四種自動(dòng)化的 ML 工具包，分別是 auto-sklearn、TPOT、HyperOpt 以及 AutoKeras。如果你對(duì) AutoML 感興趣，這四個(gè) Python 庫是最好的選擇。作者還在文章結(jié)尾文章對(duì)這四個(gè)工具包進(jìn)行了比較。

auto-sklearn

auto-sklearn 是一個(gè)自動(dòng)機(jī)器學(xué)習(xí)工具包，它與標(biāo)準(zhǔn) sklearn 接口無縫集成，因此社區(qū)中很多人都很熟悉該工具。通過使用最近的一些方法，比如貝葉斯優(yōu)化，該庫被用來導(dǎo)航模型的可能空間，并學(xué)習(xí)推理特定配置是否能很好地完成給定任務(wù)。

該庫由 Matthias Feurer 等人提出，技術(shù)細(xì)節(jié)請(qǐng)查閱論文《Efficient and Robust Machine Learning》。Feurer 在這篇論文中寫道：

我們提出了一個(gè)新的、基于 scikit-learn 的魯棒 AutoML 系統(tǒng)，其中使用 15 個(gè)分類器、14 種特征預(yù)處理方法和 4 種數(shù)據(jù)預(yù)處理方法，生成了一個(gè)具有 110 個(gè)超參數(shù)的結(jié)構(gòu)化假設(shè)空間。

auto-sklearn 可能最適合剛接觸 AutoML 的用戶。除了發(fā)現(xiàn)數(shù)據(jù)集的數(shù)據(jù)準(zhǔn)備和模型選擇之外，該庫還可以從在類似數(shù)據(jù)集上表現(xiàn)良好的模型中學(xué)習(xí)。表現(xiàn)最好的模型聚集在一個(gè)集合中。

分析四種自動(dòng)化的機(jī)器學(xué)習(xí)工具包，更好地建立網(wǎng)絡(luò)模型

圖源：《Efficient and Robust Automated Machine Learning》

在高效實(shí)現(xiàn)方面，auto-sklearn 需要的用戶交互最少。使用 pip install auto-sklearn 即可安裝庫。

該庫可以使用的兩個(gè)主要類是 AutoSklearnClassifier 和 AutoSklearnRegressor，它們分別用來做分類和回歸任務(wù)。兩者具有相同的用戶指定參數(shù)，其中最重要的是時(shí)間約束和集合大小。

更多 AutoSklearn 相關(guān)文檔請(qǐng)查閱：https://automl.github.io/auto-sklearn/master/。

TPOT

TPOT 是另一種基于 Python 的自動(dòng)機(jī)器學(xué)習(xí)開發(fā)工具，該工具更關(guān)注數(shù)據(jù)準(zhǔn)備、建模算法和模型超參數(shù)。它通過一種基于進(jìn)化樹的結(jié)，即自動(dòng)設(shè)計(jì)和優(yōu)化機(jī)器學(xué)習(xí) pipelie 的樹表示工作流優(yōu)化（Tree-based Pipeline Optimization Tool， TPOT），從而實(shí)現(xiàn)特征選擇、預(yù)處理和構(gòu)建的自動(dòng)化。

分析四種自動(dòng)化的機(jī)器學(xué)習(xí)工具包，更好地建立網(wǎng)絡(luò)模型

圖源：《Evaluation of a Tree-based Pipeline Optimization Tool for Automating Data Science》。

程序或 pipeline 用樹表示。遺傳編程（Genetic Program， GP）選擇并演化某些程序，以最大化每個(gè)自動(dòng)化機(jī)器學(xué)習(xí)管道的最終結(jié)果。

正如 Pedro Domingos 所說，「數(shù)據(jù)量大的愚蠢算法勝過數(shù)據(jù)有限的聰明算法」。事實(shí)就是這樣：TPOT 可以生成復(fù)雜的數(shù)據(jù)預(yù)處理 pipeline。

分析四種自動(dòng)化的機(jī)器學(xué)習(xí)工具包，更好地建立網(wǎng)絡(luò)模型

潛在的 pipelie（圖源：TPOT 文檔）。

TPOT pipeline 優(yōu)化器可能需要幾個(gè)小時(shí)才能產(chǎn)生很好的結(jié)果，就像很多 AutoML 算法一樣（除非數(shù)據(jù)集很?。?。用戶可以在 Kaggle commits 或 Google Colab 中運(yùn)行這些耗時(shí)的程序。

也許 TPOT 最好的特性是它將模型導(dǎo)出為 Python 代碼文件，后續(xù)可以使用它。具體文檔和教程示例參見以下兩個(gè)鏈接：

TPOT 文檔地址：https://epistasislab.github.io/tpot/。

TPOT 的教程示例地址：https://epistasislab.github.io/tpot/examples/

HyperOpt

HyperOpt 是一個(gè)用于貝葉斯優(yōu)化的 Python 庫，由 James Bergstra 開發(fā)。該庫專為大規(guī)模優(yōu)化具有數(shù)百個(gè)參數(shù)的模型而設(shè)計(jì)，顯式地用于優(yōu)化機(jī)器學(xué)習(xí) pipeline，并可選擇在多個(gè)核心和機(jī)器上擴(kuò)展優(yōu)化過程。

但是，HyperOpt 很難直接使用，因?yàn)樗浅＞哂屑夹g(shù)性，需要仔細(xì)指定優(yōu)化程序和參數(shù)。相反，作者建議使用 HyperOpt-sklearn，這是一個(gè)融合了 sklearn 庫的 HyperOpt 包裝器。

具體來說，HyperOpt 雖然支持預(yù)處理，但非常關(guān)注進(jìn)入特定模型的幾十個(gè)超參數(shù)。就一次 HyperOpt sklearn 搜索的結(jié)果來說，它生成了一個(gè)沒有預(yù)處理的梯度提升分類器：

如何構(gòu)建 HyperOpt-sklearn 模型可以查看源文檔。它比 auto-sklearn 復(fù)雜得多，也比 TPOT 復(fù)雜一點(diǎn)。但是如果超參數(shù)很重要的話，它可能是值得的。

文檔地址：http://hyperopt.github.io/hyperopt-sklearn/

AutoKeras

與標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)庫相比，神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)功能更強(qiáng)大，因此更難實(shí)現(xiàn)自動(dòng)化。AutoKeras 庫有哪些功效呢？具體如下：

通過 AutoKeras，神經(jīng)框架搜索算法可以找到最佳架構(gòu)，如單個(gè)網(wǎng)絡(luò)層中的神經(jīng)元數(shù)量、層數(shù)量、要合并的層、以及濾波器大小或 Dropout 中丟失神經(jīng)元百分比等特定于層的參數(shù)。一旦搜索完成，用戶可以將其作為普通的 TF/Keras 模型使用；

通過 AutoKeras，用戶可以構(gòu)建一個(gè)包含嵌入和空間縮減等復(fù)雜元素的模型，這些元素對(duì)于學(xué)習(xí)深度學(xué)習(xí)過程中的人來說是不太容易訪問的；

當(dāng)使用 AutoKeras 創(chuàng)建模型時(shí)，向量化或清除文本數(shù)據(jù)等許多預(yù)處理操作都能完成并進(jìn)行優(yōu)化；

初始化和訓(xùn)練一次搜索需要兩行代碼。AutoKeras 擁有一個(gè)類似于 keras 的界面，所以它并不難記憶和使用。

AutoKeras 支持文本、圖像和結(jié)構(gòu)化數(shù)據(jù)，為初學(xué)者和尋求更多參與技術(shù)知識(shí)的人提供界面。AutoKeras 使用進(jìn)化神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索方法來減輕研究人員的繁重和模棱兩可的工作。

盡管 AutoKeras 的運(yùn)行需要很長(zhǎng)時(shí)間，但用戶可以指定參數(shù)來控制運(yùn)行時(shí)間、探索模型的數(shù)量以及搜索空間大小等。

AutoKeras 的相關(guān)內(nèi)容參閱以下兩個(gè)鏈接：

文檔地址：https://autokeras.com/

教程地址：https://towardsdatascience.com/automl-creating-top-performing-neural-networks-without-defining-architecture-c7d3b08cddc

四個(gè)庫各有特色，應(yīng)該選哪個(gè)？

用戶可以根據(jù)自己的需求選擇合適的 Python 庫，作者給出了以下幾個(gè)建議：

如果你的首要任務(wù)是獲取一個(gè)干凈、簡(jiǎn)單的界面和相對(duì)快速的結(jié)果，選擇 auto-sklearn。另外：該庫與 sklearn 自然集成，可以使用常用的模型和方法，能很好地控制時(shí)間；

如果你的首要任務(wù)是實(shí)現(xiàn)高準(zhǔn)確率，并且不需要考慮長(zhǎng)時(shí)間的訓(xùn)練，則使用 TPOT。額外收獲：為最佳模型輸出 Python 代碼；

如果你的首要任務(wù)是實(shí)現(xiàn)高準(zhǔn)確率，依然不需要考慮長(zhǎng)時(shí)間的訓(xùn)練，也可選擇使用 HyperOpt-sklearn。該庫強(qiáng)調(diào)模型的超參數(shù)優(yōu)化，是否富有成效取決于數(shù)據(jù)集和算法；

如果你需要神經(jīng)網(wǎng)絡(luò)（警告：不要高估它們的能力），就使用 AutoKeras，尤其是以文本或圖像形式出現(xiàn)時(shí)。訓(xùn)練確實(shí)需要很長(zhǎng)時(shí)間，但有很多措施可以控制時(shí)間和搜索空間大小。
責(zé)編AJX

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

自動(dòng)化

自動(dòng)化

+關(guān)注

關(guān)注
29

文章
5657

瀏覽量
79824
模型

模型

+關(guān)注

關(guān)注
1

文章
3383

瀏覽量
49337
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8456

瀏覽量
133190

評(píng)論

相關(guān)推薦

Labview聲音和振動(dòng)工具包示例文件Sound Level

Labview 聲音和振動(dòng)工具包示例文件，聲壓測(cè)試，有模擬和DAQ兩個(gè)文件。

發(fā)表于 01-05 09:15 ?0次下載

基于EasyGo Vs工具包和Nl veristand軟件進(jìn)行的永磁同步電機(jī)實(shí)時(shí)仿真

EasyGo Vs Addon是一款領(lǐng)先的FPGA仿真工具包軟件，它強(qiáng)大地連接了VeriStand軟件與Matlab/Simulink，為實(shí)時(shí)測(cè)試和驗(yàn)證領(lǐng)域帶來了前所未有的便利和效率，特別適用于汽車

發(fā)表于 11-27 11:28 ?452次閱讀

基于EasyGo Vs<b class='flag-5'>工具包</b>和Nl veristand軟件進(jìn)行的永磁同步電機(jī)實(shí)時(shí)仿真

語言模型自動(dòng)化的優(yōu)點(diǎn)

語言模型自動(dòng)化不僅優(yōu)化了信息處理流程，提高了工作效率，還促進(jìn)了跨文化交流，增強(qiáng)了人機(jī)交互的智能化水平。以下，是對(duì)語言模型自動(dòng)化優(yōu)點(diǎn)的梳理，由

發(fā)表于 11-26 11:17 ?161次閱讀

自動(dòng)化AI開發(fā)平臺(tái)功能介紹

自動(dòng)化AI開發(fā)平臺(tái)集成了多種算法、工具和框架，旨在幫助開發(fā)者更快速、高效地設(shè)計(jì)、訓(xùn)練、部署和管理AI模型。以下，AI部落小編將詳細(xì)介紹自動(dòng)化AI開發(fā)平臺(tái)的功能。

發(fā)表于 11-14 09:29 ?360次閱讀

AI大模型與深度學(xué)習(xí)的關(guān)系

AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系，它們互為促進(jìn)，相輔相成。以下是對(duì)兩者關(guān)系的介紹：一、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐：深度學(xué)習(xí)

發(fā)表于 10-23 15:25 ?1565次閱讀

labview字符串的四種表示各有什么特點(diǎn)

LabVIEW（Laboratory Virtual Instrument Engineering Workbench）是一種圖形化編程語言，廣泛用于數(shù)據(jù)采集、儀器控制、數(shù)據(jù)分析和自動(dòng)化

發(fā)表于 09-04 15:40 ?759次閱讀

【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

提高機(jī)器學(xué)習(xí)模型效果與性能的過程。而我對(duì)特征工程的理解就是從一堆數(shù)據(jù)里找出能表示這堆數(shù)據(jù)的最小數(shù)據(jù)集，而這個(gè)找出特征數(shù)據(jù)的過程就是信息提取。隨后給出了一系列定義，包括特征的最小最大縮放、特征的標(biāo)準(zhǔn)

發(fā)表于 08-14 18:00

matlab神經(jīng)網(wǎng)絡(luò)工具箱結(jié)果分析

神經(jīng)網(wǎng)絡(luò)是一種強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù)，廣泛應(yīng)用于各種領(lǐng)域，如圖像識(shí)別、語音識(shí)別、自然語言處理等。MATLAB提供了一個(gè)功能強(qiáng)大的神經(jīng)網(wǎng)絡(luò)工具箱，

發(fā)表于 07-03 10:32 ?733次閱讀

如何使用PyTorch建立網(wǎng)絡(luò)模型

PyTorch是一個(gè)基于Python的開源機(jī)器學(xué)習(xí)庫，因其易用性、靈活性和強(qiáng)大的動(dòng)態(tài)圖特性，在深度學(xué)習(xí)領(lǐng)域得到了廣泛應(yīng)用。本文將從PyTorch的基本概念、網(wǎng)絡(luò)

發(fā)表于 07-02 14:08 ?503次閱讀

機(jī)器學(xué)習(xí)在數(shù)據(jù)分析中的應(yīng)用

隨著大數(shù)據(jù)時(shí)代的到來，數(shù)據(jù)量的爆炸性增長(zhǎng)對(duì)數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具，通過訓(xùn)練

發(fā)表于 07-02 11:22 ?872次閱讀

機(jī)械自動(dòng)化是自動(dòng)化的一種嗎

引言 自動(dòng)化技術(shù)是指利用控制裝置對(duì)生產(chǎn)過程進(jìn)行控制，以實(shí)現(xiàn)生產(chǎn)過程的自動(dòng)化。機(jī)械自動(dòng)化是自動(dòng)化技術(shù)的一種，它主要涉及到使用機(jī)械設(shè)備和控制系統(tǒng)

發(fā)表于 07-01 09:32 ?1970次閱讀

藍(lán)牙模塊在工業(yè)自動(dòng)化中的應(yīng)用

隨著科技的快速發(fā)展，工業(yè)自動(dòng)化已成為現(xiàn)代工業(yè)生產(chǎn)的重要組成部分。藍(lán)牙模塊作為一種無線通信技術(shù)，其在工業(yè)自動(dòng)化領(lǐng)域的應(yīng)用日益廣泛。本文將探討藍(lán)牙模塊在工業(yè)自動(dòng)化領(lǐng)域的具體應(yīng)用場(chǎng)景，

發(fā)表于 06-20 17:29 ?555次閱讀

機(jī)器視覺技術(shù)在工業(yè)自動(dòng)化中的應(yīng)用

進(jìn)行采集、處理和分析，從而實(shí)現(xiàn)對(duì)目標(biāo)進(jìn)行識(shí)別、檢測(cè)、測(cè)量和控制的功能。本文將從機(jī)器視覺技術(shù)的定義、原理、特點(diǎn)及其在工業(yè)自動(dòng)化中的應(yīng)用等方面進(jìn)行詳細(xì)闡述。

發(fā)表于 06-17 10:22 ?1019次閱讀

機(jī)器視覺檢測(cè)技術(shù)在工業(yè)自動(dòng)化中的應(yīng)用

隨著科技的飛速發(fā)展，工業(yè)自動(dòng)化已成為現(xiàn)代工業(yè)生產(chǎn)的核心動(dòng)力。在這個(gè)背景下，機(jī)器視覺檢測(cè)技術(shù)作為工業(yè)自動(dòng)化中的關(guān)鍵技術(shù)之一，以其高精度、高效率、高可靠性的優(yōu)勢(shì)，在工業(yè)自動(dòng)化領(lǐng)域得到了廣泛

發(fā)表于 06-07 12:06 ?991次閱讀

一種利用光電容積描記（PPG）信號(hào)和深度學(xué)習(xí)模型對(duì)高血壓分類的新方法

[22]。就像平均池化一樣，最大池化是另一種用于減小特征圖大小的常用方法。它通過僅取每個(gè)區(qū)域的最大值來獲得最重要的特征。在機(jī)器學(xué)習(xí)中，池

發(fā)表于 05-11 20:01

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

分析四種自動(dòng)化的機(jī)器學(xué)習(xí)工具包，更好地建立網(wǎng)絡(luò)模型

評(píng)論

Labview聲音和振動(dòng)工具包示例文件Sound Level

基于EasyGo Vs工具包和Nl veristand軟件進(jìn)行的永磁同步電機(jī)實(shí)時(shí)仿真

語言模型自動(dòng)化的優(yōu)點(diǎn)

自動(dòng)化AI開發(fā)平臺(tái)功能介紹

AI大模型與深度學(xué)習(xí)的關(guān)系

labview字符串的四種表示各有什么特點(diǎn)

【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

matlab神經(jīng)網(wǎng)絡(luò)工具箱結(jié)果分析

如何使用PyTorch建立網(wǎng)絡(luò)模型

機(jī)器學(xué)習(xí)在數(shù)據(jù)分析中的應(yīng)用

機(jī)械自動(dòng)化是自動(dòng)化的一種嗎

藍(lán)牙模塊在工業(yè)自動(dòng)化中的應(yīng)用

機(jī)器視覺技術(shù)在工業(yè)自動(dòng)化中的應(yīng)用

機(jī)器視覺檢測(cè)技術(shù)在工業(yè)自動(dòng)化中的應(yīng)用

一種利用光電容積描記（PPG）信號(hào)和深度學(xué)習(xí)模型對(duì)高血壓分類的新方法

搜索歷史

分析四種自動(dòng)化的機(jī)器學(xué)習(xí)工具包，更好地建立網(wǎng)絡(luò)模型

評(píng)論

分析四種自動(dòng)化的機(jī)器學(xué)習(xí)工具包，更好地建立網(wǎng)絡(luò)模型