我們總說(shuō)“不要重復(fù)發(fā)明輪子”,python 中的第 3 方工具庫(kù)就是最好的例子。借助它們,我們可以用簡(jiǎn)單的方式編寫(xiě)復(fù)雜且耗時(shí)的代碼。在本篇內(nèi)容中給大家整理了 7 個(gè)有用的 Python 庫(kù),如果大家從事機(jī)器學(xué)習(xí)工作,一定要來(lái)一起了解一下。1.Prophet
Prophet是 Facebook 開(kāi)源的時(shí)間序列預(yù)測(cè)工具庫(kù),基于 Stan 框架,可以自動(dòng)檢測(cè)時(shí)間序列中的趨勢(shì)、周期性和節(jié)假日效應(yīng),并根據(jù)這些信息進(jìn)行預(yù)測(cè)。這個(gè)庫(kù)在 GitHub 上有超過(guò) 15k 星。
![47a532da-8136-11ed-8abf-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9E/5F/wKgZomToFo-AHyViAAGS1MpfQfA359.png)
# Pythonforecast = m.predict(future)forecast[['ds', 'yhat', 'yhat_lower', 'yhat_upper']].tail()
2.Deep Lake
Deep Lake是一種數(shù)據(jù)集格式,提供簡(jiǎn)單的 API 以用于創(chuàng)建、存儲(chǔ)和協(xié)作處理任何規(guī)模的 AI 數(shù)據(jù)集。這個(gè)庫(kù)在 GitHub 上有超過(guò) 5k 星。![480bd30a-8136-11ed-8abf-dac502259ad0.png](https://file1.elecfans.com//web2/M00/9E/5F/wKgZomToFo-AA1CdAAV3eEw_jUg183.png)
for epoch in range(2): running_loss = 0.0 for i, data in enumerate(deeplake_loader): images, labels = data['images'], data['labels'] # zero the parameter gradients optimizer.zero_grad() # forward + backward + optimize outputs = net(images) loss = criterion(outputs, labels.reshape(-1)) loss.backward() optimizer.step() # print statistics running_loss += loss.item() if i % 100 == 99: #print every 100 mini-batches print('[%d, %5d] loss: %.3f' % (epoch + 1, i + 1, running_loss / 100)) running_loss = 0.0
3.Optuna
Optuna 是一個(gè)自動(dòng)機(jī)器學(xué)習(xí)超參數(shù)調(diào)優(yōu)工具,可以幫助用戶(hù)通過(guò)使用各種規(guī)則自動(dòng)調(diào)整機(jī)器學(xué)習(xí)模型的超參數(shù),以提高模型的性能。這個(gè)庫(kù)在 GitHub 上擁有超過(guò) 7k 顆星。
import ... # Define an objective function to be minimized.def objective(trial): # Invoke suggest methods of a Trial object to generate hyperparameters regressor_name = trial.suggest_categorical('regressor',['SVR', 'RandomForest']) if regressor_name = 'SVR': svr_c = trial.suggest_float('svr_c', 1e-10, 1e10, log=True) regressor_obj = sklearn.svm.SVR(C=svr_c) else: rf_max_depth = trial.suggest_int('rf_max_depth', 2, 332) regressor_obj = sklearn.ensemble.RandomForestRegressor(max_depth=rf_max_depth) X, y = sklearn.datasets.fetch_california_housing(return_X_y=True) X_train, X_val, y_train, y_val = sklearn.model_selection.train_test_split(X, y, random_state=0) regressor_obj.fit(X_train, y_train) y_pred = regressor_obj.predict(X_val) error = sklearn.metrics.mean_squared_error(y_val, y_pred) return error # An objective value linked with the Trial object. study = optuna.create_study() # Create a neW studystudy.optimize(objective, n_trials=100) # Invoke opotimization of the objective function
4.pycm
pycm是一個(gè)用于計(jì)算二分類(lèi)和多分類(lèi)指標(biāo)的 Python 庫(kù)。這個(gè)庫(kù)在 GitHub 上有超過(guò) 1k 星。
它可以計(jì)算多種常用的指標(biāo),包括準(zhǔn)確率、召回率、F1值、混淆矩陣等。此外,pycm 還提供了一些額外的功能,例如可視化混淆矩陣、評(píng)估模型性能的指標(biāo)來(lái)源差異等。pycm是一個(gè)非常實(shí)用的庫(kù),可以幫助快速評(píng)估模型的性能。
from pycm import *y_actu = [2, 0, 2, 2, 0, 1, 1, 2, 2, 0, 1, 2] y_pred = [0, 0, 2, 1, 0, 2, 1, 0, 2, 2, 2, 2] cm = ConfusionMatrix(actual_vector=y_actu, predict_vector=y_pred) cm.classes cm.print_matrix() cm.print_normalized_matrix()
5.NannyML
NannyML是一個(gè)開(kāi)源的 Python 庫(kù),允許估算部署后的模型性能(而無(wú)需訪問(wèn)目標(biāo)),檢測(cè)數(shù)據(jù)漂移,并智能地將數(shù)據(jù)漂移警報(bào)鏈接回模型性能的變化。這個(gè)庫(kù)在 GitHub 上有超過(guò) 1k 星。
為數(shù)據(jù)科學(xué)家設(shè)計(jì)的 NannyML 具有易于使用的交互式可視化界面,目前支持所有表格式的用例(tabular use cases)、分類(lèi)(classification)和回歸(regression)。NannyML 的核心貢獻(xiàn)者研發(fā)了多種用于估算模型性能的新算法:基于信心的性能估算(CBPE)與直接損失估算(DLE)等。NannyML 通過(guò)構(gòu)建“性能監(jiān)控+部署后數(shù)據(jù)科學(xué)”的閉環(huán),使數(shù)據(jù)科學(xué)家能夠快速理解并自動(dòng)檢測(cè)靜默模型故障。通過(guò)使用 NannyML,數(shù)據(jù)科學(xué)家最終可以保持對(duì)他們部署的機(jī)器學(xué)習(xí)模型的完全可見(jiàn)性和信任。
import nannyml as nmlfrom IPython.display import display # Load synthetic data reference, analysis, analysis_target = nml.load_synthnetic_binary_classification_dataset()display(reference.head())display(analysis.head()) # Choose a chunker or set a chunk sizechunk size = 5000 # initialize, specify required data columns,, fit estimator and estimateestimator = nml.CBPE( y_pred_proba='y_pred_proba', y_pred='y_pred', y_true='work_home_actual', metrics=['roc_auc'], chunk_size=chunk_size, problem_type='classification_binary',)estimator = estimator.fit(reference)estimated_performance = estimator.estimate(analysis) # Show resultsfigure = estimated_performance.plot(kind='performance', metric='roc_auc', plot_reference=True)figure.show()
6.ColossalAI
ColossalAI是一個(gè)開(kāi)源機(jī)器學(xué)習(xí)工具庫(kù),用于構(gòu)建和部署高質(zhì)量的深度學(xué)習(xí)模型。這個(gè)庫(kù)在 GitHub 上有超過(guò) 6.5k 星。
ColossalAI 提供了一系列預(yù)定義的模型和模型基礎(chǔ)架構(gòu),可用于快速構(gòu)建和訓(xùn)練模型。它還提供了一系列工具,用于模型評(píng)估,調(diào)優(yōu)和可視化,以確保模型的高質(zhì)量和準(zhǔn)確性。此外,ColossalAI 還支持部署模型,使其能夠通過(guò)各種不同的接口與其他系統(tǒng)集成。ColossalAI 的優(yōu)勢(shì)在于它易于使用,可以為數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師提供快速和有效的方法來(lái)構(gòu)建和部署高質(zhì)量的大型模型。
from colossalai.logging import get_dist_loggerfrom colossalai.trainer import Trainer, hooks # build components and initialize with colossaalai.initialize... # create a logger so that trainer can log on thhe consolelogger = get_dist_logger() # create a trainer objecttrainer = Trainer( engine=engine, logger=logger)
7.emcee
emcee是一個(gè)開(kāi)源的 Python 庫(kù),用于使用 Markov chain Monte Carlo(MCMC)方法進(jìn)行模型擬合和參數(shù)估計(jì)。這個(gè)庫(kù)在 GitHub 上有超過(guò) 1k 星。
import numpy as npimport emcee def log_prob(x, ivar): return -0.5 * np.sum(ivar * x ** 2) ndim, nwalkers = 5, 100 ivar = 1./np.random.rand(ndim)p0 = np.random.randn(nwalkers, ndim) sampler = emcee.EnsembleSampler(nwalkers, ndim, log_prob, args=[ivar])sampler.run_mcmc(p0, 10000)
總結(jié)
以上就是給大家做的工具庫(kù)介紹,這7個(gè)工具庫(kù)都是非常有用的,對(duì)于機(jī)器學(xué)習(xí)工作者來(lái)說(shuō),它們可以大大提高工作效率,讓你能夠在簡(jiǎn)單的方式下編寫(xiě)復(fù)雜的代碼。所以,如果你還沒(méi)有了解這些工具庫(kù)的話(huà),不妨花一點(diǎn)時(shí)間來(lái)了解一下。
-
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8425瀏覽量
132776 -
python
+關(guān)注
關(guān)注
56文章
4800瀏覽量
84823 -
GitHub
+關(guān)注
關(guān)注
3文章
472瀏覽量
16494
原文標(biāo)題:【推薦】7個(gè)強(qiáng)大實(shí)用的Python機(jī)器學(xué)習(xí)庫(kù)!
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
傳統(tǒng)機(jī)器學(xué)習(xí)方法和應(yīng)用指導(dǎo)
![傳統(tǒng)<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法和應(yīng)用指導(dǎo)](https://file1.elecfans.com/web3/M00/04/33/wKgZPGdx9NKAcZdAAABMVybzcFI029.png)
一個(gè)月速成python+OpenCV圖像處理
![一<b class='flag-5'>個(gè)</b>月速成<b class='flag-5'>python</b>+OpenCV圖像處理](https://file1.elecfans.com/web3/M00/00/7F/wKgZPGdJlvGANv8EAAAl3WfWse8658.png)
評(píng)論