在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python機(jī)器學(xué)習(xí)庫(kù)談Scikit-learn技術(shù)

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:NewBeeNLP公眾號(hào) ? 作者:Rebecca Vickery ? 2020-08-27 17:34 ? 次閱讀

Scikit-learn是使用最廣泛的Python機(jī)器學(xué)習(xí)庫(kù)之一。它有標(biāo)準(zhǔn)化和簡(jiǎn)單的接口,用于數(shù)據(jù)預(yù)處理和模型訓(xùn)練、優(yōu)化以及評(píng)估。

這個(gè)項(xiàng)目最初是由David Cournapeau 開(kāi)發(fā)的Google Summer of Code 項(xiàng)目,并于2010年首次公開(kāi)發(fā)布。自創(chuàng)建以來(lái),該庫(kù)已經(jīng)發(fā)展成為一個(gè)豐富的生態(tài)系統(tǒng),用于開(kāi)發(fā)機(jī)器學(xué)習(xí)模型。隨著時(shí)間的推移,該項(xiàng)目開(kāi)發(fā)了許多方便的功能,以增強(qiáng)其易用性。在本文中,我將介紹你可能不知道的10個(gè)關(guān)于Scikit-learn最有用的特性。

1. 內(nèi)置數(shù)據(jù)集

Scikit-learn API內(nèi)置了各種toy和real-world數(shù)據(jù)集[1]。這些可以便捷地通過(guò)一行代碼訪問(wèn),如果你正在學(xué)習(xí)或只是想快速嘗試新功能,這會(huì)非常有用。

你還可以使用make_regression()、make_blobs()和make_classification()生成合成數(shù)據(jù)集。所有加載實(shí)用程序都提供了返回已拆分為X(特征)和y(目標(biāo))的數(shù)據(jù)選項(xiàng),以便它們可以直接用于訓(xùn)練模型。

2. 獲取公開(kāi)數(shù)據(jù)集

如果你想直接通過(guò)Scikit-learn訪問(wèn)更多的公共可用數(shù)據(jù)集,請(qǐng)了解,有一個(gè)方便的函數(shù)datasets.fetch_openml,可以讓您直接從openml.org網(wǎng)站[2]獲取數(shù)據(jù)。這個(gè)網(wǎng)站包含超過(guò)21000個(gè)不同的數(shù)據(jù)集,可以用于機(jī)器學(xué)習(xí)項(xiàng)目。

3. 內(nèi)置分類器來(lái)訓(xùn)練baseline

在為項(xiàng)目開(kāi)發(fā)機(jī)器學(xué)習(xí)模型時(shí),首先創(chuàng)建一個(gè)baseline模型是非常有必要的。這個(gè)模型在本質(zhì)上應(yīng)該是一個(gè)“dummy”模型,比如一個(gè)總是預(yù)測(cè)最頻繁出現(xiàn)的類的模型。這就提供了一個(gè)基準(zhǔn),用來(lái)對(duì)你的“智能”模型進(jìn)行基準(zhǔn)測(cè)試,這樣你就可以確保它的性能比隨機(jī)結(jié)果更好。

Scikit learn包括用于分類任務(wù)的DummyClassifier() 和用于基于回歸問(wèn)題的 DummyRegressor()。

4. 內(nèi)置繪圖api

Scikit learn有一個(gè)內(nèi)置的繪圖API,允許你在不導(dǎo)入任何其他庫(kù)的情況下可視化模型性能。包括以下繪圖:部分相關(guān)圖、混淆矩陣、精確召回曲線和ROC曲線。

5. 內(nèi)置特征選擇方法

提高模型性能的一種技術(shù)是只使用最好的特征集或通過(guò)刪除冗余特征來(lái)訓(xùn)練模型。這個(gè)過(guò)程稱為特征選擇。

Scikit learn有許多函數(shù)來(lái)執(zhí)行特征選擇。一個(gè)示例為 SelectPercentile(),該方法根據(jù)所選的統(tǒng)計(jì)方法選擇性能最好的X百分位特征進(jìn)行評(píng)分。

6. 機(jī)器學(xué)習(xí)pipeline

除了為機(jī)器學(xué)習(xí)提供廣泛的算法外,Scikit learn還具有一系列用于「預(yù)處理」「轉(zhuǎn)換數(shù)據(jù)」的功能。為了促進(jìn)機(jī)器學(xué)習(xí)工作流程的再現(xiàn)性和簡(jiǎn)單性,Scikit learn創(chuàng)建了管道(pipeline),允許將大量預(yù)處理步驟與模型訓(xùn)練階段鏈接在一起。

管道將工作流中的所有步驟存儲(chǔ)為單個(gè)實(shí)體,可以通過(guò)「fit」「predict」方法調(diào)用該實(shí)體。在管道對(duì)象上調(diào)用fit方法時(shí),預(yù)處理步驟和模型訓(xùn)練將自動(dòng)執(zhí)行。

7. ColumnTransformer

在許多數(shù)據(jù)集中,你將擁有不同類型的特征,需要應(yīng)用不同的預(yù)處理步驟。例如,可能有分類數(shù)據(jù)和連續(xù)數(shù)據(jù)的混合,你可能希望通過(guò)one-hot編碼將分類數(shù)據(jù)轉(zhuǎn)換為數(shù)字,并縮放數(shù)字變量。

Scikit-learn管道有一個(gè)名為ColumnTransformer的函數(shù),它允許你通過(guò)索引或指定列名來(lái)輕松指定要對(duì)哪些列應(yīng)用最適當(dāng)?shù)念A(yù)處理。

8. 管道的HTML形式

管道通常會(huì)變得非常復(fù)雜,尤其是在處理真實(shí)世界的數(shù)據(jù)時(shí)。因此,scikit-learn提供了一種方法來(lái)輸出管道中步驟的HTML圖表[3],非常方便。

9. 可視化 樹(shù)模型

plot_tree() 函數(shù)允許你創(chuàng)建決策樹(shù)模型中的步驟圖。

10. 豐富的第三方擴(kuò)展

許多第三方庫(kù)可以更好地?cái)U(kuò)展scikit-learn的特性。舉個(gè)栗子,category-encoders庫(kù),它為分類特性提供了更大范圍的預(yù)處理方法,以及ELI5包以實(shí)現(xiàn)更大的模型可解釋性。這兩個(gè)包也可以直接在Scikit-learn管道中使用。

本文參考資料

[1]toy和real-world數(shù)據(jù)集: https://scikit-learn.org/stable/datasets/index.html

[2]openml.org網(wǎng)站: https://www.openml.org/home

[3]HTML圖表: https://scikit-learn.org/stable/modules/compose.html#visualizing-composite-estimators

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8492

    瀏覽量

    134122
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4825

    瀏覽量

    86223

原文標(biāo)題:關(guān)于Scikit-Learn你(也許)不知道的10件事

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    基于瑞芯微米爾RK3576開(kāi)發(fā)板創(chuàng)建機(jī)器學(xué)習(xí)環(huán)境

    及開(kāi)發(fā)板】具有6TpsNPU以及GPU,因此是學(xué)習(xí)機(jī)器學(xué)習(xí)的好環(huán)境,為此結(jié)合《深度學(xué)習(xí)的數(shù)學(xué)——使用Python語(yǔ)言》 1、使用vscode 連接遠(yuǎn)程開(kāi)發(fā)板 2、使用conda新建虛
    發(fā)表于 02-08 14:44

    如何使用Python構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)模型

    : NumPy:用于數(shù)學(xué)運(yùn)算。 TensorFlow:一個(gè)開(kāi)源機(jī)器學(xué)習(xí)庫(kù),Keras是其高級(jí)API。 Keras:用于構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型。 你可以使用pip來(lái)安裝這些
    的頭像 發(fā)表于 11-13 10:10 ?1411次閱讀

    RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫(kù)

    RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫(kù)?還請(qǐng)壇友們多多指教一下。
    發(fā)表于 10-10 22:24

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】時(shí)間序列的信息提取

    個(gè)重要環(huán)節(jié),目標(biāo)是從給定的時(shí)間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預(yù)測(cè)任務(wù)。 特征工程(Feature Engineering)是將數(shù)據(jù)轉(zhuǎn)換為更好地表示潛在問(wèn)題的特征,從而提高機(jī)器學(xué)習(xí)
    發(fā)表于 08-17 21:12

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 時(shí)間序列的信息提取

    之前對(duì)《時(shí)間序列與機(jī)器學(xué)習(xí)》一書進(jìn)行了整體瀏覽,并且非常輕松愉快的完成了第一章的學(xué)習(xí),今天開(kāi)始學(xué)習(xí)第二章“時(shí)間序列的信息提取”。 先粗略的翻閱第二章,內(nèi)容復(fù)雜,充斥了大量的定義、推導(dǎo)計(jì)
    發(fā)表于 08-14 18:00

    pytorch和python的關(guān)系是什么

    在當(dāng)今的人工智能領(lǐng)域,Python已經(jīng)成為了最受歡迎的編程語(yǔ)言之一。Python的易學(xué)易用、豐富的庫(kù)和框架以及強(qiáng)大的社區(qū)支持,使其成為了數(shù)據(jù)科學(xué)、機(jī)器
    的頭像 發(fā)表于 08-01 15:27 ?3094次閱讀

    Python在AI中的應(yīng)用實(shí)例

    Python在人工智能(AI)領(lǐng)域的應(yīng)用極為廣泛且深入,從基礎(chǔ)的數(shù)據(jù)處理、模型訓(xùn)練到高級(jí)的應(yīng)用部署,Python都扮演著至關(guān)重要的角色。以下將詳細(xì)探討Python在AI中的幾個(gè)關(guān)鍵應(yīng)用實(shí)例,包括
    的頭像 發(fā)表于 07-19 17:16 ?2421次閱讀

    Python自動(dòng)訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)

    人工神經(jīng)網(wǎng)絡(luò)(ANN)是機(jī)器學(xué)習(xí)中一種重要的模型,它模仿了人腦神經(jīng)元的工作方式,通過(guò)多層節(jié)點(diǎn)(神經(jīng)元)之間的連接和權(quán)重調(diào)整來(lái)學(xué)習(xí)和解決問(wèn)題。Python由于其強(qiáng)大的
    的頭像 發(fā)表于 07-19 11:54 ?627次閱讀

    AI訓(xùn)練的基本步驟

    AI(人工智能)訓(xùn)練是一個(gè)復(fù)雜且系統(tǒng)的過(guò)程,它涵蓋了從數(shù)據(jù)收集到模型部署的多個(gè)關(guān)鍵步驟。以下是對(duì)AI訓(xùn)練過(guò)程的詳細(xì)闡述,包括每個(gè)步驟的具體內(nèi)容,并附有相關(guān)代碼示例(以Pythonscikit-learn庫(kù)為例)。
    的頭像 發(fā)表于 07-17 16:57 ?4795次閱讀

    opencv-python和opencv一樣嗎

    不一樣。OpenCV(Open Source Computer Vision Library)是一個(gè)開(kāi)源的計(jì)算機(jī)視覺(jué)和機(jī)器學(xué)習(xí)軟件庫(kù),它提供了大量的圖像和視頻處理功能。OpenCV-Pytho
    的頭像 發(fā)表于 07-16 10:38 ?1939次閱讀

    基于Python的深度學(xué)習(xí)人臉識(shí)別方法

    基于Python的深度學(xué)習(xí)人臉識(shí)別方法是一個(gè)涉及多個(gè)技術(shù)領(lǐng)域的復(fù)雜話題,包括計(jì)算機(jī)視覺(jué)、深度學(xué)習(xí)、以及圖像處理等。在這里,我將概述一個(gè)基本的流程,包括數(shù)據(jù)準(zhǔn)備、模型選擇、訓(xùn)練過(guò)程、以及
    的頭像 發(fā)表于 07-14 11:52 ?1584次閱讀

    DongshanPI-AICT全志V853開(kāi)發(fā)板搭建YOLOV5-V6.0環(huán)境

    # onnx-simplifier>=0.3.6# ONNX simplifier # scikit-learn==0.19.2# CoreML quantization
    發(fā)表于 07-12 09:59

    深度學(xué)習(xí)常用的Python庫(kù)

    深度學(xué)習(xí)作為人工智能的一個(gè)重要分支,通過(guò)模擬人類大腦中的神經(jīng)網(wǎng)絡(luò)來(lái)解決復(fù)雜問(wèn)題。Python作為一種流行的編程語(yǔ)言,憑借其簡(jiǎn)潔的語(yǔ)法和豐富的庫(kù)支持,成為了深度學(xué)習(xí)研究和應(yīng)用的首選工具。
    的頭像 發(fā)表于 07-03 16:04 ?1077次閱讀

    如何使用Python進(jìn)行神經(jīng)網(wǎng)絡(luò)編程

    神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介 神經(jīng)網(wǎng)絡(luò)是一種受人腦啟發(fā)的機(jī)器學(xué)習(xí)模型,由大量的節(jié)點(diǎn)(或稱為“神經(jīng)元”)組成,這些節(jié)點(diǎn)在網(wǎng)絡(luò)中相互連接。每個(gè)節(jié)點(diǎn)可以接收輸入,對(duì)輸入進(jìn)行加權(quán)求和,然后通過(guò)一個(gè)激活函數(shù)產(chǎn)生輸出
    的頭像 發(fā)表于 07-02 09:58 ?703次閱讀

    ESP32下如何加自定義Python庫(kù)

    我看官方有提供Micropython的bin文件,但我想根據(jù)自己外設(shè)擴(kuò)充一下Python庫(kù),這個(gè)應(yīng)該從哪里入手? 之前做過(guò)RTT系統(tǒng)的python庫(kù)擴(kuò)充,RTT有提供Micropyth
    發(fā)表于 06-18 06:27
    主站蜘蛛池模板: 精品国产欧美一区二区最新 | 亚洲天天看 | 欧美人与牲动交xxxx | 四虎影视院 | 欧美国产精品主播一区 | 美女黄页在线观看 | 欧美tube6最新69 | 欧美黄色xxx | 精品国产自在在线在线观看 | 四虎在线永久视频观看 | 日本与大黑人xxxx | 在线h网站 | 乱人伦的小说 | 国产在线视频资源 | 中文字幕一区在线观看 | 国产高清在线 | 男女透逼视频 | 久久婷婷午色综合夜啪 | 1024久久| 深爱婷婷 | 精品一区亚洲 | 国产黄色网页 | 特级毛片a级毛免费播放 | 久久综合狠狠综合久久 | 人人看人人做人人爱精品 | 免费国产小视频 | 日日噜噜噜噜人人爽亚洲精品 | 久久免费精品国产72精品剧情 | 午夜视频在线观看免费视频 | 成片一卡三卡四卡免费网站 | 日韩亚洲人成在线综合日本 | 亚洲综合色就色手机在线观看 | 性夜影院爽黄a爽免费看网站 | 久久久国产在线 | 女的扒开尿口让男人桶爽 | 涩久久 | 天天干天天草天天射 | 在线观看视频免费入口 | 免费网站啪啪大全 | 欧美福利精品 | 天天做天天爱天天爽综合区 |