91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

干貨:直觀地解釋和可視化每個復雜的 DataFrame 操作

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-14 21:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

大多數數據科學家可能會贊揚Pandas進行數據準備的能力,但許多人可能無法利用所有這些能力。操作數據幀可能很快會成為一項復雜的任務,因此在Pandas中的八種技術中均提供了說明,可視化,代碼和技巧來記住如何做。

Pandas提供了各種各樣的DataFrame操作,但是其中許多操作很復雜,而且似乎不太平易近人。本文介紹了8種基本的DataFrame操作方法,它們涵蓋了數據科學家需要知道的幾乎所有操作功能。每種方法都將包括說明,可視化,代碼以及記住它的技巧。

Pivot

透視表將創建一個新的“透視表”,該透視表將數據中的現有列投影為新表的元素,包括索引,列和值。初始DataFrame中將成為索引的列,并且這些列顯示為唯一值,而這兩列的組合將顯示為值。這意味著Pivot無法處理重復的值。

旋轉名為df的DataFrame的代碼如下:

記?。篜ivot——是在數據處理領域之外——圍繞某種對象的轉向。在體育運動中,人們可以繞著腳“旋轉”旋轉:大熊貓的旋轉類似于。原始DataFrame的狀態圍繞DataFrame的中心元素旋轉到一個新元素。有些元素實際上是在旋轉或變換的(例如,列“bar”),因此很重要。

Melt

Melt可以被認為是“不可透視的”,因為它將基于矩陣的數據(具有二維)轉換為基于列表的數據(列表示值,行表示唯一的數據點),而樞軸則相反。考慮一個二維矩陣,其一維為“B”和“C”(列名),另一維為“a”,“b”和“c”(行索引)。

我們選擇一個ID,一個維度和一個包含值的列/列。包含值的列將轉換為兩列:一列用于變量(值列的名稱),另一列用于值(變量中包含的數字)。

結果是ID列的值(a,b,c)和值列(B,C)及其對應值的每種組合,以列表格式組織。

可以像在DataFramedf上一樣執行Mels操作:

記?。合裣灎T一樣融化(Melt)就是將凝固的復合物體變成幾個更小的單個元素(蠟滴)。融合二維DataFrame可以解壓縮其固化的結構并將其片段記錄為列表中的各個條目。

Explode

是一種擺脫數據列表的有用方法。當一列爆炸時,其中的所有列表將作為新行列在同一索引下(為防止發生這種情況,此后只需調用.reset/_index()即可)。諸如字符串或數字之類的非列表項不受影響,空列表是NaN值(您可以使用.dropna()清除它們)。

在DataFramedf中Explode列“A”非常簡單:

要記?。篍xplode某物會釋放其所有內部內容-Explode列表會分隔其元素。

Stack

堆疊采用任意大小的DataFrame,并將列“堆疊”為現有索引的子索引。因此,所得的DataFrame僅具有一列和兩級索引。

堆疊名為df的表就像df.stack()一樣簡單。

為了訪問狗的身高值,只需兩次調用基于索引的檢索,例如df.loc ['dog']。loc ['height']。

要記?。簭耐庥^上看,堆棧采用表的二維性并將列堆棧為多級索引。

Unstack

取消堆疊將獲取多索引DataFrame并對其進行堆疊,將指定級別的索引轉換為具有相應值的新DataFrame的列。在表上調用堆棧后再調用堆棧不會更改該堆棧(原因是存在“0”)。

堆疊中的參數是其級別。在列表索引中,索引為-1將返回最后一個元素。這與水平相同。級別-1表示將取消堆疊最后一個索引級別(最右邊的一個)。作為另一個示例,當級別設置為0(第一個索引級別)時,其中的值將成為列,而隨后的索引級別(第二個索引級別)將成為轉換后的DataFrame的索引。

可以按照與堆疊相同的方式執行堆疊,但是要使用level參數:df.unstack(level = -1)。

Merge

合并兩個DataFrame是在共享的“鍵”之間按列(水平)組合它們。此鍵允許將表合并,即使它們的排序方式不一樣。完成的合并DataFrame默認情況下會將后綴/_x和/_y添加到value列。

為了合并兩個DataFramedf1和df2(其中df1包含leftkey,而df2包含rightkey),請調用:

合并不是pandas的功能,而是附加到DataFrame。始終假定合并所在的DataFrame是“左表”,在函數中作為參數調用的DataFrame是“右表”,并帶有相應的鍵。

默認情況下,合并功能執行內部聯接:如果每個DataFrame的鍵名均未列在另一個鍵中,則該鍵不包含在合并的DataFrame中。另一方面,如果一個鍵在同一DataFrame中列出兩次,則在合并表中將列出同一鍵的每個值組合。例如,如果df1具有3個鍵foo值,而df2具有2個相同鍵的值,則在最終DataFrame中將有6個條目,其中leftkey = foo和rightkey = foo。

記?。汉喜祿拖裨谒叫旭倳r合并車道一樣。想象一下,每一列都是高速公路上的一條車道。為了合并,它們必須水平合并。

Join

通常,聯接比合并更可取,因為它具有更簡潔的語法,并且在水平連接兩個DataFrame時具有更大的可能性。連接的語法如下:

使用聯接時,公共鍵列(類似于合并中的right/_on和left/_on)必須命名為相同的名稱。how參數是一個字符串,它表示四種連接方法之一,可以合并兩個DataFrame:

'left':包括df1的所有元素,僅當其鍵為df1的鍵時才包含df2的元素。否則,df2的合并DataFrame的丟失部分將被標記為NaN。

'right':'left',但在另一個DataFrame上。包括df2的所有元素,僅當其鍵是df2的鍵時才包含df1的元素。

“outer”:包括來自DataFrames所有元素,即使密鑰不存在于其他的-缺少的元素被標記為NaN的。

“inner”:僅包含元件的鍵是存在于兩個數據幀鍵(交集)。默認合并。

記?。喝绻褂眠^SQL,則單詞“ join”應立即與按列添加相聯系。如果不是,則“ join”和“ merge”在定義方面具有非常相似的含義。

Concat

合并和連接是水平工作,串聯或簡稱為concat,而DataFrame是按行(垂直)連接的。例如,考慮使用pandas.concat([df1,df2])串聯的具有相同列名的兩個DataFramedf1和df2:

盡管可以通過將axis參數設置為1來使用concat進行列式聯接,但是使用聯接會更容易。

請注意,concat是pandas函數,而不是DataFrame之一。因此,它接受要連接的DataFrame列表。

如果一個DataFrame的另一列未包含,默認情況下將包含該列,缺失值列為NaN。為了防止這種情況,請添加一個附加參數join ='inner',該參數只會串聯兩個DataFrame共有的列。

切記:在列表和字符串中,可以串聯其他項。串聯是將附加元素附加到現有主體上,而不是添加新信息(就像逐列聯接一樣)。由于每個索引/行都是一個單獨的項目,因此串聯將其他項目添加到DataFrame中,這可以看作是行的列表。

Append是組合兩個DataFrame的另一種方法,但它執行的功能與concat相同,效率較低且用途廣泛。

-

審核編輯 黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據
    +關注

    關注

    8

    文章

    7257

    瀏覽量

    91937
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    開關柜防誤可視化順控操作為什么有必要做?

    蜀瑞創新科普:開關柜防誤可視化順控操作(通常指基于可視化技術的順序控制防誤操作)即使在已有傳統五防系統的基礎上,仍然具有重要的現實意義和必要性,主要原因如下:
    的頭像 發表于 05-29 09:22 ?107次閱讀
    開關柜防誤<b class='flag-5'>可視化</b>順控<b class='flag-5'>操作</b>為什么有必要做?

    工業設備可視化管理系統是什么

    工業設備可視化管理系統是一種基于物聯網(IoT)、大數據、云計算、數字孿生等技術,對工業設備的運行狀態、性能參數、維護信息等進行實時監測、數據整合與可視化呈現的智能管理平臺。它通過將復雜的設備數據
    的頭像 發表于 05-27 14:56 ?221次閱讀
    工業設備<b class='flag-5'>可視化</b>管理系統是什么

    可視化組態物聯網平臺是什么

    可視化含義:組態是一種用于構建復雜物聯網系統的工具,它提供了豐富的圖形組件和可視化元素,使得用戶可以通過簡單的拖拽操作來創建自定義的界面。
    的頭像 發表于 04-21 10:40 ?305次閱讀

    工業可視化監控平臺可以接入哪些設備數據

    隨著工業 4.0 和智能制造的快速發展,工業生產正朝著數字、智能方向邁進。在這一進程中,工業可視化監控平臺發揮著舉足輕重的作用。它就像是工業生產的 “智慧大腦” 和 “千里眼”,能夠將復雜
    的頭像 發表于 02-25 16:29 ?334次閱讀
    工業<b class='flag-5'>可視化</b>監控平臺可以接入哪些設備數據

    VirtualLab Fusion中的可視化設置

    摘要 VirtualLab Fusion中的全局選項對話框可以輕松定制軟件的外觀和感覺。還可以保存和加載全局選項文件,以便可以輕松地將偏好設置從一個設備轉移到另一個設備。本文檔說明了與可視化和結果
    發表于 02-25 08:51

    VirtualLab Fusion應用:光波導k域布局可視化(“神奇的圓環”)

    特定光波導布局的光導和耦合條件。 概念 方向轉換器計算器 可以通過“開始”>“計算器”找到方向轉換器計算器,這有助于演示指定角度的不同方式。 k域可視化 k域可視化:平面波的傳播
    發表于 02-21 08:53

    七款經久不衰的數據可視化工具!

    數據量的激增,單純通過數字和文本來分析數據已不再高效。數據可視化則提供了一種直觀、互動性強的方式,幫助人們通過視覺元素,如柱狀圖、折線圖、餅圖、熱力圖等圖表形式,理解復雜的數據關系。 二、數據
    發表于 01-19 15:24

    什么是大屏數據可視化?特點有哪些?

    大屏數據可視化是指通過大屏幕展示大量數據和信息,以直觀、可視化的方式幫助用戶理解和分析數據。這種展示方式通常用于展示復雜的數據集、實時監控系統、企業管理儀表盤等。以下是關于 大屏數據
    的頭像 發表于 12-16 16:59 ?693次閱讀

    如何找到適合的大屏數據可視化系統

    選擇合適的大屏數據可視化系統是企業或組織在數字轉型過程中至關重要的一步。一個優秀的大屏數據可視化系統能夠實時呈現關鍵業務數據,提升決策效率,同時提供直觀、易于理解的視覺呈現,助力企業
    的頭像 發表于 12-13 15:47 ?496次閱讀

    天然河道河流生態流量監測系統:直觀可視化界面,輕松解讀生態流量數據

    天然河道河流生態流量監測系統的直觀可視化界面是其一大亮點。通過高清顯示屏或在線平臺,用戶可以一目了然地看到河流的實時流速、流量、水位等數據
    的頭像 發表于 12-02 10:14 ?656次閱讀
    天然河道河流生態流量監測系統:<b class='flag-5'>直觀</b><b class='flag-5'>可視化</b>界面,輕松解讀生態流量數據

    智慧能源可視化監管平臺——助力可視化能源數據管理

    博達可視化大屏設計平臺在智慧能源領域的價值體現在實時監控、數據可視化、決策支持和效率提升等方面。借助該平臺,企業可以輕松搭建智慧能源類可視化大屏,更加精確和高效地管理生產和生活,實現能源的可持續發展。
    的頭像 發表于 11-29 10:00 ?958次閱讀
    智慧能源<b class='flag-5'>可視化</b>監管平臺——助力<b class='flag-5'>可視化</b>能源數據管理

    智慧樓宇可視化的優點

    智慧樓宇可視化是指通過數據可視化技術來展示和分析樓宇的各種數據,為樓宇管理者和用戶提供直觀、清晰的信息展示和決策支持。以下是智慧樓宇可視化的優點,詳細介紹其在樓宇管理和運營中的重要作用
    的頭像 發表于 11-19 14:25 ?487次閱讀

    智慧園區數據可視化優勢體現在哪些地方

    智慧園區數據可視化是當今數字化時代的重要工具,為園區管理者和決策者提供了強大的分析和展示數據的能力。以下是智慧園區數據可視化的應用優勢,詳細介紹: 1.信息呈現清晰直觀:智慧園區數據可視化
    的頭像 發表于 11-15 10:30 ?523次閱讀
    智慧園區數據<b class='flag-5'>可視化</b>優勢體現在哪些地方

    開關柜可視化操作是什么?

    開關柜的可視化是指通過圖像、視頻或3D模型等形式將開關柜內部結構和工作狀態直觀地展示出來,這種技術在電力行業和工業自動領域越來越受到重視
    的頭像 發表于 07-25 10:15 ?625次閱讀
    開關柜<b class='flag-5'>可視化</b><b class='flag-5'>操作</b>是什么?

    可視化數據大屏的制作流程

    制作可視化數據大屏是一項涵蓋數據分析、設計和技術實現的復雜任務。從數據處理到展示呈現,每個步驟都至關重要。下面將詳細介紹可視化數據大屏的制作流程,包括數據準備、設計階段和技術實現。 ?
    的頭像 發表于 07-24 13:57 ?1206次閱讀
    主站蜘蛛池模板: 国产精品毛片一区二区三区 | 乱小说录目伦200篇将曲勒 | 在线免费国产 | 日色视频| 一卡二卡四卡无卡乱免费网页 | 精品三级三级三级三级三级 | semimi亚洲综合在线观看 | 毛片不卡一区二区三区 | 伊人精品久久久大香线蕉99 | 国产精品美女久久久久网站 | 亚洲综合成人网 | 欧美一级片免费观看 | 天天综合网在线 | aika中文字幕永久在线 | 久青草国产手机在线视频 | 性欧美f | 午色影院 | 国产美女在线精品观看 | 噜噜嘿 | 欧美日韩中文字幕在线 | 亚洲欧洲第一页 | 亚洲午夜精品久久久久久抢 | 国产caob | 影音先锋 色天使 | 国产情侣出租屋露脸实拍 | 明星三级国产免费播放 | 制服丝袜国产精品 | www一区二区三区 | 亚洲综合国产一区二区三区 | 国产精品高清久久久久久久 | 性视频亚洲| 经典三级四虎在线观看 | www懂爱 | 四虎在线永久免费观看 | 国产福利观看 | 欧美高清xx | 午夜操| 又黄又视频 | 中国日韩欧美中文日韩欧美色 | 狠狠操精品视频 | 操爽视频|