在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Danfo.js提供高性能、直觀易用的數據結構,支持結構化數據的操作和處理

Tensorflowers ? 來源:TensorFlow ? 作者:TensorFlow ? 2020-09-23 18:21 ? 次閱讀

Danfo.js 是個 JavaScript 開源庫,提供了高性能、直觀易用的數據結構,支持結構化數據的操作和處理。Danfo.js 深受 Python Pandas 庫的啟發,并提供了類似的接口/API。因此熟悉 Pandas API 且了解 JavaScript 的用戶可以輕松上手。

Danfo.js 的一大目標是為 JavaScript 開發者提供數據處理、機器學習AI 工具。這與我們的愿景一致,本質上也符合 TensorFlow.js 團隊向 Web 引入 ML 的目標。Numpy 和 Pandas 等開源庫全面革新了 Python 中數據操作的便利性。因此很多工具都圍繞它們構建,進一步推動了 Python 中 ML 生態系統的蓬勃發展。

Danfo.js
https://danfo.jsdata.org/

Danfo.js 建立在 TensorFlow.js 上。也就是說,就像 Numpy 為 Pandas 的算術運算提供技術支持一樣,我們是利用 TensorFlow.js 為我們的低級算術運算提供技術支持。

Danfo.js 的主要特性

Danfo.js 速度快。它基于 TensorFlow.js 構建,與張量無縫兼容。您可以在 Danfo 中加載張量,也可以將 Danfo 數據結構轉換為張量。利用這兩個庫,既有了數據處理庫 (Danfo.js),也有了強大的 ML 庫 (TensorFlow.js)。

以下示例將展示如何從張量對象創建 Danfo DataFrame:

const dfd = require("danfojs-node") const tf = require("@tensorflow/tfjs-node") let data = tf.tensor2d([[20,30,40], [23,90, 28]]) let df = new dfd.DataFrame(data) let tf_tensor = df.tensor console.log(tf_tensor); tf_tensor.print()

輸出:

Tensor { kept: false, isDisposedInternal: false, shape: [ 2, 3 ], dtype: 'float32', size: 6, strides: [ 3 ], dataId: {}, id: 3, rankType: '2' } Tensor [[20, 30, 40], [23, 90, 28]]

您可以輕松地將數組、JSON 或對象轉換為 DataFrame 對象操作。

JSON 對象到 DataFrame:

const dfd = require("danfojs-node") json_data = [{ A: 0.4612, B: 4.28283, C: -1.509, D: -1.1352 }, { A: 0.5112, B: -0.22863, C: -3.39059, D: 1.1632 }, { A: 0.6911, B: -0.82863, C: -1.5059, D: 2.1352 }, { A: 0.4692, B: -1.28863, C: 4.5059, D: 4.1632 }] df = new dfd.DataFrame(json_data) df.print()

輸出:

帶列標簽的對象數組到 DataFrame:

const dfd = require("danfojs-node") obj_data = {'A': [“A1”, “A2”, “A3”, “A4”], 'B': ["bval1", "bval2", "bval3", "bval4"], 'C': [10, 20, 30, 40], 'D': [1.2, 3.45, 60.1, 45], 'E': ["test", "train", "test", "train"] } df = new dfd.DataFrame(obj_data) df.print()

輸出:

您可以輕松處理浮點和非浮點數據中的缺失數據(以 NaN 表示):

const dfd = require("danfojs-node") let data = {"Name":["Apples", "Mango", "Banana", undefined], "Count": [NaN, 5, NaN, 10], "Price": [200, 300, 40, 250]} let df = new dfd.DataFrame(data) let df_filled = df.fillna({columns: ["Name", "Count"], values: ["Apples", df["Count"].mean()]}) df_filled.print()

輸出:

基于智能標簽的切片、花式索引和大數據集查詢:

const dfd = require("danfojs-node") let data = { "Name": ["Apples", "Mango", "Banana", "Pear"] , "Count": [21, 5, 30, 10], "Price": [200, 300, 40, 250] } let df = new dfd.DataFrame(data) let sub_df = df.loc({ rows: ["0:2"], columns: ["Name", "Price"] }) sub_df.print()

輸出:

強大的 IO 工具,用于從平面文件(CSV 和分隔)加載數據。完整和分塊均可:

const dfd = require("danfojs-node") //read the first 10000 rows dfd.read_csv("file:///home/Desktop/bigdata.csv", chunk=10000) .then(df => { df.tail().print() }).catch(err=>{ console.log(err); })

DataFrame 和 Series 支持OneHotEncoders、LabelEncoders等強大的數據預處理函數和 StandardScaler 和 MinMaxScaler 等 Scaler:

const dfd = require("danfojs-node") let data = ["dog","cat","man","dog","cat","man","man","cat"] let series = new dfd.Series(data) let encode = new dfd.LabelEncoder() encode.fit(series) let sf_enc = encode.transform(series) let new_sf = encode.transform(["dog","man"])

輸出:

交互式、靈活且直觀的 API,用于在瀏覽器中繪制 DataFrame 和 Series:

Document

輸出:

示例:泰坦尼克號幸存預測

以下是使用 Danfo.js 和 TensorFlow.js 的簡單端到端分類任務。使用 Danfo 進行數據集的數據加載、操作和預處理,然后導出張量對象。

const dfd = require("danfojs-node") const tf = require("@tensorflow/tfjs-node") async function load_process_data() { let df = await dfd.read_csv("https://web.stanford.edu/class/archive/cs/cs109/cs109.1166/stuff/titanic.csv") //A feature engineering: Extract all titles from names columns let title = df['Name'].apply((x) => { return x.split(".")[0] }).values //replace in df df.addColumn({ column: "Name", value: title }) //label Encode Name feature let encoder = new dfd.LabelEncoder() let cols = ["Sex", "Name"] cols.forEach(col => { encoder.fit(df[col]) enc_val = encoder.transform(df[col]) df.addColumn({ column: col, value: enc_val }) }) let Xtrain,ytrain; Xtrain = df.iloc({ columns: [`1:`] }) ytrain = df['Survived'] // Standardize the data with MinMaxScaler let scaler = new dfd.MinMaxScaler() scaler.fit(Xtrain) Xtrain = scaler.transform(Xtrain) return [Xtrain.tensor, ytrain.tensor] //return the data as tensors }

接下來使用 TensorFlow.js 創建一個簡單的神經網絡

function get_model() { const model = tf.sequential(); model.add(tf.layers.dense({ inputShape: [7], units: 124, activation: 'relu', kernelInitializer: 'leCunNormal' })); model.add(tf.layers.dense({ units: 64, activation: 'relu' })); model.add(tf.layers.dense({ units: 32, activation: 'relu' })); model.add(tf.layers.dense({ units: 1, activation: "sigmoid" })) model.summary(); return model }

最后進行訓練,首先將模型和處理后的數據加載為張量。這可以直接饋送到神經網絡。

async function train() { const model = await get_model() const data = await load_process_data() const Xtrain = data[0] const ytrain = data[1] model.compile({ optimizer: "rmsprop", loss: 'binaryCrossentropy', metrics: ['accuracy'], }); console.log("Training started....") await model.fit(Xtrain, ytrain,{ batchSize: 32, epochs: 15, validationSplit: 0.2, callbacks:{ onEpochEnd: async(epoch, logs)=>{ console.log(`EPOCH (${epoch + 1}): Train Accuracy: ${(logs.acc * 100).toFixed(2)}, Val Accuracy: ${(logs.val_acc * 100).toFixed(2)} `); } } }); }; train()

您可能注意到 Danfo 的 API 與 Pandas 非常相似,即使不是 Javascript 程序員也可以輕松閱讀和理解代碼。您可參考以上演示的完整源代碼 (https://gist.github.com/risenW/f54e4e5b6d92e7b1b9b1f30e884ca83c)。

結語

基于網絡的機器學習已經日趨成熟,對應的專用高效數據科學工具必不可少。類似 Danfo.js 的工具讓基于網絡的應用可以輕松支持 ML 特性,從而讓應用生態系統更加豐富多彩。

這場變革始于 TensorFlow.js 為 Python 帶來的 ML 功能。我們希望為 Danfo.js 作為高效的同伴一路提供支持。我們對 Danfo.js 的發展充滿期待!希望它也能成為網絡社區的關鍵成員。

原文標題:深受 Pandas 啟發的 JavaScript 開源庫 — Danfo.js 現已推出!

文章出處:【微信公眾號:TensorFlow】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • JAVA
    +關注

    關注

    20

    文章

    2987

    瀏覽量

    107310
  • 開源
    +關注

    關注

    3

    文章

    3634

    瀏覽量

    43586

原文標題:深受 Pandas 啟發的 JavaScript 開源庫 — Danfo.js 現已推出!

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    DDN攜手NVIDIA釋放非結構化數據的AI價值

    DDN 通過與 NVIDIA AI 數據平臺的合作,推出聯合解決方案,簡化了企業對非結構化數據的存儲、訪問和激活方式,助力客戶釋放生成式 AI 的巨大商業潛能。DDN 全球合作伙伴負責人
    的頭像 發表于 06-10 10:31 ?261次閱讀

    程序設計與數據結構

    《程序設計與數據結構》重點闡述了三大方向內容: 1. C語言學習中的痛點:針對當前工程師在C語言學習中的痛點,如指針函數與函數指針,如何靈活應用結構體等。從變量的三要素(變量的類型,變量的值和變量
    發表于 05-13 16:45

    從零到一:如何利用非結構化數據中臺快速部署AI解決方案

    在企業數字轉型的浪潮中,AI已從概念走向落地應用。然而,真正能高效、安全地部署AI解決方案的企業仍屬少數,瓶頸往往出在“數據”——尤其是非結構化數據的管理與應用上。文件、音頻、視頻、
    的頭像 發表于 04-14 13:50 ?224次閱讀

    結構化數據中臺:企業AI應用安全落地的核心引擎

    在數字轉型浪潮中,非結構化數據(如文檔、圖片、音視頻等)已成為企業核心資產,其價值挖掘能力直接影響AI應用的效能與安全性。然而,數據分散、多模態
    的頭像 發表于 02-27 17:06 ?449次閱讀

    EtherCAT數據結構解析

    物理層和常規的以太網卡,通過獨特的數據結構處理機制,實現了基于EtherNet的實時控制。本文將深入探討EtherCAT的數據結構,從
    的頭像 發表于 02-02 17:42 ?1157次閱讀

    七款經久不衰的數據可視化工具!

    整合來自不同系統的數據提供全面的業務洞察。總的來說,FineBI 不僅操作簡便,功能強大,還能夠適應不同企業的需求,幫助用戶實現高效的數據分析和決策
    發表于 01-19 15:24

    戴爾數據湖倉助力企業數字轉型

    在數字轉型的浪潮下,企業正面臨著前所未有的數據挑戰。從傳統的結構化數據到如今的非結構化數據、半
    的頭像 發表于 12-20 09:31 ?463次閱讀

    bds 系統的優缺點 bds與傳統數據庫的區別

    BDS(Big Data System)系統,通常指的是用于處理數據的系統,它們能夠處理大規模數據集,包括結構化、半
    的頭像 發表于 11-22 15:48 ?2761次閱讀

    結構化布線在AI數據中心的關鍵作用

    AI 正在不斷顛覆各行各業,推動從電影制作到金融行業等各個領域的創新。而在 AI 系統的背后,隱藏著這樣一位無名英雄:結構化布線。
    的頭像 發表于 11-21 16:51 ?862次閱讀

    DDC264配置寄存器數據寫入和320 DCLK時鐘脈沖后的回讀數據結構是什么?

    配置寄存器數據寫入和320 DCLK時鐘脈沖后的回讀數據結構是什么? 根據注和表9,16位配置寄存器數據,4位修訂ID, 300位校驗模式,怎么可能有1024 TOTAL READBACK BITS, format = 0
    發表于 11-19 07:58

    視覺軟件HALCON的數據結構

    在研究機器視覺算法之前,我們需要先了解機器視覺應用中涉及的基本數據結構。Halcon數據結構主要有圖像參數和控制參數兩類參數。圖像參數包括:image、region、XLD,控制參數包括:string、integer、real、handle、tuple數組等。
    的頭像 發表于 11-14 10:20 ?1191次閱讀
    視覺軟件HALCON的<b class='flag-5'>數據結構</b>

    架構師日記-從數據庫發展歷程到數據結構設計探析

    的提出,以表格形式組織數據數據之間存在關聯關系,具有了良好的結構化和規范特性,成為主流數據庫類型。 先來看一張
    的頭像 發表于 09-25 11:20 ?1102次閱讀
    架構師日記-從<b class='flag-5'>數據</b>庫發展歷程到<b class='flag-5'>數據結構</b>設計探析

    嵌入式常用數據結構有哪些

    在嵌入式編程中,數據結構的選擇和使用對于程序的性能、內存管理以及開發效率都具有重要影響。嵌入式系統由于資源受限(如處理器速度、內存大小等),因此對數據結構的選擇和使用尤為關鍵。以下是嵌
    的頭像 發表于 09-02 15:25 ?980次閱讀

    基于分布式對象存儲WDS的信托非結構化數據整合平臺

    基于分布式對象存儲WDS的信托非結構化數據整合平臺
    的頭像 發表于 08-28 09:56 ?609次閱讀
    基于分布式對象存儲WDS的信托非<b class='flag-5'>結構化</b><b class='flag-5'>數據</b>整合平臺

    工業數據中臺的功能和應用場景

    。 實時數據處理和批量數據處理。 2.數據存儲與管理: 提供分布式存儲解決方案,如Hadoop、HBase等。
    的頭像 發表于 07-04 16:18 ?741次閱讀
    主站蜘蛛池模板: 色五月婷婷成人网 | 男人的天堂久久精品激情 | 亚洲无线码一区在线观看 | 啪啪91视频 | 岬奈奈美在线 国产一区 | 1515hh四虎免费观com | 特黄特色大片免费视频大全 | 欧美日本一区二区 | 97午夜影院| 国产人成午夜免视频网站 | 亚洲日韩图片专区第1页 | 四虎4hu永久在线观看 | 三级在线看 | 亚洲伦理中文字幕一区 | 欧美日本一区二区三区生 | 黄色短视频免费观看 | 性欧美丨18一19 | 久久综合97色综合网 | 亚洲成网777777国产精品 | www天天操| 亚洲国产高清精品线久久 | 夜夜春夜夜夜夜猛噜噜噜噜噜 | 三级黄色片在线播放 | 色老头在线精品视频在线播放 | 四虎永久在线精品国产免费 | 中文字幕va | 日韩毛片免费视频一级特黄 | 日本视频免费高清一本18 | 在线播放黄色 | 欧美一级片免费在线观看 | 黄色字幕网 | 人人天天爱天天做天天摸 | 欧美婷婷六月丁香综合色 | 欧美线人一区二区三区 | 日本xxxxx黄区免费看动漫 | 理论毛片| 亚洲va久久久久综合 | 理论片免费午夜 | 亚洲国产成人精品青青草原100 | 亚洲成人在线免费 | 亚洲1314|