91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何使用合成數據測試機器學習

要長高 ? 來源:InfoWorld ? 作者:Isaac Sacolick ? 2022-04-25 17:34 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Devops 團隊旨在提高部署頻率,減少生產中發現的缺陷數量,并提高從微服務和面向客戶的應用程序到員工工作流和業務流程自動化的一切的可靠性。

實施CI/CD(持續集成和持續交付)管道可確保構建和部署所有這些應用程序和服務的無縫路徑,自動化測試和實施持續測試實踐有助于團隊保持質量、可靠性和性能。通過持續測試,敏捷開發團隊可以 左移他們的測試,增加測試用例的數量,并提高測試速度。

[也在 InfoWorld 上:在數據科學和機器學習中應用 devops ]

構建測試用例并使其自動化是一回事,擁有足夠數量和種類的測試數據來驗證足夠數量的用例和邊界場景是另一回事。例如,測試網站注冊表單應驗證輸入模式的排列,包括缺失數據、長數據條目、特殊字符、多語言輸入和其他場景。

挑戰在于生成測試數據。一種方法是合成數據生成,它使用不同的技術根據模型和輸入模式集推斷數據集。合成數據生成解決了所需數據的數量和種類。在使用真實數據可能引發法律或其他合規性問題的情況下,您還可以使用合成數據生成來創建數據集。

“當所需數據不存在或原始數據集充滿個人身份信息時,合成數據提供了一個很好的選擇,”Accelario 的首席技術官兼聯合創始人 Roman Golod說。“最好的方法是基于現有模式創建合成數據以進行測試數據管理或構建規則,以確保您的 BI、AI 和其他分析提供可操作的結果。對于這兩者,您需要確保可以根據不斷變化的業務需求對合成數據生成自動化進行微調。”

合成數據生成用例

雖然合成數據生成的最基本需求源于測試應用程序、自動化和集成,但隨著數據科學測試需要機器學習和人工智能算法的測試數據,需求也在增長。數據科學家有時會使用合成數據來訓練神經網絡;在其他時候,他們使用機器生成的數據來驗證模型的結果。

其他合成數據用例更具體:

[在這份免費的 CIO 路線圖報告中了解 IT 如何利用 5G 的力量和前景。現在下載!]

通過確保在兩個基礎架構上運行相同的應用程序生成相同的結果來測試云遷移

為安全測試、欺詐檢測和其他實際數據可能不存在的實際場景創建數據

生成數據以測試大規模 ERP(企業資源規劃)和 CRM(客戶關系管理)升級,測試人員希望在遷移實時數據之前驗證配置

為決策支持系統生成數據以測試邊界條件、驗證特征選擇、提供更廣泛的無偏測試數據樣本,并確保AI 結果可解釋

對人工智能和物聯網系統(例如自動駕駛汽車)進行壓力測試,并驗證它們對不同安全情況的反應

如果您正在開發具有高維數據輸入以及關鍵質量和安全因素的算法或應用程序,那么合成數據生成提供了一種以經濟高效地創建大型數據集的機制。

“合成數據有時是唯一的出路,因為真實數據要么不可用,要么不可用,”KNIME 的數據科學家 Maarit Widman說。

平臺如何生成合成數據

您可能想知道平臺如何生成綜合測試數據以及如何選擇最佳算法和配置來創建所需數據。

Widman 解釋說:“生成合成數據有兩種主要策略:基于統計概率或基于機器學習算法。最近,像循環神經網絡這樣的深度學習技術——比如長短期記憶網絡和生成對抗網絡——因其能夠從無到有地生成新的音樂、文本和圖像的能力而越來越受歡迎。”

當數據點之間存在依賴關系時,例如時間序列數據和文本分析,數據科學家會使用RNN(循環神經網絡) 。LSTM(長期短期記憶)通過一系列重復模塊創建一種形式的長期記憶,每個模塊都有提供類似記憶功能的門。例如,文本分析中的 LSTM可以學習字符和單詞之間的依賴關系以生成新的字符序列。它還用于音樂創作、欺詐檢測和谷歌的 Pixel 6 語法校正。

GAN(生成對抗網絡)已被用于生成多種形式的圖像、破解網絡安全密碼,甚至制作披薩。GANs通過使用一種算法生成數據模式和另一種算法來測試它們來創建數據。然后他們在兩者之間形成對抗性競爭以找到最佳模式。生成合成數據的 GAN 代碼示例包括PyTorch 手寫數字、用于開發一維高斯分布的 TensorFlow 模型和用于模擬衛星圖像的 R 模型。

選擇機器學習和基于統計的模型是一門藝術和科學。Monitaur的聯合創始人兼首席技術官 Andrew Clark解釋了如何嘗試合成數據生成。他說:“這里的經驗法則始終是為工作選擇最簡單的模型,并以可接受的準確度執行任務。如果您正在對客戶結賬行進行建模,那么基于泊松分布的單變量隨機過程將是一個很好的起點。另一方面,如果您有大量貸款承銷數據集并想要創建測試數據,GAN 模型可能更適合捕捉各個特征之間的復雜相關性和關系。”

如果您正在處理數據科學用例,那么您可能希望靈活地開發合成數據生成模型。商業選項包括用于計算機視覺的Chooch 、Datomize和Deep Vision Data。

如果您的目標是應用程序測試,請考慮用于測試數據管理或綜合生成測試數據的平臺,例如 Accelario、Delphix、GenRocket、Informatica、K2View、Tonic,以及一些測試數據工具,例如開源測試數據生成器。Microsoft 的Visual Studio Premium也有一個內置的測試數據生成器,Java 開發人員應該使用Vaadin 的數據生成器查看這個示例。

如今,擁有強大的測試實踐非常重要,因為組織依賴于應用程序的可靠性和機器學習模型的準確性。合成數據生成是另一種縮小差距的方法。因此,您不僅擁有測試、訓練或驗證方法,而且還擁有生成足夠數據來構建模型和驗證應用程序的方法。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • GaN
    GaN
    +關注

    關注

    19

    文章

    2204

    瀏覽量

    76750
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134563
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    51Sim利用NVIDIA Cosmos提升輔助駕駛合成數據場景的泛化性

    輔助駕駛領域的經驗成功拓展到了具身智能領域,為端到端輔助駕駛仿真測試與具身智能機器人訓練提供了海量高置信度的合成數據,目前相關成果已在多個主機廠和智能裝備企業中實現落地應用。
    的頭像 發表于 06-26 09:09 ?360次閱讀

    康謀分享| 揭秘C-NCAP :合成數據如何助力攻克全球安全合規難關?

    C-NCAP 2024新規將DMS、RFR納入評分體系,推動中國汽車安全從被動向主動轉型。車企面臨成本、惡劣環境可靠性等挑戰。如何通過虛擬仿真和合成數據技術,助力車企大幅提升驗證效率,滿足合規標準?
    的頭像 發表于 06-18 10:07 ?1194次閱讀
    康謀分享| 揭秘C-NCAP :<b class='flag-5'>合成數據</b>如何助力攻克全球安全合規難關?

    技術分享 | 高逼真合成數據助力智駕“看得更準、學得更快”

    自動駕駛研發如何高效獲取海量訓練數據?高逼真合成數據技術正在提供新解法。通過仿真平臺可生成多場景、多傳感器的精準標注數據。文章詳解如何構建符合nuScenes標準的數據集,覆蓋復雜交通
    的頭像 發表于 04-29 10:47 ?2887次閱讀
    技術分享 | 高逼真<b class='flag-5'>合成數據</b>助力智駕“看得更準、學得更快”

    借助OpenUSD與合成數據推動人形機器人發展

    適用于合成運動數據的 NVIDIA Isaac GR00T Blueprint 大幅加快人形機器人的數據生成和訓練速度。
    的頭像 發表于 04-25 10:04 ?359次閱讀

    技術分享 | AVM合成數據仿真驗證方案

    AVM 合成數據仿真驗證技術為自動駕駛環境感知發展帶來助力,可借助仿真軟件配置傳感器、搭建環境、處理圖像,生成 AVM 合成數據,有效加速算法驗證。然而,如何利用仿真軟件優化傳感器外參與多場景驗證,顯著提升AVM算法表現?
    的頭像 發表于 03-19 09:40 ?3054次閱讀
    技術分享 | AVM<b class='flag-5'>合成數據</b>仿真驗證方案

    RTX 5880 Ada 驅動51Sim實現端到端仿真與數據合成新飛躍

    。 51Sim 由 51WORLD 于 2017 年孵化,是國內領先的 AI 合成數據及仿真平臺公司,在智能駕駛仿真和數據閉環領域有著卓越的產品競爭力和商業化能力。現核心產品包括智能駕駛與機器人仿真平臺 SimOne、
    的頭像 發表于 02-13 12:46 ?551次閱讀
    RTX 5880 Ada 驅動51Sim實現端到端仿真與<b class='flag-5'>數據</b><b class='flag-5'>合成</b>新飛躍

    自動燒錄測試機,管,編帶

    測試機
    艾迪科電子
    發布于 :2025年01月15日 11:23:47

    8600推拉力測試機和8100推拉力測試機對比# 測試#芯片

    測試機
    力標精密設備
    發布于 :2025年01月11日 10:57:06

    多功能推拉力測試機:原理及應用

    在當今工業快速發展的背景下,材料和組件的機械強度對于保障產品性能和安全至關重要。技術的進步和產品復雜性的提升使得對材料和組件測試的要求日益嚴格,推拉力測試機憑借其高精度特性,成為半導體、電子
    的頭像 發表于 12-26 11:08 ?721次閱讀
    多功能推拉力<b class='flag-5'>測試機</b>:原理及應用

    推拉力測試機IGBT封裝推拉力測試效果

    測試機
    博森源推拉力機
    發布于 :2024年11月28日 16:55:48

    鍵合拉力試驗led推力測試機倒裝剪切力測試機#元器件精密推拉力測試機

    測試機
    博森源推拉力機
    發布于 :2024年08月30日 17:19:15

    多功能推拉力測試機測試費用是多少?

    多功能推拉力測試機測試費用由測試機的規格、產地、品牌和服務等多個因素共同決定,需要具體詢價。一、規格多功能推拉力測試機的規格是影響測試費用重
    的頭像 發表于 08-23 16:17 ?540次閱讀
    多功能推拉力<b class='flag-5'>測試機</b><b class='flag-5'>測試</b>費用是多少?

    加速科技ST2500EX測試機臺再獲封測廠超千萬訂單

    先進機型,具備卓越的高密度、高效率、高性價比等特點。 圖|ST2500EX高性能數模混合信號測試系統 該測試機臺集成數字、模擬信號測試功能。單機臺最高支持32塊板卡,最高支持1024
    的頭像 發表于 07-23 09:48 ?616次閱讀
    加速科技ST2500EX<b class='flag-5'>測試機</b>臺再獲封測廠超千萬訂單

    半導體多功能推拉力測試機出貨了

    全自動化設計半導體多功能推拉力測試機,可進行金線拉力、金球推力、芯片推力的測試應用。工作臺X方向最大行程100毫米和Y方向最大行程100毫米;運動時最大速度2毫米/秒;;Y方向可承受最大力200公斤
    的頭像 發表于 07-18 09:44 ?140次閱讀
    半導體多功能推拉力<b class='flag-5'>測試機</b>出貨了
    主站蜘蛛池模板: 免费网站成人亚洲 | 久久两性视频 | 国产精品黄网站免费进入 | 操美女免费视频 | 久久国产午夜精品理论篇小说 | 中文字幕乱码人成乱码在线视频 | 九色亚洲| 中文字幕导航 | 天天综合网站 | 视频一区 在线 | 天天做日日干 | 国产精品午夜国产小视频 | 日本动漫天堂 | 99热99热 | 亚洲福利视频网站 | 天天摸天天碰天天碰 | 男啪女r18肉车文 | 亚洲一区二区三区影院 | 婷婷激情丁香 | 亚洲乱码一二三四区 | 婷婷激情综合五月天 | 女人张开腿让男人桶免费网站 | 就要爱综合| 久久婷婷丁香 | 欧美特级黄 | 国产女乱淫真高清免费视频 | 777奇米影视一区二区三区 | 在线天堂中文在线资源网 | tube69日本老师 | 国产精品资源手机在线播放 | 一道精品视频一区二区三区男同 | 美女扒开尿口给男人捅 | 激情五月婷婷网 | 九九久久久久午夜精选 | 九九re6精品视频在线观看 | 欧美成人26uuu欧美毛片 | 视频在线观看高清免费大全 | 欧美日韩国产成人高清视频 | 免费在线观看黄色 | 欧美在线小视频 | 日本日b视频 |