IBM公司正在嘗試使用與Trifacta Inc.共同開發(fā)的新數(shù)據(jù)準備工具來解決準備用于人工智能和機器學習模型訓練的數(shù)據(jù)的繁瑣且耗時的過程。
兩家公司指出,數(shù)據(jù)準備是構(gòu)建機器學習和預測模型的重要步驟。那是因為數(shù)據(jù)需要非常準確,否則模型將無效,但是問題是數(shù)據(jù)科學家最多可以將80%的時間花費在此任務上。
這是一個非常漫長的時間,可以更好地用于其他事情,這就是為什么IBM和Trifacta今天宣布推出其新的InfoSphere Advanced Data Preparation工具的原因,他們說這有助于加快流程。
借助InfoSphere,數(shù)據(jù)科學家可以將其原始數(shù)據(jù)集轉(zhuǎn)換為適合于機器學習模型的格式,同時使用其現(xiàn)有的數(shù)據(jù)湖和數(shù)據(jù)倉庫。
兩家公司表示,該工具旨在“格式化,構(gòu)造和豐富用于分析處理和標準報告的數(shù)據(jù)集”。它的工作原理是幫助用戶可視化數(shù)據(jù)準備過程,以便他們可以連續(xù)跟蹤數(shù)據(jù)的質(zhì)量,并確保在格式化數(shù)據(jù)時不會發(fā)生錯誤。該過程也是完全自動化的,這意味著正式員工和數(shù)據(jù)科學家可以準備和豐富其數(shù)據(jù)以進行分析。
Trifacta首席執(zhí)行官亞當·威爾遜(Adam Wilson)表示,該公司與IBM合作創(chuàng)建了InfoSphere,此前該公司目睹了許多組織由于數(shù)據(jù)質(zhì)量差和準備流程效率低下而難以開展AI計劃。
威爾遜說:“這項合作將使組織能夠在受管和集中管理的環(huán)境中加快自助服務分析的數(shù)據(jù)準備。”
Constellation Research Inc.分析師Doug Henschen告訴SiliconANGLE,與IBM的合作實際上是Trifacta的妙招,更不用說為IBM節(jié)省時間了,因為它可以帶來“最新的自助服務數(shù)據(jù)”向市場“準備能力”的速度比它自己完成的速度更快。
Henschen說:“我認為IBM明智地專注于建模生命周期的開發(fā),部署,監(jiān)視和持續(xù)管理方面,并在可能的情況下開發(fā)自動化。” “為什么Trifacta很好地應對了準備挑戰(zhàn)?Trifacta在其云平臺上也與Google建立了重要的合作伙伴關系,因此這是著名合作伙伴對其能力的第二次認可。”
-
IBM
+關注
關注
3文章
1821瀏覽量
75800 -
機器學習
+關注
關注
66文章
8501瀏覽量
134577
發(fā)布評論請先 登錄
Analog Devices Inc. ADAQ4001 μModule?數(shù)據(jù)采集解決方案數(shù)據(jù)手冊

Analog Devices Inc. EVAL-ADAQ23876FMCZ評估板數(shù)據(jù)手冊

Analog Devices Inc. EV-RPG2評估套件數(shù)據(jù)手冊

Analog Devices Inc. ADAQ8092 14位105MSPS μModule?數(shù)據(jù)手冊

Analog Devices Inc. EVAL-LTM4702-AZ評估板數(shù)據(jù)手冊

Analog Devices Inc. EVAL-CN0575-RPIZ開發(fā)板特性/應用/框圖

Analog Devices Inc. ADRF5048-EVALZ評估板數(shù)據(jù)手冊

Analog Devices Inc. EVAL-ADPD7000Z 評估板數(shù)據(jù)手冊

Analog Devices Inc. ADPA1113 GaN功率放大器數(shù)據(jù)手冊

Analog Devices Inc. EVAL-ADE9113 評估板數(shù)據(jù)手冊
Analog Devices Inc. MAX32670-xx-ARDZ開發(fā)平臺特性/應用
Analog Devices Inc. TMC8100 評估套件數(shù)據(jù)手冊
Analog Devices Inc. LT7171多相直流/直流降壓穩(wěn)壓器數(shù)據(jù)手冊

Analog Devices Inc. AD4170低噪聲精密SigmaDelta模數(shù)轉(zhuǎn)換器數(shù)據(jù)手冊

評論