在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PAKDD 2019 AutoML挑戰(zhàn)賽結(jié)果出爐:國內(nèi)團(tuán)隊(duì)DeepBlueAI斬獲第一名

DPVg_AI_era ? 來源:lp ? 2019-04-19 08:52 ? 次閱讀

近日,數(shù)據(jù)挖掘領(lǐng)域頂會PAKDD的AutoML挑戰(zhàn)賽結(jié)果出爐,DeepBlueAI、微軟&北航、清華大學(xué)等團(tuán)隊(duì)斬獲前三名。本文帶來冠軍團(tuán)隊(duì)解決方案的技術(shù)分享。

PAKDD 2019 AutoML挑戰(zhàn)賽結(jié)果出爐:國內(nèi)團(tuán)隊(duì) DeepBlueAI 斬獲第一名,微軟亞洲研究院&北航組成的ML Intelligence團(tuán)隊(duì)獲得第二名,清華大學(xué)Meta_Learners團(tuán)隊(duì)獲得第三。

Feedback phase 排行榜

PAKDD 全稱亞太地區(qū)知識發(fā)現(xiàn)與數(shù)據(jù)挖掘國際會議(Pacific Asia Knowledge Discovery and Data Mining),是亞太地區(qū)數(shù)據(jù)挖掘領(lǐng)域的頂級國際會議。該會議在全球數(shù)據(jù)挖掘領(lǐng)域享有盛譽(yù),一直受到業(yè)內(nèi)各國科學(xué)家的高度重視和廣泛認(rèn)可。

PAKDD 2019 第 4 屆自動機(jī)器學(xué)習(xí)挑戰(zhàn)賽(AutoML Challenge)的主題是“AutoML for Lifelong Machine Learning”,要求參賽選手創(chuàng)建一個(gè)自動預(yù)測模型(沒有任何人為干預(yù)),并在一個(gè)終身機(jī)器學(xué)習(xí)(Lifelong Machine Learning)設(shè)置中訓(xùn)練和評估該模型。

AutoML,全稱為Automated Machine Learning,是機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)新興方向。旨在自動化整個(gè)機(jī)器學(xué)習(xí)的流程,降低數(shù)據(jù)預(yù)處理、特征工程、模型選擇、參數(shù)調(diào)節(jié)等環(huán)節(jié)中的人工成本。

隨著機(jī)器學(xué)習(xí)系統(tǒng)的日益復(fù)雜化,AutoML 得到了產(chǎn)學(xué)研各界的廣泛關(guān)注,已成為人工智能領(lǐng)域最熱門的研究方向之一。

據(jù)悉,本次競賽共有 127 個(gè)隊(duì)伍參加,共收到 550 多個(gè)方案,最終有 31 個(gè)隊(duì)伍進(jìn)入決賽。

最終獲勝的隊(duì)伍為:

冠軍:DeepBlueAI,羅志鵬,黃堅(jiān)強(qiáng),陳明健

亞軍:ML Intelligence,包夢蛟,Hui Xue,Yihuan Mao,Yujing Wang

季軍:Meta_Learners,熊錚,蔣繼研,張文鵬

接下來,本文帶來冠軍團(tuán)隊(duì)解決方案的分享。

冠軍方案關(guān)鍵技術(shù):自動特征工程和自動快速特征選擇

如下圖所示,研究團(tuán)隊(duì)實(shí)現(xiàn)了一個(gè)Lifelong AutoML 框架,包括自動特征工程和自動快速特征選擇、自動模型調(diào)參、自動模型融合等步驟,在類別不平衡的處理上我們使用了自適應(yīng)采樣并在模型訓(xùn)練上有一定的創(chuàng)新,對概念漂移問題我們結(jié)合DNN的預(yù)訓(xùn)練和LightGBM的再訓(xùn)練以及針對性地設(shè)計(jì)特征來緩解概念漂移,并且利用了多種策略對運(yùn)行時(shí)間和運(yùn)行內(nèi)存進(jìn)行了有效的控制,以確保解決方案能在限制時(shí)間和內(nèi)存下完成整個(gè)流程。

自動特征工程與快速特征選擇:

與以往的AutoML框架所不同的是,我們的框架更加注重自動特征工程與特征選擇,我們構(gòu)建的自動特征工程不僅是基于時(shí)間特征、分類特征、數(shù)值特征、多值分類特征做特征間的高階組合,同時(shí)我們自動提取跨時(shí)間、樣本的高階組合。

對于特征選擇,我們結(jié)合特征重要性及序列后向選擇算法實(shí)現(xiàn)了一個(gè)有效的快速特征選擇,在忽略重要性低的特征上結(jié)合序列后向特征選擇算法,對重要性極高的特征進(jìn)行篩選,這能快速地篩選掉過擬合特征,從而大幅度提高模型性能。為了避免維度災(zāi)難,我們迭代地進(jìn)行特征工程和特征選擇,在低階特征生成后,利用特征選擇過濾大部分特征,在其基礎(chǔ)上進(jìn)行更高階的特征組合,更有效地提取了高階特征并避免了維度災(zāi)難。

緩解類別不平衡:

我們能夠自動針對數(shù)據(jù)情況(數(shù)據(jù)大小,數(shù)據(jù)類型,以及正負(fù)樣本比例),以及比賽時(shí)間的限制等各種因素的不同,自適應(yīng)地對數(shù)據(jù)采取不同的采樣方式和比例,既保證了效率的同時(shí)又保證了效果。傳統(tǒng)的類別不平衡的數(shù)據(jù)訓(xùn)練方式,是通過提前對數(shù)據(jù)進(jìn)行采樣,緩解類別不平衡問題,然后將數(shù)據(jù)加入模型中訓(xùn)練。但是這樣會損失大量的數(shù)據(jù)信息,所以我們在數(shù)據(jù)采樣的時(shí)候,仍然保留大量的高比例樣本,并且將其分批,在加入模型中訓(xùn)練時(shí),讓模型在梯度提升中輪流訓(xùn)練分批數(shù)據(jù),這樣能夠盡可能保留更多的原始數(shù)據(jù)的信息,同時(shí)緩解了類別不平衡問題。

抗概念漂移處理:

針對數(shù)據(jù)大小,數(shù)據(jù)復(fù)雜度,自適應(yīng)選擇batch數(shù)目。同時(shí),對于每個(gè)batch,加入了“不同batch間采樣率隨時(shí)間增加”機(jī)制。我們使用DNN模型對特征Embedding進(jìn)行預(yù)訓(xùn)練,遷移到新的數(shù)據(jù)批上進(jìn)行再訓(xùn)練,有效地緩解了概念漂移和增強(qiáng)了特征表達(dá)。

挑戰(zhàn)和改進(jìn)

研究團(tuán)隊(duì)表示,不同特征類型的處理是本次大賽最棘手的挑戰(zhàn)。

本次大賽數(shù)據(jù)由多種不同的數(shù)據(jù)類型組成,這些都是現(xiàn)實(shí)世界問題需要處理的真實(shí)數(shù)據(jù)。而現(xiàn)有的AutoML框架往往只支持?jǐn)?shù)值類型,不能簡單將現(xiàn)有框架應(yīng)用到這些現(xiàn)實(shí)數(shù)據(jù)中。研究人員通過以往的大量競賽及實(shí)際項(xiàng)目經(jīng)驗(yàn),在特征工程處理上加入了大量的先驗(yàn)知識,使得框架能支持不同特征類型的特征工程,以及能自動對這些不同類型特征做高階組合以及特征選擇。支持更多的數(shù)據(jù)類型而不僅僅是數(shù)值類型保證了AutoML能應(yīng)用到更廣泛的現(xiàn)實(shí)問題中,大大增強(qiáng)了AutoML的實(shí)用性。

團(tuán)隊(duì)表示,該解決方案有一些可以改進(jìn)的方面:

首先,比賽所使用的數(shù)據(jù)僅來自于10個(gè)不同的任務(wù),雖然我們在10個(gè)任務(wù)的數(shù)據(jù)集上都取得了很好的效果,但并不能保證我們的AutoML框架能應(yīng)用到更廣泛的不同現(xiàn)實(shí)世界問題中。

其次,比賽所提供的都是單表數(shù)據(jù),而現(xiàn)實(shí)中的問題往往是多表關(guān)聯(lián)的且關(guān)系復(fù)雜的,表間的關(guān)系往往包括多對多、一對多、多對一、一對一等多種關(guān)系。

為了更好地將AutoML應(yīng)用到現(xiàn)實(shí)問題中,我們將設(shè)計(jì)并實(shí)現(xiàn)并實(shí)現(xiàn)支持多表聯(lián)結(jié)數(shù)據(jù)以及不同數(shù)據(jù)類型的AutoML框架,將該框架應(yīng)用到更多現(xiàn)實(shí)世界問題的數(shù)據(jù)上進(jìn)行測試。

終生自動化機(jī)器學(xué)習(xí):AutoML對現(xiàn)實(shí)世界問題的意義

這次比賽將AutoML擴(kuò)展到了多種不同的數(shù)據(jù)類型上,其目標(biāo)是實(shí)現(xiàn)一個(gè)支持不同數(shù)據(jù)類型并能適應(yīng)概念漂移的終生自動化機(jī)器學(xué)習(xí)。

首先,現(xiàn)實(shí)世界問題的數(shù)據(jù)往往是多種不同數(shù)據(jù)類型的,需要特定領(lǐng)域的專家對這些數(shù)據(jù)進(jìn)行大量的預(yù)處理及特征工程,而現(xiàn)有的自動化機(jī)器學(xué)習(xí)框架又僅支持?jǐn)?shù)值類型,對其他類型不能有很好的支持,很難應(yīng)用到各種現(xiàn)實(shí)世界問題中。在這次比賽中,我們團(tuán)隊(duì)設(shè)計(jì)的AutoML將自動化機(jī)器學(xué)習(xí)擴(kuò)展到了多種數(shù)據(jù)類型,引入了不同類型的特征預(yù)處理以及不同類型特征的特征工程及特征組合,這樣能在不需要專家的干預(yù)下將AutoML應(yīng)用到更多的現(xiàn)實(shí)世界問題中。

其次,許多現(xiàn)實(shí)世界問題數(shù)據(jù)是根據(jù)時(shí)間逐漸獲取的,數(shù)據(jù)間往往帶有概念漂移,并存在大量的類別不平衡問題,模型需要不停地重復(fù)訓(xùn)練去適應(yīng)概念漂移并需要專家去處理概念漂移及類別不平衡問題。我們團(tuán)隊(duì)設(shè)計(jì)的框架通過融合不同時(shí)期的數(shù)據(jù)以及結(jié)合DNN和LightGBM的訓(xùn)練來自適應(yīng)概念漂移,引入了自適應(yīng)采樣以及對梯度提升模型的采樣率進(jìn)行改進(jìn)來緩解類別不平衡,實(shí)現(xiàn)了終生機(jī)器學(xué)習(xí)。

我們設(shè)計(jì)的終生自動化機(jī)器學(xué)習(xí)框架可以應(yīng)用到各種現(xiàn)實(shí)世界問題中,例如在推薦系統(tǒng)、異常檢測、在線廣告、欺詐檢測、運(yùn)輸監(jiān)控、計(jì)量經(jīng)濟(jì)學(xué)、病人監(jiān)控等諸多領(lǐng)域中,無需領(lǐng)域?qū)<业母深A(yù),我們的框架可以訓(xùn)練出一個(gè)性能高、時(shí)效性強(qiáng)、時(shí)間可行的模型,從而降低應(yīng)用門檻,縮短項(xiàng)目開發(fā)周期,促進(jìn)機(jī)器學(xué)習(xí)的大規(guī)模落地。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6676

    瀏覽量

    105449
  • 數(shù)據(jù)挖掘
    +關(guān)注

    關(guān)注

    1

    文章

    406

    瀏覽量

    24642
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8496

    瀏覽量

    134218

原文標(biāo)題:PAKDD AutoML競賽結(jié)果出爐,冠軍方案關(guān)鍵技術(shù)解讀

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為榮登GlobalData運(yùn)營商基礎(chǔ)設(shè)施管理服務(wù)排名報(bào)告Leader象限第一名

    象限第一名。 報(bào)告對通信服務(wù)商從商業(yè)模式、解決方案、網(wǎng)絡(luò)設(shè)計(jì)與優(yōu)化、網(wǎng)絡(luò)轉(zhuǎn)型能力、服務(wù)規(guī)模、和業(yè)務(wù)敏捷性六個(gè)維度進(jìn)行了全面評估,華為綜合得分第一。這印證了華為在對全球運(yùn)營商客戶提供領(lǐng)先服務(wù)解決方案、網(wǎng)絡(luò)極致性能和數(shù)智化轉(zhuǎn)型等方面做出了卓越
    的頭像 發(fā)表于 05-22 18:43 ?529次閱讀
    華為榮登GlobalData運(yùn)營商基礎(chǔ)設(shè)施管理服務(wù)排名報(bào)告Leader象限<b class='flag-5'>第一名</b>

    平頭哥半導(dǎo)體亮相AICAS 2025挑戰(zhàn)賽技術(shù)研討會

    近日,歷時(shí)兩個(gè)多月,600余支參賽隊(duì)伍激烈角逐,AICAS 2025全球技術(shù)挑戰(zhàn)賽初賽階段賽程已順利結(jié)束,中技術(shù)研討于2月22日在杭州圓滿召開。本次研討會作為AICAS全球技術(shù)挑戰(zhàn)賽的重要環(huán)節(jié),在初賽和復(fù)賽之間架起橋梁,為參賽
    的頭像 發(fā)表于 02-25 11:23 ?654次閱讀

    芯華章持續(xù)助力EDA精英挑戰(zhàn)賽

    日前,2024中國研究生創(chuàng)“芯”大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA競賽)決賽在南京江北新區(qū)舉辦。今年EDA競賽首次升級為國,在全國超過500個(gè)參賽隊(duì)伍中,來自華南理工大學(xué)的"EDA240931參賽隊(duì)"從芯華章賽道脫穎而出,斬獲
    的頭像 發(fā)表于 12-17 15:47 ?825次閱讀

    達(dá)實(shí)再度榮獲十大出入口控制品牌第一名

    近日,被譽(yù)為智能建筑行業(yè)“奧斯卡”的中國智能建筑品牌獎頒獎典禮于廣州盛大舉行。達(dá)實(shí)智能子公司——深圳達(dá)實(shí)物聯(lián)網(wǎng)技術(shù)有限公司 連續(xù)14年 獲“十大出入口控制品牌第一名”榮譽(yù),與此同時(shí)還攬獲“2024年優(yōu)秀AIoT智控平臺品牌”等兩項(xiàng)大獎!
    的頭像 發(fā)表于 12-11 10:23 ?611次閱讀

    EDA精英挑戰(zhàn)賽果公布!思爾芯“戰(zhàn)隊(duì)”薪火相承斬獲“麒麟杯”

    2024中國研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽12月7-8日,2024中國研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽(原“集成電路EDA設(shè)計(jì)精英挑戰(zhàn)賽”)總決賽及頒獎典禮在南京成功舉辦。此次大賽,思爾芯作為核心
    的頭像 發(fā)表于 12-11 01:03 ?851次閱讀
    EDA精英<b class='flag-5'>挑戰(zhàn)賽</b><b class='flag-5'>賽</b>果公布!思爾芯“戰(zhàn)隊(duì)”薪火相承<b class='flag-5'>斬獲</b>“麒麟杯”

    蔚來獲得CACSI車型滿意度和售后服務(wù)滿意度第一名

    近日,由中國質(zhì)量協(xié)會發(fā)布的2024年中國新能源汽車用戶滿意度測評結(jié)果(CACSI)出爐。蔚來ET5T榮獲純電動中型轎車滿意度第一名,蔚來品牌榮獲售后服務(wù)滿意度第一名。蔚來已連續(xù)兩年獲得
    的頭像 發(fā)表于 12-06 17:19 ?1930次閱讀

    理想L6和理想L8榮獲中國新能源汽車用戶滿意度測評第一名

    近日,中國質(zhì)量協(xié)會發(fā)布2024年中國新能源汽車行業(yè)用戶滿意度測評(NEV-CACSI)結(jié)果,理想L6獲2024年市場關(guān)注新車(SUV) 第一名,理想L8也成為混動中大型SUV第一名。雙雙登頂,證明著
    的頭像 發(fā)表于 12-05 14:00 ?1039次閱讀

    廣汽埃安榮獲2024年中國新能源品牌售后服務(wù)滿意度第一名

    近日,由中國汽車維修行業(yè)協(xié)會主辦的2024年汽車售后服務(wù)客戶滿意度調(diào)查(CAACS卡思調(diào)查)發(fā)布會上,廣汽埃安憑借“智慧高效”的售后服務(wù),從眾多新能源品牌中脫穎而出,榮獲“2024年中國新能源品牌售后服務(wù)滿意度第一名”!
    的頭像 發(fā)表于 11-28 16:00 ?1060次閱讀

    2024年ICPC與華為挑戰(zhàn)賽冠軍杯圓滿落幕

    近日,2024年ICPC&華為挑戰(zhàn)賽冠軍杯在深圳圓滿落幕。該活動由華為和ICPC聯(lián)合舉辦,匯聚全球頂尖的編程人才,共同探討和解決具有挑戰(zhàn)性的工業(yè)界真實(shí)問題,并對未來技術(shù)發(fā)展趨勢及關(guān)鍵挑戰(zhàn)展開討論。今年的
    的頭像 發(fā)表于 10-27 16:00 ?1308次閱讀

    PI助力aCentauri車隊(duì)在太陽能車挑戰(zhàn)賽中大放異彩

    在2023年10月,Power Integrations (PI) 為當(dāng)時(shí)舉行的普利司通世界太陽能車挑戰(zhàn)賽提供了先進(jìn)的技術(shù)和支持。
    的頭像 發(fā)表于 10-27 14:08 ?668次閱讀
    PI助力aCentauri車隊(duì)在太陽能車<b class='flag-5'>挑戰(zhàn)賽</b>中大放異彩

    50萬獎金池!開放原子大賽——第二屆OpenHarmony創(chuàng)新應(yīng)用挑戰(zhàn)賽正式啟動

    第二屆OpenHarmony創(chuàng)新應(yīng)用挑戰(zhàn)賽作為開放原子大賽旗下的重要項(xiàng),聚焦 OpenHarmony應(yīng)用開發(fā),致力提升開發(fā)者的動手實(shí)踐能力與開發(fā)創(chuàng)新應(yīng)用的能力。 項(xiàng)要求開發(fā)者
    發(fā)表于 10-24 15:40

    思爾芯題正式發(fā)布,邀你共戰(zhàn)EDA精英挑戰(zhàn)賽

    題發(fā)布COMPETITIONRELEASE2024中國研究生創(chuàng)芯大賽·EDA精英挑戰(zhàn)賽(原“集成電路EDA設(shè)計(jì)精英挑戰(zhàn)賽”)現(xiàn)已正式拉開帷幕。作為核心出題企業(yè)之思爾芯(S2C),已
    的頭像 發(fā)表于 08-03 08:24 ?1050次閱讀
    思爾芯<b class='flag-5'>賽</b>題正式發(fā)布,邀你共戰(zhàn)EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>!

    評測活動第一名李工:我用Jupiter畫了個(gè)原理圖,然后成了段子手…

    為昕邀請了這次參與Jupiter評測活動的第一名獲獎?wù)呃罟李工寫下評測感想,沒想到,是位工程師界的段子手——爆笑時(shí)刻到來→李工感想各位EDA界的老鐵們,聽我給你們吹個(gè)牛!最近我參加了為昕軟件試用
    的頭像 發(fā)表于 07-31 17:42 ?1064次閱讀
    評測活動<b class='flag-5'>第一名</b>李工:我用Jupiter畫了個(gè)原理圖,然后成了段子手…

    軟通動力榮獲2023年中國IT服務(wù)市場第一名

    近日,迪顧問最新發(fā)布《2023-2024年中國IT服務(wù)市場研究年度報(bào)告》。報(bào)告中,軟通動力憑借在數(shù)字化轉(zhuǎn)型浪潮中卓越的數(shù)字化能力和表現(xiàn),持續(xù)領(lǐng)跑IT服務(wù)市場,位列2023年中國IT服務(wù)市場第一名
    的頭像 發(fā)表于 07-31 10:18 ?804次閱讀

    潤和軟件連續(xù)四年蟬聯(lián)數(shù)字業(yè)務(wù)類解決方案市場第一名

    ,連續(xù)四年蟬聯(lián)數(shù)字業(yè)務(wù)類解決方案市場第一名。在細(xì)分領(lǐng)域:數(shù)字信貸系統(tǒng)解決方案子市場持續(xù)保持第一名,數(shù)字銀行解決方案子市場穩(wěn)居第二,開放銀行解決方案子市場上升至第三。 ? 數(shù)字業(yè)務(wù)類
    的頭像 發(fā)表于 07-31 10:10 ?977次閱讀
    主站蜘蛛池模板: 午夜艹逼 | 视频一区 日韩 | 色噜噜狠狠狠狠色综合久 | 三级精品 | 国产乱码精品一区二区 | 欧美精品久久久久久久小说 | 欧美午夜视频在线 | 中国一级特黄真人毛片免费看 | 欧美最猛黑人xxxx黑人猛交黄 | 天天操天天爱天天干 | 一级视频在线免费观看 | 成人啪啪免费视频 | 欧美极品另类 | v视界影院最新地址 | 中国毛茸茸bbxx | 丝袜紧身裙国产在线播放 | 天天干天天操天天舔 | 天天操天天干天天操 | 在线视频一本 | 亚洲人成网i8禁止 | 国产手机免费视频 | 天天插天天射天天操 | 中文字幕视频一区二区 | 久久久国产精品免费看 | 婷婷99视频精品全部在线观看 | 亚洲区一二三四区2021 | 激情文学综合丁香 | 欧美性白人极品1819hd高清 | 天天插天天操 | 俄罗斯美女69xxxxxx | 全免费一级午夜毛片 | 色播五月激情五月 | 亚洲综合色就色手机在线观看 | 精品一精品国产一级毛片 | 国产成人一级片 | 久久国产香蕉一区精品 | 欧美三级在线观看视频 | 免费看美女的逼 | 自拍你懂的 | 你懂得在线播放 | 在线观看国产三级 |