在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種用于學習ZSL無偏嵌入的直接但有效的方法

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-07-03 11:15 ? 次閱讀

本文提出了一種用于學習ZSL無偏嵌入的直接但有效的方法。這種方法假設標注的源數據和未標注的目標數據在模型訓練的過程中可以使用,在各種基準數據集上的實驗表明,該方法大幅超過了現有的ZSL方法。

大多數現有的零樣本學習(Zero-Shot Learning,ZSL)方法都存在強偏問題:訓練階段看不見(目標)類的實例在測試時往往被歸類為所看到的(源)類之一。因此,在廣義ZSL設置中部署后,它們的性能很差。在本文,我們提出了一個簡單而有效的方法,稱為準完全監督學習(QFSL),來緩解此問題。我們的方法遵循直推式學習的方式,假定標記的源圖像和未標記的目標圖像都可用于訓練。在語義嵌入空間中,被標記的源圖像被映射到由源類別指定的若干個嵌入點,并且未標記的目標圖像被強制映射到由目標類別指定的其他點。在AwA2,CUB和SUN數據集上進行的實驗表明,我們的方法在遵循廣義ZSL設置的情況下比現有技術的方法優越9.3%至24.5%,在遵循傳統ZSL設置下有0.2%至16.2%的提升。

歸納式和直推式零樣本學習

在大規模的訓練數據集的支撐下,計算機視覺中的物體識別算法在近幾年取得了突破性的進展。但是人工收集和標注數據是一項十分耗費人力物力的工作。例如,在細粒度分類中,需要專家來區分不同的類別。對于如瀕臨滅絕的物種,要收集到豐富多樣的數據就更加困難了。在給定有限或者沒有訓練圖片的情況下,現在的視覺識別模型很難預測出正確的結果。

零樣本學習是一類可以用于解決以上問題的可行方法。零樣本學習區分2種不同來源的類,源類(source)和目標類(target),其中源類是有標注的圖像數據,目標類是沒有標注的圖像數據。為了能夠識別新的目標類(無標注),零樣本學習假定源類和目標類共享同一個語義空間。圖像和類名都可以嵌入到這個空間中。語義空間可以是屬性(attribute)、詞向量(word vector)等。在該假設下,識別來自目標類的圖像可以通過在上述語義空間中進行最近鄰搜索達成。

根據目標類的無標注數據是否可以在訓練時使用,現有的ZSL可以分為2類:歸納式ZSL(inductive ZSL)和直推式ZSL(transductive ZSL)。對于歸納式ZSL,訓練階段只能獲取得到源類數據。對于直推式ZSL,訓練階段可以獲取到有標注的源類數據和未標注的目標類數據。直推式ZSL希望通過同時利用有標注的源類和無標注的目標類來完成ZSL任務。

在測試階段,大多數現有的歸納式ZSL和直推式ZSL都假定測試圖像都來源于目標類。因此,對測試圖片分類的搜索空間被限制在目標類中。我們把這種實驗設定叫作傳統設定(conventional settings)。然而,在一個更加實際的應用場景中,測試圖像不僅來源于目標類,還可能來自源類。這種情況下,來自源類和目標類的數據都應該被考慮到。我們把這種設定叫作廣義設定(generalized settings)。

現有的ZSL方法在廣義設定下的效果遠差于傳統設定。這種不良的表現的主要原因可以歸納如下:ZSL通過建立視覺嵌入和語義嵌入之間的聯系來實現新的類別的識別。在銜接視覺嵌入和語義嵌入的過程中,大多數現有的ZSL方法存在著強偏 (strong bias)的問題(如圖1所示):在訓練階段,視覺圖片通常被投影到由源類確定的語義嵌入空間中的幾個固定的點。這樣就導致了在測試階段中,在目標數據集中的新類圖像傾向于被分到源類當中。

圖1

為了解決以上問題,本文提出了一種新的直推式ZSL方法。我們假定有標注的源數據和目標數據都可以在訓練階段得到。一方面,有標注的源數據可以用于學習圖像與語義嵌入之間的關系。另外一方面,沒有標注的目標數據可以用于減少由于源類引起的偏置問題。更確切地來說,我們的方法允許輸入圖像映射到其他的嵌入點上,而不是像其他ZSL方法將輸入圖像映射到固定的由源類確定的幾個點上。這樣有效地緩解了偏置問題。

我們將這種方法稱為準全監督學習(Quasi-Fully Supervised Learning, QFSL)。這種方法和傳統的全監督分類工作方式相似,由多層神經網絡和一個分類器組成,如圖2所示。神經網絡模型架構采用現有的主流架構,比如AlexNet、GoogleNet或者其他框架。在訓練階段,我們的模型使用有標注的源類數據和沒有標注的目標數據進行端到端的訓練。這使得我們的模型有一兩個個明顯的特性:(1)如果未來可以得到目標類的標注數據,那么標注數據可以直接用于進一步訓練和改進現有的網絡模型;(2)在測試階段,我們得到的訓練模型可以直接用于識別來自于源類和目標類的圖像,而不需要進行任何修改。

本論文的主要貢獻總結如下:

提出了準全監督學習的方法來解決零樣本學習中的強偏問題。據我們所知,這是第一個采用直推式學習方法來解決廣義設定下零樣本學習問題。

實驗結果表明我們的方法在廣義設定下和傳統設定下都遠超現有的零樣本學習方法。

問題的形式化

假設存在一個源數據集? , 每張圖片與相應的標簽對應,其中, S表示源類中類的個數。目標數據集, 每張圖片與相應的標簽對應,其中,? T表示目標類中類的個數。ZSL的目標就是學習如下所示的預測函數:

其中是一個得分函數,其目標是正確的標注比其他不正確的標注具有更高的得分。是模型

其中分別表示視覺嵌入和語義嵌入。得分函數通常使用帶正則化的目標函數進行優化:

其中表示分類損失,用于學習視覺嵌入和語義嵌入之間的映射。表示用于約束模型復雜度的正則項。

本文假設給定標注源數據集,無標注目標數據集和語義嵌入,學習ZSL模型,使得其既能在傳統設定下又能在廣義設定下獲取良好的表現。

QFSL模型

不同于以上描述的雙線性形式,我們將得分函數F設計成非線性形式。整個模型由深度神經網絡實現。模型包括4個模塊:視覺嵌入子網絡,視覺-語義銜接子網絡,得分子網絡和分類器。視覺嵌入子網絡將原始圖像映射到視覺嵌入空間。視覺-語義銜接子網絡將視覺嵌入映射到語義嵌入子網絡。得分子網絡在語義空間中產生每一類的得分。分類器根據得分輸出最終的預測結果。所有的模塊都是可微分的,包括卷積層,全連接層,ReLU層和softmax層。因此,我們的模型可以進行端到端的訓練。

視覺嵌入子網絡

現有的大多數模型采用了CNN提取得到的特征作為視覺嵌入。在這些方法中,視覺嵌入函數θ是固定的。這些方法并沒有充分利用深度CNN的強大的學習能力。本文采用了預訓練的CNN模型來進行視覺嵌入。我們的視覺嵌入模型的主要不同之處在于可以和其他模塊一起進行優化。視覺嵌入模塊的參數記為。除非特別說明,我們把第一個全連接層的輸出作為視覺嵌入。

視覺-語義銜接子網絡

銜接圖像和語義嵌入之間的關系對ZSL來說很重要。這種關系可以通過線性函數或者非線性函數來建模。本文采用了非線性函數將視覺嵌入映射到語義嵌入。?

得分子網絡

銜接視覺嵌入和語義嵌入之后,識別任務可以通過在語義嵌入空間中使用最近鄰搜索來實現。

給定一張圖像,我們首先通過視覺嵌入子網絡得到它的視覺嵌入。然后,利用視覺-語義銜接子網絡,完成從視覺嵌入到語義嵌入的映射。最后,我們通過內積計算得到投影得到的視覺嵌入和語義嵌入的得分。因此,得分函數可以表示如下:

其中是 y 的歸一化語義嵌入:

得分函數由單個全連接層來實現。它的權重使用源類和目標類的歸一化語義:來初始化。和視覺嵌入子網絡和視覺-語義銜接子網絡不同的是,得分子網絡的權重是固定的,在訓練階段不參與更新。通過這種方式,我們的模型將圖像投影到與視覺嵌入相近的方向上。

需要注意的是目標類的數據沒有標注,這些數據在我們的方法中用到了訓練階段當中。因此,在訓練階段,我們的模型對于一張給定的圖像,產生了個得分。

分類器

經過得分函數后,我們使用路的softmax分類器產生了所有類的概率。輸入圖像的預測結果為概率最高的那個類。

模型優化

我們的方法采用了類似于由

通常,傳統的全監督分類器的損失函數包括分類損失和正則化損失Ω。和傳統定義不同,我們提出的QFSL結合了一個額外的偏置損失來緩解強偏問題:?

其中,表示預測為類 i 的概率。給定一個來自目標類的實例,該損失鼓勵模型增加所有目標類的概率和。這樣可以防止目標類被映射到源類中。

對于分類損失范數來約束訓練參數用于平衡不同損失之間的權重,通過交叉驗證來確定。在訓練階段,所有標注的數據和未標注的數據混合在一起作為訓練數據。模型使用隨機梯度下降算法(SGD)進行優化。每一個批(batch)訓練圖像從混合數據集中隨機抽取。實驗結果表明我們的方法不僅有效地避免了偏置問題,還幫助建立起了更好的視覺嵌入和語義嵌入之間的聯系。

實驗

數據集

我們在三個數據集上評估了我們的方法。這三個數據集分別為AwA2, CUB, SUN。在實驗中,我們采用屬性作為語義空間,用類平均準確度衡量模型效果。

在傳統設置下的效果比較

首先我們在傳統設置下對我們方法和現有方法。用來做對比的現有方法分為兩類:一類是是歸納式方法,包括DAP,CONSE,SSE,ALE,DEVISE,SJE,ESZSL,SYNC;另一類是直推式方法,包含UDA,TMV,SMS。與此同時,還比較了一個潛在的baseline(標記為QFSL-):只用有標注的源數據來訓練我們的模型。實驗效果如表1。可以看出,我們的方法大幅度(4.5~16.2%)提升了分類準確度。

表1. 在傳統設置下的實驗比較

在廣義設置下的效果比較

大多數現有直推式方法在測試階段都采用了同訓練階段同樣的數據來評估性能。然而,如果我們的方法也采用這種方式來評估效果是很不合理的。因為我們的方法已經利用到了無標簽的數據來源于目標類這一監督信息。為了解決這一問題,我們將目標數據平分為兩份,一份用來訓練,另一份用來測試。然后交換這兩份數據的角色,再重新訓練一個模型。最終的效果為這兩個模型的平均。我們比較了我們的方法和若干現有方法,以及一個隱含的baseline:先訓練一個二分類器來區分源數據和目標數據,然后再在各自搜索空間中分類。實驗結果如表2。

表2

可以看出,我們模型的整體性能(調和平均數H)有著9.3~24.5的明顯提高。該項指標的提高主要得益于在目標數據上的效果提升,同時又沒有在源數據上大幅度降低準確度。該結果表明,我們的方法能夠很大程度上緩解強偏問題。

討論

現實世界中,目標類的數量可能遠遠高于源類數量。然而,大多數現有ZSL數據集的源、目標數據劃分都違背了這一點。比如,在AwA2中,40個類用來做訓練,10個類用來做測試。我們在實驗上給出了隨著源數據類別的增加,QFSL在效果上如何變化。該實驗在SUN數據集上進行,72類作為目標類,隨機選取剩下的類作為源類。我們嘗試了7個大小不同的源類集,類的數量分別為{100,200,300,450,550,600,645}。用這些不同大小的源類作為訓練集,測試我們的方法,效果如圖3。由圖可以看出,隨著類別增加,模型能夠學習到更多的知識,其在目標數據集上準確度越來越高。同時,由于源數據和目標數據變得越來越不平衡,強偏問題越來越嚴重。我們方法能夠緩解強偏問題,因而其在效果上的優越性也越來越明顯。

圖3. 準全監督在SUN數據集上效果

結論

本文提出了一種用于學習ZSL無偏嵌入的直接但有效的方法。這種方法假設標注的源數據和未標注的目標數據在模型訓練的過程中可以使用。一方面,將標注的源數據映射到語義空間中源類對應的點上。另外一方面,將沒有標注的目標數據映射到語義空間中目標類對應的點上,從而有效地解決了模型預測結果向源類偏置的問題。在各種基準數據集上的實驗表明我們的方法在傳統設定和廣義設定下,大幅超過了現有的ZSL方法。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4798

    瀏覽量

    102466
  • 圖像
    +關注

    關注

    2

    文章

    1091

    瀏覽量

    40946
  • 數據集
    +關注

    關注

    4

    文章

    1222

    瀏覽量

    25228

原文標題:CVPR 2018:阿里提出新零樣本學習方法,有效解決偏置問題

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    一種刷直流電機霍耳信號與定子繞組關系自學習方法

    的關系。提出了一種刷直流電機霍耳信號與定子繞組關系自學習方法,該方法通過不同的繞組通電組合將電機轉子依次轉到6個不同的位置并記錄對應的霍耳信號,然后得出霍耳信號與定子繞組的對應關系。
    發表于 03-25 15:15

    一種基于UML的嵌入式系統可視化開發方法

    本文結合統建模語言UML,提出一種嵌入式系統可視化開發方法,并將其實際運用到了嵌入式遠程溫度監控系統的開發過程中,驗證了該
    發表于 04-27 06:47

    求大佬分享一種嵌入式系統中串口通信幀的同步方法

    本文針對該問題給出了逐次比較、基于FIFO隊列和基于狀態機的3幀同步方法。通過測試、分析和比較得出,基于有限狀態機的方法嵌入式系統串口通信中很
    發表于 05-27 06:52

    介紹一種解決overconfidence簡潔但有效方法

    會在模型部署期間帶來些問題。所以我們希望能夠設計有效的智能模型,使其能夠識別出 OOD 數據,對其進行系列的干預。本文介紹一種非常有
    發表于 08-24 15:11

    一種具有漸進學習能力的融合方法

    運行在動態與未知環境下的多傳感器系統往往會面臨環境與自身結構的漸進式變化,導致般的具有學習能力的融合方法很難適用. 本文提出了一種具有漸進學習
    發表于 07-08 14:25 ?14次下載

    一種可生存嵌入式系統性能監測方法研究

    該文將信息系統中生存性的概念應用于單機嵌入式系統當中,首先設計了一種單機嵌入式可生存系統的模型,之后基于該模型提出了一種以性能作為指標的監測
    發表于 07-30 09:29 ?18次下載

    一種在U-BOOT中嵌入千兆網絡功能的方法

    一種在U-BOOT中嵌入千兆網絡功能的方法摘 要:U-BOOT是一種開放源碼的、用于多種嵌入式微
    發表于 02-05 17:38 ?17次下載

    一種簡單有效的限流保護電路

    一種簡單有效的限流保護電路   摘要:提出了一種簡單有效的限流保護電路,論述了該保護電路應用于
    發表于 07-11 10:52 ?3542次閱讀

    二極管原理是什么?

    二極管原理是什么? 二極管原理 從伏打電池原理我們知道兩金屬A和B之間存在著
    發表于 02-27 16:11 ?3541次閱讀

    一種改進的鎖相環FBD諧波電流檢測方法

    一種改進的鎖相環FBD諧波電流檢測方法_王清亮
    發表于 01-05 15:24 ?2次下載

    一種簡化的永磁刷直流電機直接轉矩控制方法

    一種簡化的永磁刷直流電機直接轉矩控制方法
    發表于 01-21 12:00 ?4次下載

    一種在線學習的跟蹤注冊方法

    三維注冊是移動增強現實的關鍵技術之,提出了一種在線學習的跟蹤注冊方法,能夠精確地對自然場景進行跟蹤注冊.該方法首先改進SURF(speed
    發表于 01-08 16:21 ?0次下載

    Abacus展示了一種用于深度學習的新方法的技術

    與1月份的最后次重大公告樣,該公司還展示了一種用于深度學習的新方法的技術,在這種情況下,該公
    的頭像 發表于 07-22 10:26 ?5200次閱讀

    一種有效監督深度表示器(Mix2Vec)

    本文由深蘭科學院撰寫,文章將為大家細致講解一種有效監督深度表示器(Mix2Vec),該方法可將異構數據映射到統的低維向量空間,避免混合
    的頭像 發表于 03-24 17:22 ?1828次閱讀

    一種透鏡成像的新方法

    使用OAM-HHG EUV光束對高度周期性結構進行成像的EUV聚光顯微鏡 為了研究微電子或光子元件中的納米級圖案,一種基于透鏡成像的新方法可以實現近乎完美的高分辨率顯微鏡。 層析成像是一種
    的頭像 發表于 07-19 06:20 ?632次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>無</b>透鏡成像的新<b class='flag-5'>方法</b>
    主站蜘蛛池模板: 高清一区二区三区视频 | 日本黄色录像视频 | 天天射久久| 老熟女毛片 | 亚洲成在人色婷婷 | 亚洲天堂bt | 色综合激情丁香七月色综合 | 国产h在线播放 | 爱爱免费网址 | 九九九精品 | 四虎永久免费地址在线网站 | 2017av在线| 亚洲欧洲一区二区三区在线观看 | 亚洲高清国产拍精品影院 | 国产重口老太和小伙乱视频 | 亚洲合集综合久久性色 | 亚洲婷婷影院 | 天天干在线观看 | se94se亚洲欧美在线 | 日本加勒比官网 | 国产一级做a爱免费视频 | 在线黄色免费 | 日本xxxxbbbb | 毛片你懂的 | 怡红院精品视频 | 国产一级做a爰片久久毛片男 | 黄 色 录像成 人播放免费 | 91网站在线播放 | 一区二区在线观看高清 | 色综合久久一区二区三区 | 91啦中文在线观看 | 免费抓胸吻胸激烈视频网站 | 九九热在线免费观看 | 精品久久免费观看 | 台湾一级毛片 | 手机在线观看一级午夜片 | 人人插人人艹 | 播放欧亚一级特黄录像 | 欧美三级免费看 | chinese国产videoxx实拍 | 亚洲qingse中文久久网 |