在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

哈工大南洋理工提出全球首個「多模態(tài)DeepFake檢測定位」模型:讓AIGC偽造無處可藏

OpenCV學(xué)堂 ? 來源:新智元 ? 2023-04-11 09:30 ? 次閱讀

【導(dǎo)讀】為了應(yīng)對多模態(tài)假新聞,本文提出檢測并定位多模態(tài)媒體篡改任務(wù)(DGM)。與現(xiàn)有的單模態(tài)DeepFake檢測任務(wù)相比,DGM不僅判斷輸入圖像-文本對的真假,也嘗試定位篡改內(nèi)容(例如圖像篡改區(qū)域和文本篡改單詞)。

由于如Stable Diffusion等視覺生成模型的快速發(fā)展,高保真度的人臉圖片可以自動化地偽造,制造越來越嚴(yán)重的DeepFake問題。

隨著如ChatGPT等大型語言模型的出現(xiàn),大量假本文也可以容易地生成并惡意地傳播虛假信息。

為此,一系列單模態(tài)檢測模型被設(shè)計出來,去應(yīng)對以上AIGC技術(shù)在圖片和文本模態(tài)的偽造。但是這些方法無法較好應(yīng)對新型偽造場景下的多模態(tài)假新聞篡改。

具體而言,在多模態(tài)媒體篡改中,各類新聞報道的圖片中重要人物的人臉(如圖 1 中法國總統(tǒng)人臉)被替換,文字中關(guān)鍵短語或者單詞被篡改(如圖 1 中正面短語「is welcome to」被篡改為負(fù)面短語「is forced to resign」)。

這將改變或掩蓋新聞關(guān)鍵人物的身份,以及修改或誤導(dǎo)新聞文字的含義,制造出互聯(lián)網(wǎng)上大規(guī)模傳播的多模態(tài)假新聞。

a8d26e1c-d805-11ed-bfe3-dac502259ad0.png

圖1. 本文提出檢測并定位多模態(tài)媒體篡改任務(wù)(DGM4)。與現(xiàn)有的單模態(tài)DeepFake檢測任務(wù)不同,DGM4不僅對輸入圖像-文本對預(yù)測真假二分類,也試圖檢測更細(xì)粒度的篡改類型和定位圖像篡改區(qū)域和文本篡改單詞。除了真假二分類之外,此任務(wù)對篡改檢測提供了更全面的解釋和更深入的理解。

a8f31978-d805-11ed-bfe3-dac502259ad0.png

表1: 所提出的DGM4與現(xiàn)有的圖像和文本偽造檢測相關(guān)任務(wù)的比較

檢測并定位多模態(tài)媒體篡改任務(wù)

為了解此新挑戰(zhàn),來自哈工大(深圳)和南洋理工的研究人員提出了檢測并定位多模態(tài)媒體篡改任務(wù)(DGM4)、構(gòu)建并開源了DGM4數(shù)據(jù)集,同時提出了多模態(tài)層次化篡改推理模型。目前,該工作已被CVPR 2023收錄。

a907a258-d805-11ed-bfe3-dac502259ad0.png

論文地址:https://arxiv.org/abs/2304.02556

GitHub:https://github.com/rshaojimmy/MultiModal-DeepFake

項目主頁:https://rshaojimmy.github.io/Projects/MultiModal-DeepFake

如圖1和表1所示,檢測并定位多模態(tài)媒體篡改任務(wù)(Detecting and Grounding Multi-Modal Media Manipulation (DGM4))和現(xiàn)有的單模態(tài)篡改檢測的區(qū)別在于:

1)不同于現(xiàn)有的DeepFake圖像檢測與偽造文本檢測方法只能檢測單模態(tài)偽造信息,DGM4要求同時檢測在圖像-文本對中的多模態(tài)篡改;

2)不同于現(xiàn)有DeepFake檢測專注于二分類,DGM4進(jìn)一步考慮了定位圖像篡改區(qū)域和文本篡改單詞。這要求檢測模型對于圖像-文本模態(tài)間的篡改進(jìn)行更全面和深入的推理。

檢測并定位多模態(tài)媒體篡改數(shù)據(jù)集

為了支持對DGM4研究,如圖2所示,本工作貢獻(xiàn)了全球首個檢測并定位多模態(tài)媒體篡改(DGM4)數(shù)據(jù)集。

a91aad1c-d805-11ed-bfe3-dac502259ad0.png

圖2. DGM4數(shù)據(jù)集

DGM4數(shù)據(jù)集調(diào)查了4種篡改類型,人臉替換篡改(FS)、人臉屬性篡改(FA)、文本替換篡改(TS)、文本屬性篡改(TA)。

圖2展示了 DGM4整體統(tǒng)計信息,包括(a) 篡改類型的數(shù)量分布;(b) 大多數(shù)圖像的篡改區(qū)域是小尺寸的,尤其是對于人臉屬性篡改;(c) 文本屬性篡改的篡改單詞少于文本替換篡改;(d)文本情感分?jǐn)?shù)的分布;(e)每種篡改類型的樣本數(shù)。

此數(shù)據(jù)共生成23萬張圖像-文本對樣本,包含了包括77426個原始圖像-文本對和152574個篡改樣本對。篡改樣本對包含66722個人臉替換篡改,56411個人臉屬性篡改,43546個文本替換篡改和18588個文本屬性篡改。

多模態(tài)層次化篡改推理模型

本文認(rèn)為多模態(tài)的篡改會造成模態(tài)間細(xì)微的語義不一致性。因此通過融合與推理模態(tài)間的語義特征,檢測到篡改樣本的跨模態(tài)語義不一致性,是本文應(yīng)對DGM4的主要思路。

a93dddb4-d805-11ed-bfe3-dac502259ad0.png

圖3. 提出的多模態(tài)層次化篡改推理模型HierArchical Multi-modal Manipulation rEasoning tRansformer (HAMMER)

基于此想法,如圖3所示,本文提出了多模態(tài)層次化篡改推理模型HierArchical Multi-modal Manipulation rEasoning tRansformer (HAMMER)。

此模型建立在基于雙塔結(jié)構(gòu)的多模態(tài)語義融合與推理的模型架構(gòu)上,并將多模態(tài)篡改的檢測與定位細(xì)粒度層次化地通過淺層與深層篡改推理來實(shí)現(xiàn)。

具體而言,如圖3所示,HAMMER模型具有以下兩個特點(diǎn):

1)在淺層篡改推理中,通過篡改感知的對比學(xué)習(xí)(Manipulation-Aware Contrastive Learning)來對齊圖像編碼器和文本編碼器提取出的圖像和文本單模態(tài)的語義特征。同時將單模態(tài)嵌入特征利用交叉注意力機(jī)制進(jìn)行信息交互,并設(shè)計局部塊注意力聚合機(jī)制(Local Patch Attentional Aggregation)來定位圖像篡改區(qū)域;

2)在深層篡改推理中,利用多模態(tài)聚合器中的模態(tài)感知交叉注意力機(jī)制進(jìn)一步融合多模態(tài)語義特征。在此基礎(chǔ)上,進(jìn)行特殊的多模態(tài)序列標(biāo)記(multi-modal sequence tagging)和多模態(tài)多標(biāo)簽分類(multi-modal multi-label classification)來定位文本篡改單詞并檢測更細(xì)粒度的篡改類型。

實(shí)驗(yàn)結(jié)果

如下圖,實(shí)驗(yàn)結(jié)果表明研究團(tuán)隊提出的HAMMER與多模態(tài)和單模態(tài)檢測方法相比,都能更準(zhǔn)確地檢測并定位多模態(tài)媒體篡改。

a955d14e-d805-11ed-bfe3-dac502259ad0.png

a97996e2-d805-11ed-bfe3-dac502259ad0.png

a990996e-d805-11ed-bfe3-dac502259ad0.png

a9aaddd8-d805-11ed-bfe3-dac502259ad0.png

圖4. 多模態(tài)篡改檢測和定位結(jié)果可視化

aaa0368e-d805-11ed-bfe3-dac502259ad0.png

圖5. 關(guān)于篡改文本的模型篡改檢測注意力可視化

圖4提供了一些多模態(tài)篡改檢測和定位的可視化結(jié)果,說明了HAMMER可以準(zhǔn)確地同時進(jìn)行篡改檢測與定位任務(wù)。圖5提供了關(guān)于篡改單詞的模型注意力可視化結(jié)果,進(jìn)一步展示了HAMMER是通過關(guān)注與篡改文本語義不一致性的圖像區(qū)域來進(jìn)行多模態(tài)篡改檢測和定位。

總結(jié)

本工作提出了一個新的研究課題:檢測并定位多模態(tài)媒體篡改任務(wù),來應(yīng)對多模態(tài)假新聞。

本工作貢獻(xiàn)了首個大規(guī)模的檢測并定位多模態(tài)媒體篡改數(shù)據(jù)集,并提供了詳細(xì)豐富的篡改檢測與定位的標(biāo)注。團(tuán)隊相信它可以很好地幫助未來多模態(tài)假新聞檢測的研究。

本工作提出了一個強(qiáng)大的多模態(tài)層次化篡改推理模型作為此新課題很好的起始方案。

本工作的代碼和數(shù)據(jù)集鏈接都已分享在本項目的GitHub上,歡迎大家Star這個GitHub Repo, 使用DGM4數(shù)據(jù)集和HAMMER來研究DGM4問題。DeepFake領(lǐng)域不只有圖像單模態(tài)檢測,還有更廣闊的多模態(tài)篡改檢測問題亟待大家解決!

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    54

    文章

    11235

    瀏覽量

    105757
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    560

    瀏覽量

    10694
  • 圖像檢測
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    12020

原文標(biāo)題:CVPR 2023|哈工大南洋理工提出全球首個「多模態(tài)DeepFake檢測定位」模型:讓AIGC偽造無處可藏

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學(xué)堂】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    手機(jī)設(shè)計基本知識哈工大版本(good),非常不錯的!!!

    手機(jī)設(shè)計基本知識哈工大版本(good),非常不錯的!!!
    發(fā)表于 08-10 22:39

    哈工大DSP學(xué)習(xí)資料

    哈工大DSP學(xué)習(xí)資料
    發(fā)表于 10-16 22:28

    哈工大《軟件工程》全套課件完整版

    哈工大《軟件工程》全套課件完整版
    發(fā)表于 11-07 11:40

    單片機(jī)課程(來自哈工大

    送單片機(jī)課程(哈工大)![hide] 鏈接:http://pan.baidu.com/s/1o81rMQY 密碼:qvh4[/hide]
    發(fā)表于 11-07 19:01

    基于邊緣計算的全球定位系統(tǒng)欺騙檢測方法

    “目前GNSS欺騙檢測方法有很多,但是大多數(shù)方法需要較強(qiáng)的信號處理能力和附加設(shè)備,例如接收器,這些附加設(shè)備可能不適用于車輛和智能手機(jī)。本文提出了一種新的基于邊緣計算的方法來重建丟失的全球定位系統(tǒng)信號
    發(fā)表于 11-09 15:12

    哈工大DSP教程

    哈工大DSP教程
    發(fā)表于 07-28 10:36 ?130次下載
    <b class='flag-5'>哈工大</b>DSP教程

    哈工大CERP系統(tǒng)

    哈工大CERP系統(tǒng)  java+weblogic實(shí)現(xiàn),比較有學(xué)習(xí)價值,嚴(yán)禁商業(yè)使用。
    發(fā)表于 03-16 15:53 ?18次下載

    是德科技為新加坡南洋理工大學(xué)提供先進(jìn)設(shè)計和驗(yàn)證解決方案

    是德科技(NYSE:KEYS)宣布,新加坡南洋理工大學(xué)(NTU)選中了該公司以軟件為中心的測試和測量解決方案,用于推進(jìn)基于太赫茲頻率的 6G 技術(shù)。
    的頭像 發(fā)表于 06-07 14:44 ?1533次閱讀

    哈工大機(jī)械制造基礎(chǔ)課件

    哈工大機(jī)械制造基礎(chǔ)課件
    發(fā)表于 08-08 14:55 ?0次下載

    北大&amp;華為提出模態(tài)基礎(chǔ)大模型的高效微調(diào)

    深度學(xué)習(xí)的大模型時代已經(jīng)來臨,越來越多的大規(guī)模預(yù)訓(xùn)練模型在文本、視覺和模態(tài)領(lǐng)域展示出杰出的生成和推理能力。然而大模型巨大的參數(shù)量有兩個明顯
    的頭像 發(fā)表于 11-08 16:20 ?1578次閱讀
    北大&amp;華為<b class='flag-5'>提出</b>:<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>基礎(chǔ)大<b class='flag-5'>模型</b>的高效微調(diào)

    哈工大提出Myriad:利用視覺專家進(jìn)行工業(yè)異常檢測的大型模態(tài)模型

    最近,大型模態(tài)(即視覺和語言)模型(LMM)在圖像描述、視覺理解、視覺推理等多種視覺任務(wù)上表現(xiàn)出了卓越的感知能力,使其成為更易于理解的異常檢測的有競爭力的潛在選擇。然而,現(xiàn)有的通用
    的頭像 發(fā)表于 11-21 16:08 ?2936次閱讀
    <b class='flag-5'>哈工大提出</b>Myriad:利用視覺專家進(jìn)行工業(yè)異常<b class='flag-5'>檢測</b>的大型<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>模型</b>

    商湯科技聯(lián)合海通證券發(fā)布業(yè)內(nèi)首個面向金融行業(yè)的模態(tài)全棧式大模型

    4月23日,商湯科技正式推出“日日新SenseNova 5.0”大模型體系,并與海通證券聯(lián)合發(fā)布業(yè)內(nèi)首個面向金融行業(yè)的模態(tài)全棧式大模型
    的頭像 發(fā)表于 04-26 09:48 ?673次閱讀
    商湯科技聯(lián)合海通證券發(fā)布業(yè)內(nèi)<b class='flag-5'>首個</b>面向金融行業(yè)的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>全棧式大<b class='flag-5'>模型</b>

    傳音控股旗下TECNO與南洋理工大學(xué)ACRC達(dá)成戰(zhàn)略合作

    傳音旗下創(chuàng)新科技品牌TECNO宣布與新加坡南洋理工大學(xué)亞洲傳播研究中心(Asian Communication Research Centre, ACRC)達(dá)成戰(zhàn)略合作 ,通過深入研究東南亞地區(qū)膚色
    的頭像 發(fā)表于 09-29 16:18 ?942次閱讀

    從新加坡到深圳:南洋理工大學(xué)(NTU)與VoiceAI的深度對話

    近日,來自新加坡南洋理工大學(xué)的數(shù)十名師生到訪聲揚(yáng)科技深圳總部,與聲揚(yáng)科技“硬核科研團(tuán)”展開深度交流。公司聯(lián)合創(chuàng)始人、總經(jīng)理張偉彬博士出席交流會,與新加坡南洋理工大學(xué)師生們探討智能語音技
    的頭像 發(fā)表于 11-13 14:29 ?820次閱讀
    從新加坡到深圳:<b class='flag-5'>南洋</b><b class='flag-5'>理工大</b>學(xué)(NTU)與VoiceAI的深度對話

    天合光能與新加坡南洋理工大學(xué)簽約技術(shù)合作

    (CPE)共同開展,圍繞儲能配置規(guī)劃和能量管理關(guān)鍵技術(shù)及應(yīng)用項目,涵蓋從項目初始投資測算,項目配置設(shè)計到后期運(yùn)維管理等全流程智慧儲能解決方案。通過構(gòu)建AI+儲能等智慧解決方案,天合光能將攜手新加坡南洋理工大學(xué)進(jìn)一步為全球客戶提供
    的頭像 發(fā)表于 02-28 09:18 ?516次閱讀
    主站蜘蛛池模板: bt天堂网在线资源www | 欧美人与动性行为网站免费 | 国产深夜福利在线观看网站 | 谁有毛片网站 | 黄色大秀视频 | 可以直接看的黄址 | 高清性色生活片久久久 | 琪琪午夜伦埋大全影院 | 资源种子在线观看 | 久久久久久久性潮 | 免费国产不卡午夜福在线 | 5g影院午夜伴侣 | 日韩精品视频免费在线观看 | 91大神亚洲影视在线 | 国产乱码精品一区二区三区四川人 | 日本一区二区高清免费不卡 | 国产精品大片天天看片 | 热re99久久精品国产99热 | 国产一级大片免费看 | 午夜久久福利 | 在线天堂网 | 亚洲成a人片在线看 | 欧美黄色免费网站 | 丁香五月欧美成人 | 午夜黄页网站在线播放 | 一区视频在线 | 天天视频在线观看免费 | 四虎国产精品永久在线 | 亚洲国产综合久久精品 | 久久理论片| 无夜精品久久久久久 | 天天插天天狠 | 日本三级成人午夜视频网 | 久久天天躁夜夜躁狠狠85麻豆 | 伊人成伊人成综合网2222 | 亚洲免费毛片 | 自拍偷拍福利视频 | 色婷五月| 日本高清免费一本视频在线观看 | 国产资源站 | 色噜噜噜噜噜 |