在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何去解決文本到圖像生成的跨模態對比損失問題?

LiveVideoStack ? 來源:LiveVideoStack ? 作者:Google AI Blog ? 2021-06-15 10:07 ? 次閱讀

Google提出了一個跨模態對比學習框架來訓練用于文本到圖像合成的 GAN 模型,用于研究解決生成的跨模態對比損失問題。

從文本到圖像的自動生成,如何訓練模型僅通過一段文本描述輸入就能生成具體的圖像,是一項非常具有挑戰性的任務。

與其它指導圖像創建的輸入類型相比,描述性句子是一種更直觀、更靈活的視覺概念表達方式。強大的自動文本到圖像的生成系統可以成為快速、有效的內容生產、制作工具,用于更多具有創造性的應用當中。

在CVPR 2021中,Google提出了一個跨模態對比生成對抗網絡(XMC-GAN),訓練用于文本到圖像合成的 GAN 模型,通過模態間與模態內的對比學習使圖像和文本之間的互信息最大化,解決文本到圖像生成的跨模態對比損失問題。

poYBAGDIDJ-AfrniAADMgxcEq1k626.jpg

XMC-GAN 文本到圖像合成模型中的模態間和模態內對比學習

XMC-GAN 被成功應用于三個具有挑戰性的數據集:一個是MS-COCO 圖像描述集合,另外兩個是用Localized Narratives注釋的數據集,一個是包括MS-COCO 圖像(稱為LN-COCO) ,另一個描述開放圖像數據 (LN-OpenImages)。結果顯示 XMC-GAN生成圖像所描繪的場景相比于使用其它技術生成的圖像質量更高,在每個方面都達到了最先進的水平。

pYYBAGDIDI-AdQkNAAB3Ifj0XNA593.jpg

MS-COCO對圖像質量和文本對齊的人工評估

此外,XMC-GAN還在 LN-OpenImages 上進行了一系列訓練和評估,這相比于 MS-COCO 更具有挑戰性,由于數據集更大,圖像涵蓋主題范圍更加廣泛且復雜。

對于人類評估和定量指標,XMC-GAN 在多個數據集模型中相較之前有顯著的改進。可以生成與輸入描述非常匹配的高質量圖像,包括更長,更詳細的敘述,同時端到端模型的復雜度也相對較為簡單,這代表了從自然語言描述生成圖像的創造性應用的重大進步。

責任編輯:lq6

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1094

    瀏覽量

    41056
  • GaN
    GaN
    +關注

    關注

    19

    文章

    2184

    瀏覽量

    76250

原文標題:XMC-GAN:從文本到圖像的跨模態對比學習

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    如何使用離線工具od SPSDK生成完整圖像

    對我來說,完整圖像是指包含 keyblob、FCB 等的圖像。換句話說,圖像包含 0x30000000 0x30000FFF 之間的大約 4KB。 如果我理解正確,使用 SPT(以
    發表于 03-28 06:51

    一種多模態駕駛場景生成框架UMGen介紹

    端自動駕駛技術的快速發展對閉環仿真器提出了迫切需求,而生成式模型為其提供了一種有效的技術架構。然而,現有的駕駛場景生成方法大多側重于圖像模態
    的頭像 發表于 03-24 15:57 ?794次閱讀
    一種多<b class='flag-5'>模態</b>駕駛場景<b class='flag-5'>生成</b>框架UMGen介紹

    ?VLM(視覺語言模型)?詳細解析

    支持生成式任務。 多模態融合 :通過模態注意力機制、投影層(如CLIP將圖像文本映射到同一空間
    的頭像 發表于 03-17 15:32 ?2947次閱讀
    ?VLM(視覺語言模型)?詳細解析

    使用OpenVINO GenAI和LoRA適配器進行圖像生成

    借助生成式 AI 模型(如 Stable Diffusion 和 FLUX.1),用戶可以將平平無奇的文本提示詞轉換為令人驚艷的視覺效果。
    的頭像 發表于 03-12 13:49 ?676次閱讀
    使用OpenVINO GenAI和LoRA適配器進行<b class='flag-5'>圖像</b><b class='flag-5'>生成</b>

    海康威視文搜存儲系列:模態檢索,安防新境界

    海康威視推出的文搜存儲系列產品,引領了安防領域的信息檢索新革命。該產品憑借多模態大模型技術,實現了自然語言與視頻圖像模態信息檢索,將安防錄像回溯帶入了全新的智能時代。 用戶只需輸入
    的頭像 發表于 02-18 14:08 ?593次閱讀

    一文詳解視覺語言模型

    視覺語言模型(VLM)是一種多模態生成式 AI 模型,能夠理解和處理視頻、圖像文本
    的頭像 發表于 02-12 11:13 ?1556次閱讀
    一文詳解視覺語言模型

    #新年新氣象,大家新年快樂!#AIGC入門及鴻蒙入門

    ,基于擴散模型,能夠生成與給定文本描述相符的圖像。 鴻蒙系統入門 1.基礎知識:鴻蒙系統(HarmonyOS)是華為推出的一款分布式操作系統,旨在實現設備、
    發表于 01-13 10:46

    AIGC入門及鴻蒙入門

    模型,能夠生成與給定文本描述相符的圖像。 鴻蒙系統入門 1. 基礎知識: 鴻蒙系統(HarmonyOS)是華為推出的一款分布式操作系統,旨在實現設備、
    發表于 01-13 10:32

    淺析OpenVINO 2024.5的新功能

    ,事實上在安全、監控或醫療保健等某些領域至關重要。它代表了從處理文本到處理不同輸入和生成不同形式輸出的重大演變。例如,多模態模型可以接收長視頻,并以圖像或音頻片段的形式輸出關鍵信息。
    的頭像 發表于 11-25 17:12 ?591次閱讀

    生成式AI工具作用

    生成式AI工具是指那些能夠自動生成文本圖像、音頻、視頻等多種類型數據的人工智能技術。在此,petacloud.ai小編為您整理生成式AI工具作用。
    的頭像 發表于 10-28 11:19 ?659次閱讀

    如何使用 Llama 3 進行文本生成

    使用LLaMA 3(Large Language Model Family of AI Alignment)進行文本生成,可以通過以下幾種方式實現,取決于你是否愿意在本地運行模型或者使用現成的API
    的頭像 發表于 10-27 14:21 ?991次閱讀

    AIGC與傳統內容生成的區別

    AIGC : 主要面向非結構化數據的生成,如自然語言文本圖像、音頻、視頻等。 這類數據規模更大,內在結構更復雜,對處理技術提出了更高要求。 傳統內容生成 : 主要處理結構化數據,如
    的頭像 發表于 10-25 15:13 ?1129次閱讀

    利用OpenVINO部署Qwen2多模態模型

    模態大模型的核心思想是將不同媒體數據(如文本圖像、音頻和視頻等)進行融合,通過學習不同模態之間的關聯,實現更加智能化的信息處理。簡單來說,多模態
    的頭像 發表于 10-18 09:39 ?1093次閱讀

    Meta發布多模態LLAMA 3.2人工智能模型

    Meta Platforms近日宣布了一項重要技術突破,成功推出了多模態LLAMA 3.2人工智能模型。這一創新模型不僅能夠深度解析文本信息,還實現了對圖像內容的精準理解,標志著Meta在AI多
    的頭像 發表于 09-27 11:44 ?636次閱讀

    Freepik攜手Magnific AI推出AI圖像生成

    近日,設計資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這一里程碑式的發布標志著AI圖像創作領域邁入了一個全新的高度
    的頭像 發表于 08-30 16:23 ?1512次閱讀
    主站蜘蛛池模板: 欧美最猛黑人xxxx黑人猛交黄 | 男女做性无遮挡免费视频 | 黄色大全片 | 爱夜夜性夜夜夜夜夜夜爽 | 欧美在线成人午夜影视 | 欧美激情在线 | 日本一区二区三区不卡在线看 | 性孕妇洗澡video国产 | 婷婷综合影院 | 性欧美人与zooz | 夜夜做夜夜爽 | 免费人成在线观看网站品爱网日本 | 亚洲精品欧洲久久婷婷99 | 中韩日欧美电影免费看 | 拍拍免费视频 | 黄 色 片免费观看 | 网站国产| 日本免费黄视频 | 亚洲精品美女久久久久网站 | 亚洲综合狠狠 | 欧美黄色片免费看 | 国产精品视频你懂的 | 立即播放免费毛片一级 | 狠狠色噜噜狠狠狠狠奇米777 | 模特视频一二三区 | 一区二区高清在线观看 | 色成年激情久久综合 | 欧美性色xo影院永久禁欲 | 国产一级特黄老妇女大片免费 | 视频在线观看免费视频 | 夜夜草天天干 | 国产成年网站v片在线观看 国产成人91青青草原精品 | 国产最新网站 | 黄页网站在线播放 | 国产全肉乱妇杂乱视频 | 中文字幕一区在线观看 | 欧美激情综合亚洲五月蜜桃 | 日本色午夜 | 色婷婷社区 | 免费一级特黄3大片视频 | 一区二区影院 |