在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DVD-GAN機器人用AI生成高度逼真視頻的一次重要的嘗試

BFv1_robovideo ? 來源:陳年麗 ? 2019-07-29 10:40 ? 次閱讀

近日,DeepMind的研究人員研發了一個名叫Dual Video Discriminator GAN(DVD-GAN)的人工智能模型,該模型通過能夠通過學習一系列的YouTube視頻數據集,生成高度逼真且連貫的256 x 256像素視頻,最長可達48幀。

目前,DVD-GAN的研究成果已于美國時間2019年7月15日發表在arxiv上,名為《在復雜數據集上的高效視頻生成(Efficient Video Generation on Complex Datasets)》。

AI造假視頻比造假圖片更難

最近,俄羅斯AI研究人員開發的FaceApp著實大火了一把,這款應用通過人工智能技術能夠改變用戶自拍照的年齡、外貌、發色和性別,甚至可以生成虛構的人物照片。這直接讓人們近距離地感受了人工智能技術給我們的生活帶來的樂趣。

但是否有人想過,有朝一日這些技術也能應用在視頻領域呢?

如果說BigGAN是DeepMind在圖像領域開發的能夠生成高度逼真圖像的圖像生成器,那么DeepMind研究人員們開發的DVD-GAN,就是人工智能在視頻剪輯生成領域的最新突破。

研究人員在論文中表示,生成自然視頻對生成式建模來說是一個較大的挑戰,同時還會受到數據復雜性和計算需求增加的困擾。

因此,之前業界的研究人員們在研究視頻生成領域時,幾乎都圍繞著相對簡單的數據集,或者采用有限的時間信息來降低任務的復雜程度。

而這次,DeepMind的研究人員們主要針對視頻合成和視頻預測的任務,將生成圖像模型的強大功能和逼真效果擴展到視頻領域。

DVD-GAN:基于BigGAN模型結構

研究人員們基于BigGAN的模型結構,構建了DVD-GAN的系統,并引入了一系列用于視頻生成的調整,使DVD-GAN能夠在Kinetics-600上進行訓練。

Kinetics-600是一組由50萬段10秒高分辨率的YouTube視頻剪輯匯編而成的訓練數據集,它最初是為識別人類動作而制作的,比目前其他常用的語料庫還大一個數量級。

同時,研究人員們表示,Kinetics-600具有多樣化特征,能消除他們對過擬合(Overfitting)的擔憂。過擬合主要是指機器學習時選擇的模型所包含的參數過多,以至出現這一模型對已知數據預測得很好,但對未知數據預測得很差的現象。

另一方面,DeepMind的研究人員們利用生成對抗以提供一個能生成動作的學習信號

此外,DVD-GAN還有一個單獨的Transformer模塊,它可以讓學習信息在整合AI模型中傳播。

訓練12至96小時即可生成視頻

研究論文表明,在經過Google第三代TPU訓練了12至96個小時后,DVD-GAN可以成功地生成視頻,這些視頻內容包含了物體的組成和運動,以及各種復雜的紋理。

不足的是,DVD-GAN生成的視頻內容有時較為“詭異”,例如生成的物體和人形奇形怪狀,甚至人體忽長忽短地變化。

但研究人員指出,當把DVD-GAN放在UCF-101(一個包含13320個人類動作視頻的較小數據集)上進行評估后,DVD-GAN生成的樣本初始值最高為32.97。

DeepMind的研究人員們希望能進一步強調在大型復雜視頻數據集上訓練生成模型的好處,例如Kinetics-600。

“我們設想通過DVD-GAN在這個數據集上建立強大的基線,該基線將被用作未來建模生成領域的參考點?!毖芯咳藛T表示,“盡管在不受約束的環境下持續生成逼真的視頻還需要進行很多工作,但我們相信DVD-GAN是我們朝這個方向邁出的重要一步?!?/p>

網絡(GANs)來區分生成樣本和真實世界樣本,該網絡主要由生成器和判別器兩部分組成。

GANs曾被應用在把文字轉換成一幕幕的場景故事,或生成人造星系圖像等任務中。而研究人員們這次使用的是名為BigGANs的生成對抗網絡,該網絡以大批量和數百萬個參數而得名。

值得一提的是,DVD-GAN包含兩個判別器。一個是空間判別器(Spatial Discriminator:D_S),該判別器通過隨機采樣全分辨率幀并單獨處理,以評估單個幀的內容和結構;另一個是時間判別器(Temporal Discriminator:D_T),它可以提供一個能生成動作的學習信號。

此外,DVD-GAN還有一個單獨的Transformer模塊,它可以讓學習信息在整合AI模型中傳播。

結語:用AI生成高度逼真視頻的一次嘗試

不管是BigGAN還是FaceApp,以往的研究人員們在人工智能生成圖像領域進行了許多具有突破性的研究,但在視頻領域,除了AI換臉曾火了一把之外,并沒有更多的突破性進展。

而DeepMind的研究人員們基于BigGAN架構和Kinetics-600訓練數據集開發的DVD-GAN,利用計算高效的判別器分解,擴展到時間更長、分辨率更高的視頻。就目前來說,雖然這一成果還有些許不足,但這無疑是研究人員們利用AI生成高度逼真視頻的一次重要嘗試。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • DVD
    DVD
    +關注

    關注

    3

    文章

    134

    瀏覽量

    62052
  • 人工智能
    +關注

    關注

    1796

    文章

    47700

    瀏覽量

    240348

原文標題:[機器人頻道|大事記]你擔心的就要成真,AI換臉不算啥,現在新AI可生成逼真視頻

文章出處:【微信號:robovideo,微信公眾號:機器人頻道】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    深圳人形機器人行走視頻震驚英偉達科學家,下個劃時代產品是AI機器人?

    電子發燒友網報道(文/吳子鵬)日前,深圳特區報發布了則國產人形機器人行走的視頻,該視頻引起了包括英偉達高級AI研究科學家Jim Fan在內
    的頭像 發表于 01-14 00:53 ?2292次閱讀
    深圳人形<b class='flag-5'>機器人</b>行走<b class='flag-5'>視頻</b>震驚英偉達科學家,下<b class='flag-5'>一</b>個劃時代產品是<b class='flag-5'>AI</b><b class='flag-5'>機器人</b>?

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人的基礎模塊

    一次生成深度信息。 自主機器人定位任務的本質是對機器人自身狀態的估計問題,包括位置,朝向,速度等問題。 路徑規劃旨在找到從起點到目標區域的路徑,確保路徑的可行性和最優性。路徑規劃方法包括變分方法,圖搜
    發表于 01-04 19:22

    開源項目!能夠精確地行走、跳舞和執行復雜動作的機器人—Tillu

    的語音識別系統響應語音指令 為什么打造Tillu? 打造Tillu不僅是個項目,更是一次學習體驗。通過深入探索機器人技術、編程細節以及自定義動作和表情,釋放你的創造力。無論你是學生、愛好者還是創
    發表于 01-02 17:24

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人大模型

    指令和當前機器人靜態圖像,生成段預測的未來狀態視頻。從這些預測視頻中,可以提取機器人的位姿信息
    發表于 12-29 23:04

    【「具身智能機器人系統」閱讀體驗】+數據在具身人工智能中的價值

    重大數據瓶頸的嚴重阻礙。與主要由用戶生成的輸入組成且相對容易收集和匯總的 Internet 數據不同,EAI 的數據涉及機器人與其動態環境之間的復雜交互。這根本差異意味著,雖然可以從跨數字平臺的用戶
    發表于 12-24 00:33

    《具身智能機器人系統》第1-6章閱讀心得之具身智能機器人系統背景知識與基礎模塊

    要給AI這個聰明的“頭腦”裝上副“身體”。這個“身體”可以是部手機,可以是臺自動駕駛汽車。而人形機器人則是集各類核心尖端技術于
    發表于 12-19 22:26

    首例AI機器人致死案震驚全球

    AI機器人的安全性、友好性、是否符合積極正面的價值導向直被質疑,現在在佛羅里達州出現了AI聊天機器
    的頭像 發表于 10-25 16:32 ?1129次閱讀

    六軸焊接機器人多久檢修一次

    焊接機器人多久檢修一次? ??、六軸焊接機器人的工作原理 ??六軸焊接機器人種具備六個自由
    的頭像 發表于 07-09 16:31 ?419次閱讀
    六軸焊接<b class='flag-5'>機器人</b>多久檢修<b class='flag-5'>一次</b>

    Al大模型機器人

    理解能力強大: AI大模型機器人可以理解和生成自然語言,能夠進行復雜的對話和語言任務。它們能夠識別語言中的語義、語境和情感,并據此作出適當的回應。廣泛的知識儲備: 這些模型基于大規模的數據集進行訓練,擁有
    發表于 07-05 08:52

    加速生產數據向AI機器人轉化,剖析NVIDIA機器人堆棧式資源

    電子發燒友網報道(文/吳子鵬)回顧歷史上幾次生產力革命,每一次都有標志性產物,帶來巨大的生產效率提升。當然,也有些生產力工具憑借自身潛能,在多次生產力革命周期里延續并得到強化,機器人就是
    的頭像 發表于 07-03 00:02 ?3454次閱讀
    加速生產數據向<b class='flag-5'>AI</b><b class='flag-5'>機器人</b>轉化,剖析NVIDIA<b class='flag-5'>機器人</b>堆棧式資源

    基于百度AI大模型生態支持,極越汽車機器人迎來一次全新進化

    基于百度AI大模型生態支持,極越汽車機器人又迎來了一次全新進化。3月25日,極越在北京舉辦AI DAY 2024。
    的頭像 發表于 03-28 09:52 ?730次閱讀
    基于百度<b class='flag-5'>AI</b>大模型生態支持,極越汽車<b class='flag-5'>機器人</b>迎來<b class='flag-5'>一次</b>全新進化

    NVIDIA Isaac機器人平臺升級,加速AI機器人技術革新

    NVIDIA Isaac機器人平臺近期實現重大升級,通過引入最新的生成AI技術和先進的仿真技術,顯著加速了AI機器人技術的發展步伐。該平臺
    的頭像 發表于 03-27 10:36 ?747次閱讀

    NVIDIA入局人形機器人!Isaac平臺迎來重要更新

    NVIDIA Isaac 機器人平臺利用最新的生成AI 和先進的仿真技術,加速 AI 機器人技術的發展。
    的頭像 發表于 03-26 09:07 ?1162次閱讀
    NVIDIA入局人形<b class='flag-5'>機器人</b>!Isaac平臺迎來<b class='flag-5'>重要</b>更新

    機器人板塊強勢啟動,漲停潮席卷市場

    春節期間,OpenAI發布首個視頻生成模型Sora,帶動人工智能迎來了新波行情。而人形機器人作為AI原生應用的最佳實體,熱度也隨之攀升。
    發表于 02-27 10:14 ?214次閱讀

    OpenAI發布文生視頻模型Sora,引領AI視頻生成新紀元

    在人工智能(AI)領域掀起新輪革命浪潮的,正是OpenAI最新推出的文生視頻大模型——Sora。這款被業界廣泛贊譽的模型,以其“逼真”和“富有想象力”的
    的頭像 發表于 02-19 11:03 ?1022次閱讀
    主站蜘蛛池模板: 在线视频一二三区 | 免费一看一级毛片全播放 | 毛片.com| 在线免费观看黄色小视频 | 亚洲区中文字幕 | 国产免费一级高清淫日本片 | 视频一区二区在线观看 | 亚洲一区高清 | 视频在线免费看 | 午夜小视频网站 | 狠狠做深爱婷婷综合一区 | 五月天精品 | 欧美怡红院免费全部视频 | 免费网站看黄 | 一区二区三区中文字幕 | 五月天激情综合网 | 亚洲一区日本 | 天天射天天爽 | 国模视频一区二区 | 午夜在线播放视频在线观看视频 | 狠狠色丁香久久婷婷综 | 美女视频一区二区三区 | 天天夜夜爽 | 农村的毛片丨级 | 欧美色视频网 | 啪啪调教所29下拉式免费阅读 | 天天天干干干 | 手机看片三级 | 伊人网站在线 | 色视频免费在线 | 亚洲国产成人va在线观看 | 午夜黄色网址 | 精品国产免费人成高清 | 91在线免费观看网站 | 港台无码 | 久久精品人 | 第四色视频 | 日本免费大黄在线观看 | 影音先锋色偷偷米奇四色 | ww欧洲ww欧洲视频 | 仙踪林欧美另类视频 |