在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌研究人員利用3D卷積網(wǎng)絡(luò)打造視頻生成新系統(tǒng)

DPVg_AI_era ? 來源:lq ? 2019-06-02 09:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌研究人員利用3D卷積網(wǎng)絡(luò)打造視頻生成新系統(tǒng),只需要視頻的第一幀和最后一幀,就能生成完整合理的整段視頻,是不是很神奇?

漫畫書秒變動(dòng)畫片了解一下?

想象一下,現(xiàn)在你的手中有一段視頻的第一幀和最后一幀圖像,讓你負(fù)責(zé)把中間的圖像填進(jìn)去,生成完整的視頻,從現(xiàn)有的有限信息中推斷出整個(gè)視頻。你能做到嗎?

這可能聽起來像是一項(xiàng)不可能完成的任務(wù),但谷歌人工智能研究部門的研究人員已經(jīng)開發(fā)出一種新系統(tǒng),可以由視頻第一幀和最后一幀生成“似是而非的”視頻序列,這個(gè)過程被稱為“inbetween”。

“想象一下,如果我們能夠教一個(gè)智能系統(tǒng)來將漫畫自動(dòng)變成動(dòng)畫,會(huì)是什么樣子?如果真實(shí)現(xiàn)了這一點(diǎn),無疑將徹底改變動(dòng)畫產(chǎn)業(yè)。“該論文的共同作者寫道。“雖然這種極其節(jié)省勞動(dòng)力的能力仍然超出目前最先進(jìn)的水平,但計(jì)算機(jī)視覺機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步正在使這個(gè)目標(biāo)的實(shí)現(xiàn)越來越接近。”

原理與模型結(jié)構(gòu)

這套AI系統(tǒng)包括一個(gè)完全卷積模型,這是是受動(dòng)物視覺皮層啟發(fā)打造的深度神經(jīng)網(wǎng)絡(luò),最常用于分析視覺圖像。它由三個(gè)部分組成:2D卷積圖像解碼器,3D卷積潛在表示生成器,以及視頻生成器。

圖1:視頻生成模型示意圖

圖像解碼器將來自目標(biāo)視頻的幀映射到潛在空間,潛在表示生成器學(xué)習(xí)對(duì)包含在輸入幀中的信息進(jìn)行合并。最后,視頻生成器將潛在表示解碼為視頻中的幀。

研究人員表示,將潛在表示生成與視頻解碼分離對(duì)于成功實(shí)現(xiàn)中間視頻至關(guān)重要,直接用開始幀和結(jié)束幀的編碼表示生成視頻的結(jié)果很差。為了解決這個(gè)問題,研究人員設(shè)計(jì)了潛在表示生成器,對(duì)幀的表示進(jìn)行融合,并逐步增加生成視頻的分辨率。

圖2:模型生成的視頻幀序列圖,對(duì)于每個(gè)數(shù)據(jù)集上方的圖表示模型生成的序列,下方為原視頻,其中首幀和尾幀用于生成模型的采樣。

實(shí)驗(yàn)結(jié)果

為了驗(yàn)證該方法,研究人員從三個(gè)數(shù)據(jù)集中獲取視頻 - BAIR機(jī)器人推送,KTH動(dòng)作數(shù)據(jù)庫和UCF101動(dòng)作識(shí)別數(shù)據(jù)集 - 并將這些數(shù)據(jù)下采樣至64 x 64像素的分辨率。每個(gè)樣本總共包含16幀,其中的14幀由AI系統(tǒng)負(fù)責(zé)生成。

研究人員為每對(duì)視頻幀運(yùn)行100次模型,并對(duì)每個(gè)模型變量和數(shù)據(jù)集重復(fù)10次,在英偉達(dá)Tesla V100顯卡平臺(tái)上的訓(xùn)練時(shí)間約為5天。結(jié)果如下表所示:

表1:我們報(bào)告了完整模型和兩個(gè)基線的平均FVD,對(duì)每個(gè)模型和數(shù)據(jù)集重復(fù)10次,每次運(yùn)行100個(gè)epoch,表中FVD值越低,表示對(duì)應(yīng)生成視頻的質(zhì)量越高。

表2:使用直接3D卷積和基于的替代方法的模型的平均SSIM

RNN(SDVI)或光流(SepConv和SuperSloMo),數(shù)值越高越好。

研究人員表示,AI生成的視頻幀序列在風(fēng)格上與給定的起始幀和結(jié)束幀保持一致,而且看上去說得通。“令人驚喜的是,這種方法可以在如此長的時(shí)間段內(nèi)實(shí)現(xiàn)視頻生成,”該團(tuán)隊(duì)表示,“這可能給未來的視頻生成技術(shù)研究提供了一個(gè)有用的替代視角。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 解碼器
    +關(guān)注

    關(guān)注

    9

    文章

    1173

    瀏覽量

    41907
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    107995
  • 智能系統(tǒng)
    +關(guān)注

    關(guān)注

    2

    文章

    407

    瀏覽量

    73271

原文標(biāo)題:谷歌AI動(dòng)畫接龍:只用頭尾兩幀圖像,片刻生成完整視頻!

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    4K、多模態(tài)、長視頻:AI視頻生成的下一個(gè)戰(zhàn)場,誰在領(lǐng)跑?

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動(dòng)最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無縫切換的1080P高品質(zhì)
    的頭像 發(fā)表于 06-16 00:13 ?6098次閱讀

    NVIDIA助力影眸科技3D生成工具Rodin升級(jí)

    在當(dāng)今數(shù)字化與 AI 飛速發(fā)展的時(shí)代,3D 生成技術(shù)正逐漸成為推動(dòng)各行業(yè)創(chuàng)新的關(guān)鍵力量。影眸科技(上海)有限公司專注于 3D 生成領(lǐng)域的探索,積極推動(dòng)領(lǐng)先實(shí)驗(yàn)室科研成果的民用化、商業(yè)化
    的頭像 發(fā)表于 04-27 15:09 ?474次閱讀

    騰訊混元3D AI創(chuàng)作引擎正式上線

    近日,騰訊公司宣布其自主研發(fā)的混元3D AI創(chuàng)作引擎已正式上線。這一創(chuàng)新性的創(chuàng)作工具,標(biāo)志著騰訊在3D內(nèi)容生成領(lǐng)域邁出了重要一步。 混元3D AI創(chuàng)作引擎的核心功能極為強(qiáng)大,用戶只需通
    的頭像 發(fā)表于 01-22 10:26 ?571次閱讀

    阿里云通義萬相2.1視頻生成模型震撼發(fā)布

    近日,阿里云旗下的通義萬相迎來了重要升級(jí),正式推出了全新的萬相2.1視頻生成模型。這一創(chuàng)新成果標(biāo)志著阿里云在視頻生成技術(shù)領(lǐng)域的又一次重大突破。 據(jù)悉,萬相2.1視頻生成模型在多個(gè)方面實(shí)現(xiàn)了顯著提升
    的頭像 發(fā)表于 01-13 10:00 ?821次閱讀

    OpenAI暫不推出Sora視頻生成模型API

    OpenAI近日宣布,目前暫無推出其視頻生成模型Sora的應(yīng)用程序接口(API)的計(jì)劃。Sora模型能夠基于文本和圖像生成視頻,引發(fā)了廣泛關(guān)注。然而,由于訪問量遠(yuǎn)超預(yù)期,OpenAI此前不得不緊急
    的頭像 發(fā)表于 12-20 14:23 ?520次閱讀

    中國電信發(fā)布自研視頻生成大模型

    ,中國電信隆重發(fā)布了首個(gè)由央企全自研的視頻生成大模型。該模型采用了創(chuàng)新的“VAST(Video As Storyboard from Text)二階段視頻生成技術(shù)”,實(shí)現(xiàn)了從文本描述到視頻內(nèi)容的無縫轉(zhuǎn)化。具體來說,該技術(shù)首先通過
    的頭像 發(fā)表于 12-13 15:40 ?542次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora與OpenAI旗下的AI工具DALL-E有著異曲同工之妙
    的頭像 發(fā)表于 12-12 09:40 ?698次閱讀

    OpenAI開放Sora視頻生成模型

    OpenAI近日宣布,其傾力打造的人工智能視頻生成系統(tǒng)Sora已正式向美國及其他市場的ChatGPT Plus訂閱用戶開放。自去年首次公開預(yù)覽以來,Sora歷經(jīng)約10個(gè)月的精心研發(fā)與優(yōu)化,現(xiàn)已全面
    的頭像 發(fā)表于 12-10 11:16 ?723次閱讀

    Google DeepMind發(fā)布Genie 2:打造交互式3D虛擬世界

    的交互式體驗(yàn)。 據(jù)了解,Genie 2是一個(gè)自回歸潛在擴(kuò)散模型,它基于大型視頻數(shù)據(jù)集進(jìn)行訓(xùn)練。通過自動(dòng)編碼器,視頻中的潛在幀被傳遞到大型Transformer動(dòng)力學(xué)模型中。該模型采用與大語言模型類似的因果掩碼進(jìn)行訓(xùn)練,從而實(shí)現(xiàn)了對(duì)3D
    的頭像 發(fā)表于 12-05 14:16 ?1027次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)工具與框架

    卷積神經(jīng)網(wǎng)絡(luò)因其在圖像和視頻處理任務(wù)中的卓越性能而廣受歡迎。隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,多種實(shí)現(xiàn)工具和框架應(yīng)運(yùn)而生,為研究人員和開發(fā)者提供了強(qiáng)大的支持。 TensorFlow 概述
    的頭像 發(fā)表于 11-15 15:20 ?653次閱讀

    字節(jié)跳動(dòng)自研視頻生成模型Seaweed開放

    近日,字節(jié)跳動(dòng)旗下的AI內(nèi)容平臺(tái)即夢(mèng)AI傳來新消息,宣布自研的視頻生成模型Seaweed即日起正式面向平臺(tái)用戶開放使用。這一舉措標(biāo)志著字節(jié)跳動(dòng)在AI視頻領(lǐng)域邁出了堅(jiān)實(shí)的一步。
    的頭像 發(fā)表于 11-11 14:31 ?675次閱讀

    今日看點(diǎn)丨Vishay裁員800人,關(guān)閉上海等三家工廠;字節(jié)跳動(dòng)發(fā)布兩款視頻生成大模型

    1. 字節(jié)跳動(dòng)發(fā)布兩款視頻生成大模型 面向企業(yè)市場開啟邀測 ? 9月24日,字節(jié)跳動(dòng)旗下火山引擎發(fā)布兩款視頻生成大模型(豆包視頻生成-PixelDance、豆包視頻生成-Seaweed
    發(fā)表于 09-25 15:48 ?946次閱讀

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創(chuàng)新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這一舉措標(biāo)志著火山引擎在視頻內(nèi)容生成領(lǐng)域邁出了重要一步。豆包模型憑借其獨(dú)特的技術(shù)優(yōu)勢(shì),吸引了業(yè)界的廣泛關(guān)注。
    的頭像 發(fā)表于 09-25 14:11 ?625次閱讀

    阿里通義將發(fā)布視頻生成大模型

    在即將召開的云棲大會(huì)上,阿里通義將震撼發(fā)布其自主研發(fā)的視頻生成大模型。目前,用戶已可通過通義App頻道及通義萬相PC端預(yù)約體驗(yàn)這一創(chuàng)新功能,盡管具體使用尚未開放。
    的頭像 發(fā)表于 09-19 17:01 ?598次閱讀

    歡創(chuàng)播報(bào) 騰訊元寶首發(fā)3D生成應(yīng)用

    1 騰訊元寶首發(fā)3D生成應(yīng)用 只需一張照片,便能迅速打造獨(dú)一無二的3D角色。7月16日,騰訊旗下大模型應(yīng)用“騰訊元寶”上線了“3D角色夢(mèng)工廠
    的頭像 發(fā)表于 07-18 11:39 ?1206次閱讀
    歡創(chuàng)播報(bào) 騰訊元寶首發(fā)<b class='flag-5'>3D</b><b class='flag-5'>生成</b>應(yīng)用
    主站蜘蛛池模板: 免费看黄视频网站 | 37pao强力打造免费高速高清 | 亚洲黄色第一页 | 日成人网 | 奇米福利视频 | 伊人狼人在线 | 亚洲国产日韩女人aaaaaa毛片在线 | 亚洲天堂网在线观看 | 国产高清精品自在久久 | 久草丁香 | 中文字幕国产一区 | 干一干操一操 | 国产乱码精品一区二区三 | 天天激情综合 | 免费人成网址在线观看国内 | 欧美一级别 | 久久精品国产精品亚洲精品 | 很黄的网站在线观看 | 色噜噜噜噜噜在线观看网站 | 操夜夜| 日韩美a一级毛片 | 免看一级a毛片一片成人不卡 | 午夜影视在线免费观看 | 国产成人亚洲精品77 | 亚洲日本黄色 | 华人被黑人粗大猛然进 | 日本aaaaa毛片在线视频 | free性欧美高清另类 | 亚洲一级视频在线观看 | 两性色视频 | 一区二区三区亚洲 | 91x视频| 国产精品亚洲色图 | 国产小视频在线看 | 四虎免费看黄 | 最近2018年中文字幕在线 | 免费看成年视频网页 | 免费看黄色片网站 | 性色在线视频 | 中文字幕亚洲一区二区va在线 | 国产一区二区在线不卡 |