在OpenAI宣布即將發(fā)布新模型和新功能后,Google DeepMind也不甘落后,于近日推出了大型基礎(chǔ)世界模型——Genie 2。這款模型能夠生成各種可控制動作、可玩的3D環(huán)境,為用戶帶來全新的交互式體驗。
據(jù)了解,Genie 2是一個自回歸潛在擴散模型,它基于大型視頻數(shù)據(jù)集進行訓(xùn)練。通過自動編碼器,視頻中的潛在幀被傳遞到大型Transformer動力學(xué)模型中。該模型采用與大語言模型類似的因果掩碼進行訓(xùn)練,從而實現(xiàn)了對3D環(huán)境的精準生成和控制。
令人驚嘆的是,用戶只需給Genie 2一張?zhí)崾緢D像,并輸入相應(yīng)的文本提示,它就能生成一個對應(yīng)的交互式虛擬世界。在這個由AI生成的3D游戲世界里,無論是人類還是AI agent,都可以通過鍵盤和鼠標進行探索和互動,享受前所未有的游戲體驗。
Genie 2的發(fā)布標志著Google DeepMind在AI生成3D環(huán)境技術(shù)方面取得了重大突破。未來,這一技術(shù)有望在游戲開發(fā)、虛擬現(xiàn)實、增強現(xiàn)實等領(lǐng)域得到廣泛應(yīng)用,為用戶帶來更加豐富、多樣的交互體驗。同時,這也為AI技術(shù)的發(fā)展注入了新的活力,推動了AI技術(shù)在各個領(lǐng)域的創(chuàng)新和應(yīng)用。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
相關(guān)推薦
SciChart 3D for WPF 是一個實時、高性能的 WPF 3D 圖表庫,專為金融、醫(yī)療和科學(xué)應(yīng)用程序而設(shè)計。非常適合需要極致性能和豐富的交互式 3D 圖表的項目。 使用我們
發(fā)表于 01-23 13:49
?118次閱讀
繁瑣且耗時。
現(xiàn)在,通過在您網(wǎng)站上的交互式3D預(yù)覽中顯示關(guān)鍵尺寸,工程師可以在下載和購買前配置他們需要的零件,并可三維預(yù)覽其模型,從而讓他們可以在您網(wǎng)站上直接生成可查看和可操作的準確的數(shù)字化產(chǎn)品。從
發(fā)表于 01-20 16:09
在當(dāng)今數(shù)字化時代,3D技術(shù)的應(yīng)用范圍日益廣泛,涵蓋電影后期制作、產(chǎn)品原型設(shè)計、虛擬現(xiàn)實(VR)、增強現(xiàn)實(AR)、游戲等眾多領(lǐng)域。而3D文件格式作為3D技術(shù)的核心組成部分,對于實現(xiàn)
發(fā)表于 09-26 18:14
?1607次閱讀
? 在過去幾十年里,動作捕捉(MoCap)技術(shù)經(jīng)歷了顯著的發(fā)展,廣泛被應(yīng)用于電影、游戲、虛擬現(xiàn)實、醫(yī)療等多個領(lǐng)域。近期,奧比中光合作客戶Moverse使用Orbbec Femto系列3D相機,打造
發(fā)表于 06-25 16:37
?1142次閱讀
隨著科技的快速發(fā)展,人類對于視覺體驗的追求也在不斷攀升。從平面的2D圖像到立體的3D影像,我們一直在探索如何讓虛擬世界更加逼真。如今,英倫科技憑借其創(chuàng)新實力,推出了一款革命性的顯示設(shè)備
發(fā)表于 05-28 11:17
?416次閱讀
隨著科技的飛速發(fā)展,虛擬空間已成為元宇宙的重要呈現(xiàn)方式。從游戲到工業(yè)設(shè)計,從電子商務(wù)到文旅體驗,3D相關(guān)技術(shù)在虛擬空間中發(fā)揮著舉足輕重的作用,決定著用戶們能否真正能體會到VR的沉浸式體
發(fā)表于 04-29 09:36
?1597次閱讀
4月9日,奧比中光與戰(zhàn)略合作伙伴創(chuàng)想三維聯(lián)合打造的高精度3D掃描儀CR-Scan Otter、CR-Scan Raptor正式發(fā)布。
發(fā)表于 04-12 09:06
?763次閱讀
怪獸智能數(shù)字人,實時交互數(shù)字人直播系統(tǒng),3D超寫實虛擬形象直播 隨著科技的不斷進步,虛擬現(xiàn)實技術(shù)已經(jīng)逐漸進入人們的日常生活。而在這個數(shù)字化時代,人們對于直播內(nèi)容的需求也越來越高。與此同
發(fā)表于 03-05 09:08
?698次閱讀
谷歌近日宣布推出其最新研發(fā)的AI基礎(chǔ)世界模型——Genie。這款模型擁有驚人的110億參數(shù),其獨特之處在于,僅需一張圖片,便能生成一個充滿活力和交互性的虛擬
發(fā)表于 03-04 14:02
?817次閱讀
谷歌近日發(fā)布了其全新的AI模型Genie,這一模型徹底改變了我們與數(shù)字世界的互動方式。Genie不僅可以接收文本提示、草圖或想法,還能將這些創(chuàng)意迅速轉(zhuǎn)化為一個可互動和玩耍的
發(fā)表于 02-28 18:25
?1763次閱讀
谷歌近日宣布了其生成式AI的全新里程碑——全新AI基礎(chǔ)世界模型Genie。這一創(chuàng)新技術(shù)允許用戶通過單張圖像提示,生成一個可玩的、交互式的虛擬
發(fā)表于 02-28 17:41
?895次閱讀
大家都喜歡玩游戲吧?因為游戲最大的吸引力是讓我們逃避現(xiàn)實、幻想一個遠離我們眼前現(xiàn)實的世界,掌控這個虛擬的現(xiàn)實世界?,F(xiàn)在,我們可以想象一下,如果我們有能力創(chuàng)造自己的世界,那該多好了。
發(fā)表于 02-28 10:45
?980次閱讀
近日,谷歌推出了一款革命性的AI模型——Genie。這款模型能夠?qū)⒑唵蔚奈谋咎崾尽⒉輬D或初步想法迅速轉(zhuǎn)化為一個可以互動和游戲的虛擬世界。這一突破性的技術(shù)無疑將改變?nèi)藗儎?chuàng)建和體驗虛擬
發(fā)表于 02-28 10:05
?817次閱讀
DeepMind指出,Genie有能力根據(jù)最新的文生圖大模型生成初始幀,再借助Genie的能力賦予這些圖像更深層次的含義。Genie作為一個包含110億參數(shù)的基礎(chǔ)
發(fā)表于 02-28 10:02
?553次閱讀
據(jù)報道,谷歌公司的DeepMind團隊近期發(fā)布了AI模型Genie,此模型擁有多達110億個參數(shù),能夠依據(jù)用戶提供的圖片及提示詞創(chuàng)建出相當(dāng)完整的2D游戲場景。
發(fā)表于 02-27 14:53
?844次閱讀
評論