繼OpenAI和Meta之后,谷歌也在世界模型領域公布了其最新進展。 近日,谷歌發布了一種新的AI模型Genie,據谷歌官網介紹,Genie是一個基于互聯網視頻訓練的基礎世界模型,能夠從合成圖像、照片、草圖等多種來源生成多種動作可控的環境。
隨著谷歌的加入,世界模型領域的競爭愈發激烈,但目前尚難以確定誰能引領這一領域的發展風向。此前,Sora作為一款世界模型已引發爭議。反對者認為其視頻生成方式與世界模型的因果預測存在很大不同。從Sora發布的視頻來看,雖然保真度較高,但模擬物理規律似乎是其弱點,且目前難以看出其交互能力。
相比之下,谷歌的Genie在交互性方面下了不少功夫。它能夠推斷出生成環境中的潛在動作,為用戶提供一個可玩的、交互式的虛擬環境。然而,在視頻真實性和清晰度的層面,Genie尚未展現出與Sora相當的水平。
總的來說,谷歌的Genie和Sora各自具有不同的優勢和挑戰。世界模型領域正迎來一場激烈的競爭,未來的發展方向將取決于各大公司在技術創新和市場應用上的表現。我們期待看到這一領域能夠涌現出更多創新成果,推動人工智能技術的不斷發展和進步。
-
谷歌
+關注
關注
27文章
6220瀏覽量
107345 -
模型
+關注
關注
1文章
3476瀏覽量
49921 -
OpenAI
+關注
關注
9文章
1200瀏覽量
8563
發布評論請先 登錄
大模型領域常用名詞解釋(近100個)

NVIDIA Cosmos世界基礎模型平臺的主要功能

英偉達推出基石世界模型Cosmos,解決智駕與機器人具身智能訓練數據問題

英偉達發布Cosmos世界基礎模型
NVIDIA Cosmos世界基礎模型平臺發布
【「大模型啟示錄」閱讀體驗】+開啟智能時代的新鑰匙
【「大模型啟示錄」閱讀體驗】營銷領域大模型的應用
【「大模型啟示錄」閱讀體驗】對大模型更深入的認知
【「大模型啟示錄」閱讀體驗】如何在客服領域應用大模型
OpenAI世界最貴大模型:昂貴背后的技術突破
Google DeepMind發布Genie 2:打造交互式3D虛擬世界
谷歌計劃12月發布Gemini 2.0模型
什么是大模型?快速了解大模型基本概念

評論