繼OpenAI和Meta之后,谷歌也在世界模型領域公布了其最新進展。 近日,谷歌發布了一種新的AI模型Genie,據谷歌官網介紹,Genie是一個基于互聯網視頻訓練的基礎世界模型,能夠從合成圖像、照片、草圖等多種來源生成多種動作可控的環境。
隨著谷歌的加入,世界模型領域的競爭愈發激烈,但目前尚難以確定誰能引領這一領域的發展風向。此前,Sora作為一款世界模型已引發爭議。反對者認為其視頻生成方式與世界模型的因果預測存在很大不同。從Sora發布的視頻來看,雖然保真度較高,但模擬物理規律似乎是其弱點,且目前難以看出其交互能力。
相比之下,谷歌的Genie在交互性方面下了不少功夫。它能夠推斷出生成環境中的潛在動作,為用戶提供一個可玩的、交互式的虛擬環境。然而,在視頻真實性和清晰度的層面,Genie尚未展現出與Sora相當的水平。
總的來說,谷歌的Genie和Sora各自具有不同的優勢和挑戰。世界模型領域正迎來一場激烈的競爭,未來的發展方向將取決于各大公司在技術創新和市場應用上的表現。我們期待看到這一領域能夠涌現出更多創新成果,推動人工智能技術的不斷發展和進步。
-
谷歌
+關注
關注
27文章
6231瀏覽量
108055 -
模型
+關注
關注
1文章
3516瀏覽量
50363 -
OpenAI
+關注
關注
9文章
1206瀏覽量
8875
發布評論請先 登錄
聲學世界模型將如何改變我們的生活
自動駕駛中常提的世界模型是個啥?

世界模型:多模態融合+因果推理,解鎖AI認知邊界
大模型領域常用名詞解釋(近100個)

NVIDIA Cosmos世界基礎模型平臺的主要功能

英偉達推出基石世界模型Cosmos,解決智駕與機器人具身智能訓練數據問題

評論