谷歌最新推出的VLOGGER AI技術引起了廣泛關注,這項創新的多模態模型能夠讓靜態肖像圖“活”起來并“說話”。用戶只需提供一張人物肖像照片和一段音頻內容,VLOGGER AI就能讓圖片中的人物仿佛真的在朗讀這段音頻,面部表情豐富,栩栩如生。
VLOGGER AI作為一種專為虛擬肖像設計的多模態Diffusion模型,其強大能力得益于MENTOR數據庫的豐富資源。這個數據庫收錄了超過80萬名人物肖像,以及累計超過2200小時的影片,使得VLOGGER能夠生成各種種族、年齡、穿著和姿勢的肖像影片,極大增加了其適用性和實用性。
谷歌對VLOGGER AI寄予厚望,將其視為邁向“通用聊天機器人”的重要一步。未來,這種AI技術有望通過語音、手勢和眼神交流等方式,以更加自然和人性化的方式與人類進行互動。
這一技術的推出不僅展示了谷歌在人工智能領域的深厚實力,也為虛擬形象、影視制作等領域帶來了全新的可能性。未來,我們可以期待看到更多由VLOGGER AI生成的生動、真實的虛擬人物形象,在娛樂、教育、廣告等多個領域大放異彩。
-
谷歌
+關注
關注
27文章
6219瀏覽量
107282 -
AI
+關注
關注
87文章
33747瀏覽量
274533 -
模型
+關注
關注
1文章
3473瀏覽量
49881
發布評論請先 登錄
海康威視發布多模態大模型AI融合巡檢超腦
安霸在ISC West上推出下一代前端多模態AI技術
移遠通信智能模組全面接入多模態AI大模型,重塑智能交互新體驗

移遠通信智能模組全面接入多模態AI大模型,重塑智能交互新體驗


高通與智譜推動多模態生成式AI體驗的終端側部署
蘋果發布300億參數多模態AI大模型MM1.5
Meta發布多模態LLAMA 3.2人工智能模型
云知聲推出山海多模態大模型
Meta不會在歐盟提供新的多模態AI模型
商湯科技推出SenseFoundry-VL方舟多模態新智平臺

智譜AI發布全新多模態開源模型GLM-4-9B
Build 2024發布多項Azure AI Speech全新多模態功能

評論