2 月 6 日消息,字節跳動近日發布了一項重大成果 ——OmniHuman 多模態框架,其優勢在于其強大的視頻生成能力。用戶只需提供一張任意尺寸和人物占比的單張圖片,再結合一段輸入音頻,就能生成栩栩如生的人物視頻。
與傳統 AI 模型不同,OmniHuman-1 能夠生成逼真的全身動畫,并且可以精準地將手勢和面部表情與語音或音樂同步,打破了以往只能生成面部或上半身動畫的局限。
基于約 19000 小時的人類運動數據訓練,OmniHuman-1 模型支持不同的體型和畫面比例,能在內存限制內生成任意長度的視頻,并適應不同輸入信號,在真實性和準確性方面超越其他同類動畫工具。值得一提的是,它還支持卡通角色、人工物體、動物以及復雜姿勢的輸入,確保生成的動作特征與每種風格的獨特特點相匹配。
在實際應用場景中,OmniHuman 潛力巨大。在影視制作領域,創作者能輕松為虛擬角色打造全身動作戲份;虛擬直播里,主播動作更加自然,可增強直播的趣味性與吸引力;游戲世界中,數字人 NPC 的動作和表情更豐富,能提升玩家的沉浸感。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
相關推薦
對于傳聞中的字節跳動計劃2025年在人工智能基礎設施上投入超120億美元的消息,字節跳動回應稱消息并不準確。 ? ?
發表于 01-23 15:45
?273次閱讀
近日,字節跳動旗下的豆包大模型迎來了全新的升級——豆包大模型1.5 Pro正式發布。這款全新模型在知識、代碼、推理、中文等多個測評基準上表現出色,綜合得分優于GPT-4o、Claude 3.5 Sonnet等業界知名模型,標志著
發表于 01-23 15:24
?232次閱讀
字節跳動正式發布了豆包大模型1.5 Pro。 全新的Doubao -1.5 - pro模型綜合能力顯著增強,在知識、代碼、推理、中文等多個測評基準上,綜合得分優于GPT - 4o、Claude
發表于 01-23 10:24
?163次閱讀
多模態組網
jf_23871869
發布于 :2025年01月20日 13:40:48
近日,有消息稱字節跳動已經選擇努比亞作為其合作伙伴,共同開發AI手機。據悉,雙方已經簽訂了框架協議,明確了合作的具體內容和時間表。 根據協議內容,字節
發表于 01-03 14:48
?545次閱讀
近日,有關字節跳動旗下豆包大模型將內嵌手機并與中興通訊探討成立新品牌的消息引發了市場的廣泛關注。然而,字節跳動方面對此明確予以否認,稱并未與中興通訊就上述事宜展開討論。 據
發表于 12-18 10:08
?560次閱讀
字節跳動正積極布局歐洲市場,計劃在該地區設立AI研發中心。據知情人士透露,字節跳動已開始在歐洲尋找LLM(Large Language Model,大語言模型)和AI領域的技術大牛,積
發表于 10-28 11:04
?655次閱讀
在數字時代的浪潮中,編程已成為推動科技進步和創新的核心動力。為了助力國內開發者更高效、智能地進行編程工作,字節跳動公司近日發布了全新的智能開發工具——豆包 MarsCode。這款工具基于強大的豆包大模型打造,全面免費開放使用,旨
發表于 07-01 15:03
?775次閱讀
近日,關于字節跳動秘密啟動AI手機研發項目的傳聞引起了廣泛關注。然而,字節跳動相關人士在12日對此進行了澄清,表示這一消息并不屬實。
發表于 06-13 11:48
?823次閱讀
近日,有市場傳聞稱字節跳動已在兩個月前秘密啟動了AI手機研發項目,引發業界廣泛關注。然而,字節跳動相關人士迅速對此作出回應,表示這些消息并不屬實。
發表于 06-12 15:54
?663次閱讀
在近日舉行的火山引擎原動力大會上,字節跳動公司正式發布了其強大的豆包大模型。據火山引擎總裁譚待透露,這款大模型展現了驚人的數據處理能力,目前日均處理文本量高達1200億Tokens,并能生成3000萬張圖片。
發表于 05-15 11:26
?775次閱讀
據多位知情人士透露,科技巨頭字節跳動正在人工智能(AI)大模型領域秘密研發多個創新產品。其中,多模態數字人產品備受矚目,該產品將結合先進的AI技術與虛擬形象,為用戶提供全新的交互體驗。
發表于 03-05 11:22
?1085次閱讀
1 字節跳動被曝研發多個AI產品 2月28日,從多個知情人士處獲悉,字節跳動正在AI大模型領域秘密研發多個產品,其中包括多
發表于 02-29 10:57
?598次閱讀
因為字節跳動自研交換機,早在2019年,就開始悄悄布局了。
發表于 02-26 15:34
?1684次閱讀
近日,有傳聞稱字節跳動在Sora文生視頻模型發布之前,已經推出了一款名為Boximator的顛覆性視頻模型。傳聞還指出,這款模型能夠通過文本精準控制生成視頻中的人物或物體動作。然而,字節
發表于 02-20 13:58
?732次閱讀
評論