AI數字人的底層邏輯主要基于兩種操作機制。一種是智能驅動型數字人,這種類型的數字人通過智能系統自動讀取和解析外界輸入信息,然后根據解析結果決策數字人后續的輸出文本,最后驅動人物模型生成相應的語音與動作,實現與用戶的互動。這個人物模型是通過AI技術預先訓練得到的,能夠通過文本驅動生成語音和對應動畫,業內將此模型稱為 TTSA(Text To Speech & Animation)人物模型。
另一種是真人驅動型數字人,其核心原理是由真人根據視頻監控系統傳來的用戶視頻,與用戶進行實時語音交流,同時通過動作捕捉采集系統將真人的表情、動作呈現在虛擬數字人形象上,從而實現與用戶的交互。
從技術角度來看,AI數字人的本質是人工智能的一種進化。它整合了人物形象模擬、人物聲音克隆、自然語言處理、知識圖譜解析等眾多世界領先的人工智能技術,提供了一種可以隨時隨地與真人進行準確交互性對話的方式。背后的技術原理涉及到符號主義、聯結主義和行為主義等多種研究視角。
隨著新技術浪潮的推動,虛擬數字人的制作過程得到有效簡化,性能也得到飛躍式提升,開始從外觀的數字化逐漸深入到行為的交互化、思想的智能化。現在,以虛擬主播、虛擬員工等為代表的數字人已經開始在影視、游戲、傳媒、文旅、金融等眾多領域大放異彩。
審核編輯 黃宇
-
AI
+關注
關注
87文章
34000瀏覽量
275077 -
人工智能
+關注
關注
1804文章
48599瀏覽量
245966 -
數字人
+關注
關注
0文章
151瀏覽量
2231
發布評論請先 登錄
生成式人工智能認證:重塑AI職業生態的底層邏輯
邏輯推理AI智能體的實際應用
鴻道Intewell操作系統:人形機器人底層操作系統
大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產品
SMA 接頭與 PCB 原理圖連接的底層邏輯

【「零基礎開發AI Agent」閱讀體驗】+初品Agent
鴻道AI機器人操作系統亮相中關村論壇

評論