Sora爆紅，多模態大模型是下一發展階段

“大語言模型為 AI 產業帶來新的生機，然而語言模型的應用場景有限。要全面打開生成式 AI 的想象力，還是要依托多模態大模型。”IDC 中國研究總監盧言霞近日表示。Sora在文生視頻領域真正邁出了第一步，真正做到生成式 AI 驅動生成短視頻。接下來也將刺激其他科技巨頭加快在該領域的技術攻關力度以及產品發布速度。

哪些公司有潛力快速推出類似產品呢？根據盧言霞的判斷，幾個最有潛力的群體包括，在大模型以及 AI 領域投入最為領先的科技巨頭，如 BAT、科大訊飛等；在計算機視覺領域擁有深厚積累的公司，比如商湯、海康一類的公司；以及短視頻類公司；更可大膽想象，也或許會培訓出多模態大模型的全新創企。

多模態大模型將率先在短視頻、廣告、互娛、影視、媒體等領域采用，輔助人類員工生成視頻，既可以提高生產速度又可以提高生產數量，還可以創造全新的視覺感受，能夠幫助企業真正實現降本增效、提升用戶體驗。

根據預測，未來 5 年，生成式 AI 生成的文本類文件、圖像類文件、視頻類文件、軟件代碼類文件數量將會越來越平均。而這其中，與圖像文件相關的數據量可能是文本文件的 100 倍，視頻文件是圖像文件的 10 倍。整體來看，由于 GenAI 的采用和使用日益增多，近期和遠期所創建數據的增長速度都將快于近幾年。

盧言霞指出，多模態大模型行業發展的挑戰在于：

? 高質量數據的稀缺：圖像、視頻類數據掌握在少數公司手中。這些數據也需要標注，甚至重新采集，才能用于大模型的訓練。
? 多模態大模型對算力的消耗更高，算力的可獲取性以及成本將是挑戰之一。
? 頂尖的大模型研發人才，也是行業發展的稀缺資源。

此外，多模態大模型將帶來更嚴峻的安全方面的挑戰。一方面多模態大模型將讀取更多的圖像、視頻類數據，這些圖像視頻數據是否合規是否安全，需要得到保障；另一方面，生成的視頻與真實世界之間的差異，是否會影響到人身安全、社會穩定、企業安全等，也需要注意。

當前 Sora 生成的是1分鐘的視頻，對于行業已經是重大突破，何時能生成2分鐘、5分鐘以上的視頻還未知，無論如何多模態大模型的應用都將是顛覆性的。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

精選推薦
更多

文章

資料

帖子

MPS MPM3695GPJ-20電源模塊產品特性

MPS芯源系統
1天前

451 閱讀

傳統路線與其利天下的分水嶺，無刷電鉆驅動方案對比--【其利天下】

其利天下技術
2天前

541 閱讀

智多晶PLL使用注意事項

智多晶
2天前

471 閱讀

【飛凌嵌入式】基于i.MX9352開發板M核的FreeRTOS設計例程

飛凌嵌入式
2天前

583 閱讀

HZ-T536-SP_EVM：藏在Labubu百萬身價背后的“中國芯”

合眾恒躍
2天前

930 閱讀

老樹洞安全存儲技術

劉埃生
0.48 MB

2積分

3下載

Databend現代實時數據處理和分析DBMS

發生的方式
5.25 MB

2積分

1下載

OpenVDB電影視覺特效工具

李桂蘭
3.53 MB

免費

0下載

Green BMS開源的鋰電池智能電池管理系統

張玉蘭
0.04 MB

5積分

41下載

USDX貼片堆棧開源

jackhui
0.00 MB

3積分

13下載

ArkUI-X在Android平臺動態化開發指南

jf_14971143
1天前

138 閱讀

【正點原子STM32MP257開發板試用】外設資源測試

jf_07365693
1天前

119 閱讀

【RA4L1-SENSOR】03 觸摸按鍵調試及實現長短按

jf_83922529
1天前

157 閱讀

【正點原子STM32MP257開發板試用】智能門鎖

jf_47210120
8天前

437 閱讀

【RA4L1-SENSOR】02 LCD上顯示ADC采樣電壓值

jf_83922529
2天前

576 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

Sora爆紅，多模態大模型是下一發展階段

評論