在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

拋開元宇宙,我們來聊聊音視頻技術(shù)的未來

朱老師物聯(lián)網(wǎng)大講堂 ? 2022-01-24 10:11 ? 次閱讀

1872年的某一天,在美國加利福尼亞州的一個酒店里,兩個年輕人發(fā)生了激烈的爭論。

其中一人認(rèn)為,奔跑的馬在躍起的瞬間,四蹄是騰空的。而另一人則認(rèn)為,馬奔跑時,始終有一個蹄子是著地的。

來自英國的攝影師麥布里奇得知此事后,決定通過實驗來驗證誰對誰錯。于是,他借助24臺相機(jī),連續(xù)拍攝了24張照片,并由此創(chuàng)造了人類歷史上第一個“視頻”。

f9779b7e-7c6e-11ec-bcb6-dac502259ad0.gif

不久后,1877年,著名發(fā)明家愛迪生在他的“圓筒留聲機(jī)”上,錄下了他親自朗讀的《瑪麗有只小羊羔》的歌詞。

這短短數(shù)秒的聲音,成為了人類歷史上第一條音頻。由此,人類正式進(jìn)入了音視頻時代。

音視頻技術(shù)的發(fā)展和演進(jìn)

眾所周知,人有五感,分別是視覺、聽覺、嗅覺、味覺和觸覺。通過五感,我們才能感知外部物理世界的存在,享受真實生活的美好。

在人類漫長的歷史長河中,文字、圖畫是記錄和傳遞信息的主要方式。直到前面提及的音視頻出現(xiàn),才將人類記錄信息的方式,升級到了一個更高的維度,更加具象化。

音頻和視頻誕生早期,只能存儲在膠片和磁帶上,容量有限,也不方便保存和運輸。

直到20世紀(jì)70-80年代,隨著數(shù)字錄音和攝像技術(shù)的不斷成熟,唱片公司和電影公司開始采用數(shù)字方式錄制原始素材,并進(jìn)行后期制作,掀起了音視頻技術(shù)的革新浪潮。

在數(shù)字技術(shù)的支撐下,音視頻剪輯變得更加方便快捷。CD、MD、DVD等數(shù)字載體的出現(xiàn),不僅讓音質(zhì)畫質(zhì)大幅改善,還極大地擴(kuò)充了存儲容量,減少了空間占用。

到了90年代,個人PC的規(guī)模普及,以及互聯(lián)網(wǎng)的爆炸式發(fā)展,再次刺激了音視頻技術(shù)的飛躍,并將人類全面推向了多媒體時代。

那一時期,互聯(lián)網(wǎng)先民們瘋狂地上傳和下載mp3、wav格式的音樂,bmp、jpg格式的圖片,還有rm、mov、avi格式的電影。他們不再局限于純文字的交互方式,而是全面轉(zhuǎn)向了QQ、MSN這樣的多媒體通信工具。

與此同時,基于音視頻技術(shù)發(fā)展起來的游戲產(chǎn)業(yè),更是將人們對數(shù)字世界的感官體驗,推向了更高的層級。人們開始有了對數(shù)字虛擬空間生活的早期憧憬和迷戀

進(jìn)入21世紀(jì)后,隨著3G/4G、光纖寬帶的高速發(fā)展,以及摩爾定律下CPU、內(nèi)存、硬盤能力的進(jìn)一步躍升,音視頻技術(shù)再獲突破,幾乎可以說是日新月異。

以視頻的清晰度為例,一路從早期的標(biāo)清(320p/480p),發(fā)展到高清(720P/1080P),再到超高清(4K/8K),并最終催生了前所未有的人機(jī)交互模式——VR/AR(虛擬現(xiàn)實/增強(qiáng)現(xiàn)實)。

VR/AR的出現(xiàn),第一次讓人類感受到什么叫做沉浸式體驗。我們與數(shù)字世界的交互,從單向異步,變成了雙向同步。我們向真正的數(shù)字空間生活,邁出了一大步。

2020年,騰訊提出“全真互聯(lián)網(wǎng)”。2021年,元宇宙火遍出圈。這些都是音視頻技術(shù)飛速發(fā)展的產(chǎn)物。

視頻編解碼技術(shù)的不斷演進(jìn),信息通信技術(shù)的快速迭代,極大地改善了人們的視頻觀看體驗,徹底激發(fā)了人們對平行數(shù)字空間的渴望和向往,認(rèn)為這是一種可以實現(xiàn)的夢想。

人們不再滿足于使用音視頻技術(shù)傳遞真實世界的影像,而是更希望將真實世界的一切元素都“捕捉”下來,轉(zhuǎn)換成無數(shù)的比特,存放在硬盤里。這些比特,將成為人們構(gòu)建數(shù)字虛擬世界的素材。

音視頻技術(shù)的需求變化

元宇宙到底能不能成真,我并不知道答案。但是,音視頻技術(shù)的需求趨勢,卻是顯而易見的。歸納而言,就是兩點:平民化、產(chǎn)業(yè)化

近年來,智能手機(jī)的普及,專業(yè)攝錄設(shè)備的降價,讓越來越多的普通用戶有機(jī)會進(jìn)行音視頻內(nèi)容創(chuàng)造和生產(chǎn)。

短視頻業(yè)務(wù)的爆發(fā),以及全民直播的興起,更是將視頻平民化推向了新的高潮。

幾乎在一夜之間,我們就進(jìn)入了“人人看視頻,人人拍視頻”的時代。很多優(yōu)秀的up主或主播,能夠通過優(yōu)質(zhì)的內(nèi)容,賺取巨額收益,刺激了人們將視頻作為謀生手段的熱情。

在這樣的情況下,音視頻技術(shù)需要進(jìn)一步降低門檻,讓更多的人能夠更容易地生產(chǎn)內(nèi)容。

2020年,突如其來的新冠疫情,也間接推動了音視頻產(chǎn)業(yè)的發(fā)展。我們需要借助虛擬空間的延伸,彌補疫情導(dǎo)致的物理空間上的限制。

學(xué)生居家學(xué)習(xí),企業(yè)居家辦公,產(chǎn)生了大量的網(wǎng)課、會議視頻流量。根據(jù)運營商的統(tǒng)計數(shù)據(jù),截至2020年底,視頻在全網(wǎng)數(shù)據(jù)流量的占比已接近70%。

除了學(xué)習(xí)和辦公之外,產(chǎn)業(yè)將視頻的應(yīng)用進(jìn)行了延伸,發(fā)掘了更多的創(chuàng)新場景。

例如,借助視頻識別技術(shù),可以對產(chǎn)品進(jìn)行質(zhì)量檢驗,可以對園區(qū)進(jìn)行車輛管理,可以對工地進(jìn)行安全隱患識別。

再例如,借助VR/AR技術(shù),可以進(jìn)行人員崗前培訓(xùn),可以進(jìn)行遠(yuǎn)程手術(shù),可以進(jìn)行遠(yuǎn)程參觀,也可以進(jìn)行遠(yuǎn)程設(shè)備巡檢和故障處理。

也就是說,視頻不再僅僅是娛樂工具,而是變身為生產(chǎn)力工具。

各個領(lǐng)域和垂直行業(yè),都希望借助音視頻技術(shù),升級和改造現(xiàn)有生產(chǎn)場景,提升效率,降低成本。

企業(yè)希望充分利用音視頻技術(shù),但是,也面臨著對技術(shù)門檻和資源投入的擔(dān)憂,望而卻步。

我們現(xiàn)在每天都在討論數(shù)字化轉(zhuǎn)型,其實,“音視頻+垂直行業(yè)”,就是企業(yè)數(shù)字化轉(zhuǎn)型的一個極佳入口。行業(yè)音視頻,即將進(jìn)入爆發(fā)期。

音視頻技術(shù)的未來方向

剛才說的是外部需求的變化。接下來,我們看看音視頻技術(shù)是如何應(yīng)對變化的。

簡而言之,就是三點:算法極致化功能智能服務(wù)平臺化

音視頻的性能指標(biāo)提升,一直沒有停止前進(jìn)的腳步。

尤其是視頻方面,因為高清顯示技術(shù)的驅(qū)動,使得視頻的分辨率不斷增長。除了分辨率之外,視頻的幀率要求,也在增加。

還有VR視頻,因為含有三維的時間和空間信息,所以冗余更高,數(shù)據(jù)體積更大。

想要實現(xiàn)超高清高幀、VR/AR視頻應(yīng)用的普及,僅僅依靠增加硬盤容量和通信帶寬是不夠的,必須盡可能壓縮視頻的體積。這就離不開視頻壓縮算法的持續(xù)改進(jìn)

目前,全球視頻編碼標(biāo)準(zhǔn)分為多個派系。除了大家熟悉的H.26X系列(ITU-T主導(dǎo))之外,還有MPEG系列(ISO/IEC主導(dǎo)),AVS系列(國內(nèi)AVS組織主導(dǎo)),以及免費開源的AV1等。

fa6438ee-7c6e-11ec-bcb6-dac502259ad0.jpg

來自知乎用戶:甜草莓

這些標(biāo)準(zhǔn),形成了開放的競爭關(guān)系,不斷探索著視頻算法的極限。它們是視頻技術(shù)向前發(fā)展的基礎(chǔ)。

除了硬指標(biāo)提升之外,音視頻的另一個發(fā)展趨勢,就是全面智能化時代的到來

換言之,就是AI人工智能技術(shù)不斷被引入到音視頻領(lǐng)域,幫助提升音視頻內(nèi)容的生產(chǎn)效率,同時創(chuàng)新出更多的玩法。

首先看看音頻。

AI+音頻,可以實現(xiàn)對音頻信號的智能識別、編創(chuàng)。具體識別對象,可以是歌曲中的鼓點、節(jié)奏點。


AI可以針對音樂的強(qiáng)度、情緒、風(fēng)格、情感等維度,對音樂進(jìn)行理解和打標(biāo)簽。在編創(chuàng)時,AI可以將音樂中人聲、伴奏、吉他、鋼琴等音軌進(jìn)行智能分離。

AI還可以自動對歌詞進(jìn)行續(xù)寫,將一首流行歌曲,改編成一首Rap(說唱音樂)。

再看看視頻。

做過視頻的人都知道,視頻內(nèi)容創(chuàng)作的大部分工作量,都集中在視頻內(nèi)容剪輯和渲染上,既費時又費力。

相比于傳統(tǒng)的人工剪輯,基于算法和學(xué)習(xí),AI可以對視頻素材進(jìn)行“智能增強(qiáng)”、“智能剪輯/拆條”。

“智能增強(qiáng)”,則是通過AI技術(shù),進(jìn)行視頻圖像降噪、色彩增強(qiáng),改善畫面細(xì)節(jié),提升人眼的主觀效果。

“智能剪輯/拆條”,則是智能識別和分析視頻原始素材中人物的動作、事件和表情,自動定位精彩片段,將其提取出來,完成剪輯、配樂等工作,變成精彩視頻集錦。

“AI+音頻+視頻”的融合,用途更為廣闊。Up主可以借此實現(xiàn)視頻智能配樂、音樂MV和vlog的自動創(chuàng)作,大幅降低作品的生產(chǎn)難度。

除了內(nèi)容創(chuàng)作以外,AI還可以用于視頻修復(fù)(舊電影修復(fù))、視頻增強(qiáng)和行業(yè)視頻應(yīng)用。

例如,騰訊的多媒體實驗室,通過深度學(xué)習(xí)敦煌壁畫病害數(shù)據(jù),形成自動識別并添加圖示的一整套算法,打造出了高效的AI壁畫病害識別工具。

音視頻技術(shù)的第三個發(fā)展趨勢,是服務(wù)形式的平臺化

正如前面所介紹的,音視頻技術(shù)的應(yīng)用難度很高,一般個人和企業(yè)很難獨立玩轉(zhuǎn)。于是,現(xiàn)在很多音視頻技術(shù)服務(wù)商,開始通過視頻云(騰訊)、視頻中臺(中國移動)等方式,對個人和政企用戶進(jìn)行音視頻能力服務(wù)。

這些平臺集成了開放的API接口,方便上層應(yīng)用開發(fā)商調(diào)用,開發(fā)軟件。平臺本身,又結(jié)合了云的能力,擁有無限的算力,可以支撐用戶的需求。

專業(yè)服務(wù)商們提供的技術(shù)和平臺,涵蓋了智能采集、數(shù)據(jù)處理和渲染展示等多個環(huán)節(jié),有利于降低垂直行業(yè)對音視頻業(yè)務(wù)的開發(fā)門檻,讓更多的企業(yè)能夠從容地使用音視頻業(yè)務(wù),享受音視頻紅利,加快數(shù)字化轉(zhuǎn)型。

結(jié)語

現(xiàn)在,沒有音視頻,人們的快樂會減少一半。

未來,沒有音視頻,企業(yè)的效率會下降一半。

正如前面所說,未來,音視頻技術(shù)將進(jìn)入爆發(fā)期。尤其是工業(yè)制造、金融證券、文旅教育等垂直領(lǐng)域,音視頻將進(jìn)入高速增長的階段。音視頻的商業(yè)模式,將發(fā)生很大的變化。音視頻業(yè)務(wù)的應(yīng)用場景,也將大量出現(xiàn)。

希望音視頻能夠帶來更多的創(chuàng)新,帶給我們更多的驚喜。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 音頻
    +關(guān)注

    關(guān)注

    29

    文章

    2915

    瀏覽量

    82086
收藏 人收藏

    評論

    相關(guān)推薦

    國科微榮獲音視頻領(lǐng)域關(guān)鍵技術(shù)突破一等獎

    近日,第五屆“馬欄山杯”國際音視頻算法大賽-2024音視頻領(lǐng)域關(guān)鍵技術(shù)突破獎揭曉,國科微8K超高清視頻系列芯片憑借優(yōu)異的產(chǎn)品性能及示范性應(yīng)用獲評一等獎。
    的頭像 發(fā)表于 12-26 15:11 ?311次閱讀

    AMS-HE200:HDMI音視頻網(wǎng)絡(luò)延長器,開啟傳輸新時代

    在數(shù)字化時代,高清音視頻傳輸已經(jīng)成為各行各業(yè)不可或缺的重要技術(shù)。無論是安防監(jiān)控、視頻會議,還是戶外廣告、家庭影院,高清音視頻信號的無縫傳輸都扮演著至關(guān)重要的角色。深圳市程達(dá)科技有限公司
    的頭像 發(fā)表于 11-27 10:04 ?254次閱讀
    AMS-HE200:HDMI<b class='flag-5'>音視頻</b>網(wǎng)絡(luò)延長器,開啟傳輸新時代

    盤點那些常見音視頻接口

    我們熟知的一些常見音視頻接口,發(fā)展至今在日常使用中已經(jīng)漸漸少了。但是在工業(yè)領(lǐng)域的音視頻連接,依然能看到其身影。這些看似消失的接口,它們現(xiàn)在發(fā)展成什么樣子了?本期我們將做一個大盤點。
    的頭像 發(fā)表于 09-09 14:34 ?739次閱讀

    常見音視頻接口的靜電浪涌防護(hù)和濾波方案

    音視頻接口在現(xiàn)代多媒體設(shè)備中扮演著至關(guān)重要的角色,它們確保了音視頻信號在不同設(shè)備間的順暢傳輸,各種類型的音視頻接口滿足了多樣化的應(yīng)用場景需求。 在音視頻接口的設(shè)計領(lǐng)域,靜電浪涌防護(hù)與濾
    的頭像 發(fā)表于 06-25 11:28 ?809次閱讀

    音視頻產(chǎn)品EMC整改案例解析

    音視頻產(chǎn)品EMCRE整改案例解析
    的頭像 發(fā)表于 05-20 16:49 ?526次閱讀
    <b class='flag-5'>音視頻</b>產(chǎn)品EMC整改案例解析

    【RTC程序設(shè)計:實時音視頻權(quán)威指南】音視頻的編解碼壓縮技術(shù)

    音視頻所載有的信息在通過傳輸?shù)臅r候就需要壓縮編碼。 其中,文本壓縮是指通過使用各種算法和技術(shù),將文本數(shù)據(jù)表示為更緊湊的形式,以減少存儲空間。 霍夫曼編碼是一種無損壓縮算法,它可以根據(jù)字符出現(xiàn)
    發(fā)表于 04-28 21:04

    音視頻SoC與AI技術(shù)融合,帶來更智能的音視頻處理解決方案

    ,如WiFi路由器和物聯(lián)網(wǎng)設(shè)備。在安防、智能音頻等領(lǐng)域,對SoC芯片的算力要求相比智能手機(jī)、服務(wù)器等略低。 ? 人工智能技術(shù)音視頻SoC 的融合??????????????????????????????????????? ? 隨著人工智能
    的頭像 發(fā)表于 04-26 01:20 ?4761次閱讀

    【RTC程序設(shè)計:實時音視頻權(quán)威指南】音頻采集與預(yù)處理

    閑暇之余,繼續(xù)學(xué)習(xí)【RTC程序設(shè)計:實時音視頻權(quán)威指南】這本書。 書中對于音頻采集的介紹非常詳細(xì)和全面,包括原理、方法、技術(shù)細(xì)節(jié)以及實踐應(yīng)用等方面的內(nèi)容。 音頻采集是實時音視頻通信中的關(guān)鍵步驟之一
    發(fā)表于 04-25 10:41

    【RTC程序設(shè)計:實時音視頻權(quán)威指南】新書一瞥

    本人從事音視頻領(lǐng)域的開發(fā),經(jīng)常接觸實時音視頻處理相關(guān)的技術(shù),看到這本書非常有興趣閱讀,這本書全面介紹實時音視頻(RTC)技術(shù)的權(quán)威著作,該書
    發(fā)表于 04-22 09:09

    音視頻解碼生成:打造你的專屬高清影院體驗

    在數(shù)字化時代,人們對觀影體驗的要求越來越高。音視頻解碼生成技術(shù),作為現(xiàn)代多媒體播放的核心,正是為了滿足這種需求而不斷發(fā)展和完善的。通過這項技術(shù)我們可以輕松打造屬于自己的高清影院體驗。
    的頭像 發(fā)表于 02-25 14:47 ?463次閱讀

    音視頻解碼生成:打造極致觀影體驗的關(guān)鍵技術(shù)

    在現(xiàn)代多媒體時代,音視頻解碼生成技術(shù)已成為提供極致觀影體驗的核心要素。它不僅能夠確保音視頻數(shù)據(jù)的高效傳輸,還能保證播放的流暢性和畫質(zhì)清晰度,為用戶帶來身臨其境的觀影享受。 1. 解碼生成的重要性
    的頭像 發(fā)表于 02-25 14:43 ?528次閱讀

    音視頻解碼器優(yōu)化技巧:提升播放體驗的關(guān)鍵步驟

    隨著數(shù)字多媒體內(nèi)容的爆炸式增長,音視頻解碼器在現(xiàn)代技術(shù)生活中扮演著至關(guān)重要的角色。從流暢的在線視頻流播放到高質(zhì)量的本地文件解碼,解碼器的性能直接影響了我們的觀看體驗。那么,如何優(yōu)化
    的頭像 發(fā)表于 02-21 14:45 ?1013次閱讀

    音視頻解碼生成常見問題及解決方案

    音視頻解碼生成的過程中,我們可能會遇到一些常見問題,這些問題可能會影響解碼的效果和效率。以下是一些常見問題及其解決方案: 問題1:解碼失敗 原因 :可能是文件本身有問題,如損壞或格式不支持;也
    的頭像 發(fā)表于 02-21 14:39 ?1782次閱讀

    音視頻解碼生成在多媒體制作中的應(yīng)用

    音視頻解碼生成是多媒體制作中不可或缺的一部分,它扮演著將編碼的音視頻數(shù)據(jù)轉(zhuǎn)化為可播放、可編輯的內(nèi)容的關(guān)鍵角色。在多媒體制作的全過程中,音視頻解碼生成技術(shù)都有廣泛的應(yīng)用。 1.
    的頭像 發(fā)表于 02-21 14:39 ?445次閱讀

    音視頻解碼生成與流媒體傳輸?shù)慕Y(jié)合

    音視頻解碼生成與流媒體傳輸是現(xiàn)代數(shù)字媒體技術(shù)中兩個不可或缺的部分,它們的結(jié)合為用戶提供了高質(zhì)量、實時性的多媒體體驗。 1. 解碼生成與流媒體傳輸?shù)年P(guān)系 解碼生成是流媒體傳輸?shù)那疤帷T诹髅襟w服務(wù)中
    的頭像 發(fā)表于 02-21 14:36 ?474次閱讀
    主站蜘蛛池模板: 日本天堂影院 | 欧美精品videofree720p| 偷偷操不一样的久久 | 色婷婷综合激情 | 黄视频网站在线看 | 全午夜免费一级毛片 | 婷婷综合激情 | 免费 在线播放 | 亚洲一区毛片 | 免费美剧在线观看 | 中文字幕在线观看一区二区三区 | 欧美色惰 | 视频免费在线观看 | 亚洲欧美综合一区 | 奇米影视亚洲春色77777 | 九九热在线观看 | 抽搐一进一出gif免费男男 | 婷婷开心激情网 | 夜夜艹| 影音先锋午夜资源网站 | 天天爽夜夜 | 黄色国产视频 | 日日摸人人拍人人澡 | 三级三级三级网站网址 | 99久久无色码中文字幕 | 亚洲精品一区二区中文 | 欧美精品久久天天躁 | 国产叼嘿视频网站在线观看 | 国产一级特黄aa大片在线 | 正在播放淫亚洲 | 特级毛片aaaaaa蜜桃 | 97精品伊人久久久大香线焦 | 色综合天天操 | 亚洲国产欧美在线人成aaa | 国产成人a一区二区 | 欧美伊久线香蕉线新在线 | 国产农村一级特黄α真人毛片 | 四虎影院在线免费观看 | 亚洲一级毛片免观看 | 国产欧美日韩综合精品一区二区 | 手机看片精品国产福利盒子 |