在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI Codec在應(yīng)用落地方面的案例

LiveVideoStack ? 來源:LiveVideoStack ? 2023-06-19 09:50 ? 次閱讀

AI Codec自2016年首次提出以來,眾多海內(nèi)外高校、企業(yè)研究院等機(jī)構(gòu)對(duì)此展開了廣泛研究。6年時(shí)間里,AI Codec 的SOTA方案的壓縮性能已經(jīng)超越了H.266(最新的傳統(tǒng)Codec標(biāo)準(zhǔn)),展現(xiàn)了強(qiáng)大的技術(shù)潛力。但受限于計(jì)算復(fù)雜度、非標(biāo)等原因,AI Codec在應(yīng)用落地方面的案例卻屈指可數(shù)。LiveVideoStackCon2022北京站邀請(qǐng)了來自雙深科技的田康為大家分享基于雙深科技的AI Image Codec技術(shù)落地探索經(jīng)驗(yàn)。

文/田康 編輯/LiveVideoStack

大家好,本次分享的主題為:AI Image Codec技術(shù)落地實(shí)踐,主要將分三部分介紹我們?cè)谝苿?dòng)端方面取得的技術(shù)成果。第一部分介紹圖像視頻行業(yè)發(fā)展趨勢(shì)和我們的理解;第二部分簡(jiǎn)單總結(jié)AI Codec發(fā)展;第三部分為重點(diǎn),即AI Image Codec移動(dòng)端落地實(shí)踐。

-01-

圖像視頻行業(yè)發(fā)展趨勢(shì)

fda172d2-0e36-11ee-962d-dac502259ad0.png

首先介紹圖像視頻行業(yè)發(fā)展趨勢(shì),“我們身處圖像數(shù)據(jù)大爆發(fā)的時(shí)代”可能已成為了一項(xiàng)行業(yè)共識(shí)。據(jù)我們從相關(guān)機(jī)構(gòu)取得的調(diào)研數(shù)據(jù)顯示,全球圖片視頻數(shù)據(jù)總量至2025年預(yù)計(jì)將超過140ZB,每年的數(shù)據(jù)復(fù)合增長(zhǎng)率達(dá)到27%,這是一個(gè)很恐怖的數(shù)量級(jí)。隨著近年來ChatGPT等技術(shù)的火爆,相信增長(zhǎng)率還會(huì)進(jìn)一步提升。 簡(jiǎn)單分析數(shù)據(jù)量迅速增長(zhǎng)的原因:首先是在醫(yī)療、安防等應(yīng)用場(chǎng)景下,影像數(shù)據(jù)按照國(guó)家政策要求需要長(zhǎng)期或永久存儲(chǔ),導(dǎo)致數(shù)據(jù)積累量越來越大。第二是隨著大眾對(duì)高畫質(zhì)、高幀率等高質(zhì)量視頻需求的增長(zhǎng),導(dǎo)致數(shù)據(jù)密度提升。第三是隨著視頻數(shù)據(jù)在互聯(lián)網(wǎng)、安防、無人機(jī)、云游戲(不同于傳統(tǒng)游戲,過程中伴隨著超大量視頻傳輸)等等多種應(yīng)用場(chǎng)景的拓展帶來了數(shù)據(jù)量的巨量增長(zhǎng)。 那么要高效運(yùn)用這些數(shù)據(jù)必定伴隨著壓縮、傳輸和存儲(chǔ)等底層技術(shù)的發(fā)展優(yōu)化,我們認(rèn)為壓縮技術(shù)的提升是其中的關(guān)鍵,主要原因有三個(gè):首先是帶寬和存儲(chǔ)的提升是有瓶頸的。其次針對(duì)野外巡檢等特殊應(yīng)用場(chǎng)景,增加帶寬并不適用。第三是存儲(chǔ)和帶寬的提升并沒有從根本解決傳輸數(shù)據(jù)量龐大這個(gè)問題。

fdeecbc2-0e36-11ee-962d-dac502259ad0.png

上圖為我們?cè)O(shè)計(jì)的視覺AI應(yīng)用鏈路圖,首先通過攝像頭或計(jì)算機(jī)生產(chǎn)影像內(nèi)容,然后進(jìn)行修復(fù)、剪輯或AI審核等處理,并將數(shù)據(jù)呈遞給用戶進(jìn)行數(shù)據(jù)查看,過程中可能伴隨著AI動(dòng)作識(shí)別交互或超分,隨后傳遞至存儲(chǔ)設(shè)備進(jìn)行數(shù)據(jù)存儲(chǔ)。在應(yīng)用前通過文本、圖片、跨模態(tài)等檢索方式查找所需的數(shù)據(jù),最終可以對(duì)其進(jìn)行結(jié)構(gòu)化解析和隱私/分布式計(jì)算等應(yīng)用。 可以看到整個(gè)流程都由編解碼來進(jìn)行銜接。同時(shí)在每個(gè)環(huán)節(jié)都可能存在AI的應(yīng)用,這也是數(shù)據(jù)處理后續(xù)的發(fā)展趨勢(shì)。 和傳統(tǒng)編解碼相比,AI端到端編解碼在天然上更適應(yīng)這種趨勢(shì)。從算法層面來看,AI編解碼以提取的圖像特征直接進(jìn)行下游應(yīng)用,從而節(jié)約了下游特征提取計(jì)算量。從硬件層面來看,AI的大量應(yīng)用使當(dāng)下硬件都或多或少地帶有AI算力,這同時(shí)為AI編解碼的應(yīng)用創(chuàng)造了條件。

-02-

AI Codec發(fā)展

fe75cd20-0e36-11ee-962d-dac502259ad0.png

接下來介紹AI Codec的發(fā)展,上圖為傳統(tǒng)和AI編解碼發(fā)展歷程的對(duì)比??梢钥吹剑珹I Codec壓縮性能超越傳統(tǒng)的H.264、H.265僅使用了傳統(tǒng)方法1/6的發(fā)展時(shí)間。從1988年的H.261到2020年的H.266,相較于傳統(tǒng)編解碼器平均十年一次的迭代頻率,AI編解碼實(shí)現(xiàn)了飛速發(fā)展,從2016年端到端編碼框架的提出到后續(xù)GAN、1857標(biāo)準(zhǔn)的應(yīng)用,甚至是后續(xù)AIGC編碼發(fā)展方向的出現(xiàn),它在短時(shí)間內(nèi)不斷涌現(xiàn)可落地應(yīng)用的各種新方法。

fee170b6-0e36-11ee-962d-dac502259ad0.png

另一方面是AI芯片行業(yè)的發(fā)展同時(shí)為AI編解碼提供了落地土壤。近年來GPT-4、AIGC的大規(guī)模使用在側(cè)面推動(dòng)了AI芯片業(yè)整體的快速發(fā)展,隨著行業(yè)利好,高通等著名邊緣芯片企業(yè)也在逐步啟動(dòng)對(duì)AI芯片的開發(fā)研究。其次是存算一體、類腦芯片、量子計(jì)算等未來技術(shù)為芯片算力發(fā)展帶來了更好前景。

-03-

AI Image Codec移動(dòng)端落地實(shí)踐

ff69524c-0e36-11ee-962d-dac502259ad0.png

接下來介紹我們關(guān)于AI Image Codec在移動(dòng)端的落地實(shí)踐,以互聯(lián)網(wǎng)移動(dòng)端CDN圖片分發(fā)場(chǎng)景為應(yīng)用場(chǎng)景,首先解釋采用該場(chǎng)景的原因。

第一,當(dāng)下大量社交、內(nèi)容社區(qū)、電商APP均涉及該場(chǎng)景,中心端以一對(duì)多方式進(jìn)行圖片的分發(fā),即使是抖音這種小視頻平臺(tái)也會(huì)涉及很多圖片內(nèi)容。同時(shí)由于CDN 80%左右的運(yùn)營(yíng)成本為流量帶寬費(fèi)用,因此它有很大的圖片壓縮訴求,優(yōu)化圖片壓縮技術(shù)可以有效節(jié)約成本。第三是該場(chǎng)景為閉環(huán)場(chǎng)景,可以解決目前AI Codec非標(biāo)的問題。最后是移動(dòng)端的AI算力相對(duì)于其他物聯(lián)網(wǎng)設(shè)備較強(qiáng),可以實(shí)現(xiàn)更好的編解碼效果。

ffed4336-0e36-11ee-962d-dac502259ad0.png

以上為我們自研的AI圖像編解碼模型框架,它被稱為ANF。不同于傳統(tǒng)編解碼器通過分塊預(yù)測(cè)處理來進(jìn)行數(shù)據(jù)壓縮,ANF編解碼器在接收?qǐng)D片后,通過神經(jīng)網(wǎng)絡(luò)提取高層像素規(guī)律作為數(shù)據(jù)量化和輔助熵模型概率預(yù)估的依據(jù)。數(shù)據(jù)最終傳遞至傳輸端進(jìn)行熵解碼和像素重建,向用戶呈現(xiàn)圖片。

我們?cè)谡麄€(gè)流程中針對(duì)AI訓(xùn)練設(shè)置了兩個(gè)約束,第一是R-Loss,它代表比特流和超先驗(yàn)的存儲(chǔ)信息量;第二是D-Loss,它用于衡量輸入和輸出圖片之間的質(zhì)量差,以上兩個(gè)指標(biāo)都需要保持盡量小。

針對(duì)該模型我們也提出了一些優(yōu)化策略,如在特征提取階段采用Neighbor-patch-attention策略來參考周邊信息,提取更深層次特征。其次是在熵模型概率預(yù)估階段: 采用Space Shuffle策略,提升概率估計(jì)準(zhǔn)確度。第三是在超先驗(yàn)階段,將局部感受野擴(kuò)展到全局感受野來提取更準(zhǔn)確的輔助信息。

右圖為測(cè)試結(jié)果,其中紅線代表ANF模型數(shù)據(jù),可以看到相比于VVC等傳統(tǒng)編碼器,它的測(cè)試結(jié)果要超出0.5~0.7dB左右。

002dfb06-0e37-11ee-962d-dac502259ad0.png

由于ANF模型的架構(gòu)比較復(fù)雜,為了更好的在移動(dòng)端上進(jìn)行應(yīng)用,我們對(duì)它進(jìn)行了輕量化處理,在量化和部署加速方面做了相當(dāng)多的工作。在畫質(zhì)損失盡量小的前提下盡量獲取加速收益。

00856ce2-0e37-11ee-962d-dac502259ad0.png

以上是輕量化后的ANF模型和其他編解碼器使用LPIPS指標(biāo)測(cè)試的對(duì)比結(jié)果,用于衡量ANF和其他編解碼器之間的差距,該指標(biāo)越小代表壓縮后的圖像和原圖主觀質(zhì)量越接近。通過在多種場(chǎng)景下測(cè)試可以看到,ANF壓縮的圖片質(zhì)量要明顯優(yōu)于其他編解碼器。

00c97c02-0e37-11ee-962d-dac502259ad0.png

在客觀指標(biāo)結(jié)果較好的基礎(chǔ)上,我們組織對(duì)壓縮圖像進(jìn)行了主觀評(píng)測(cè),選擇了數(shù)十種不同場(chǎng)景,約兩萬張涵蓋不同分辨率的圖片作為數(shù)據(jù)集進(jìn)行測(cè)試。以avif的壓縮圖像作為基準(zhǔn)進(jìn)行對(duì)比,按照三種不同比例將原始圖片用ANF和avif編解碼器進(jìn)行壓縮,將壓縮后的圖片從相同位置裁取100*100左右大小的塊,與原圖對(duì)應(yīng)小塊對(duì)比壓縮畫質(zhì),最后征集志愿者進(jìn)行測(cè)評(píng)。

下表為評(píng)測(cè)結(jié)果,可以看到同體積下,主觀選擇ANF的比例(49.4%)明顯高于AVIF(18.6%),說明ANF主觀質(zhì)量明顯比AVIF好; 體積比為1:1.4時(shí),結(jié)果與1:1時(shí)相同;體積比為1:2時(shí),選擇ANF和AVIF的次數(shù)相當(dāng),且有較大比例“不選擇”,說明兩者主觀畫質(zhì)相當(dāng)。

01027ef8-0e37-11ee-962d-dac502259ad0.png

以上為同體積比下,兩種編碼器的測(cè)試效果圖,可以看到ANF壓縮圖片的質(zhì)量和原圖更加接近。

01480392-0e37-11ee-962d-dac502259ad0.png

以上為體積比為1:1.5時(shí),兩種編碼器的測(cè)試效果圖。可以看到ANF的圖像細(xì)節(jié)效果仍然不錯(cuò)。

018b8040-0e37-11ee-962d-dac502259ad0.png

接下來介紹ANF的解碼速度,我們?cè)隍旪?gen1平臺(tái)上對(duì)解碼速度進(jìn)行了測(cè)試,使用自封SDK測(cè)試從圖片載入到最終在移動(dòng)端顯示所需的時(shí)間??梢钥吹皆?080P分辨率下,ANF的平均延遲可以達(dá)到29.4毫秒,這個(gè)量級(jí)是人眼感受不到的,可以滿足應(yīng)用需求。

01d5e66c-0e37-11ee-962d-dac502259ad0.png

以上為編碼吞吐對(duì)比結(jié)果,在同樣的硬件條件下和傳統(tǒng)編碼器相比,ANF可獲得10-30倍的編碼加速。

020b275a-0e37-11ee-962d-dac502259ad0.png

以上為壓縮對(duì)二次識(shí)別檢測(cè)影響的測(cè)試結(jié)果,選取了精確率和召回率兩個(gè)指標(biāo)進(jìn)行衡量??梢钥吹皆诘蛪嚎s比下,ANF壓縮圖片的檢測(cè)精度略高于avif, 兩項(xiàng)指標(biāo)與原圖相當(dāng);在高壓縮比下,ANF壓縮圖片的檢測(cè)精度明顯高于avif, 與原圖的差距保持在2-5%范圍。

0249b3e4-0e37-11ee-962d-dac502259ad0.png

接下來進(jìn)行總結(jié),首先在當(dāng)前的圖像視頻大爆發(fā)時(shí)代,我們認(rèn)為編解碼技術(shù)的提升迫在眉睫和勢(shì)在必行的。第二是圖像處理AI化的趨勢(shì)明顯,基于AI的編碼方式從算法和硬件層面均能夠更好地協(xié)同。第三是AI Codec的發(fā)展速度很快,未來發(fā)展前景光明;同時(shí)AI Codec的發(fā)展也順應(yīng)了AI芯片發(fā)展的趨勢(shì)。最終我們基于AI Codec的主觀優(yōu)化,可以超過AVIF 30%以上,解碼效率可在高端機(jī)型落地,編碼效率顯著優(yōu)于傳統(tǒng)Codec的CPU軟編方案,具備在CDN圖片場(chǎng)景落地的可行性。我的分享到此結(jié)束,謝謝大家!
責(zé)任編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 帶寬
    +關(guān)注

    關(guān)注

    3

    文章

    992

    瀏覽量

    41843
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34378

    瀏覽量

    275614
  • 移動(dòng)端
    +關(guān)注

    關(guān)注

    0

    文章

    42

    瀏覽量

    4560

原文標(biāo)題:AI Image Codec技術(shù)落地實(shí)踐

文章出處:【微信號(hào):livevideostack,微信公眾號(hào):LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    risc-v多核芯片在AI方面的應(yīng)用

    多核芯片在AI方面的應(yīng)用具有廣闊的前景和巨大的潛力。隨著技術(shù)的不斷進(jìn)步和應(yīng)用的深入,我們期待看到更多基于RISC-V多核芯片的AI解決方案實(shí)際應(yīng)用中得到驗(yàn)證和推廣。
    發(fā)表于 04-28 09:20

    NEC MCU馬達(dá)方面的應(yīng)用

    NEC MCU馬達(dá)方面的應(yīng)用 Agenda1、NEC MCU馬達(dá)應(yīng)用方面的特點(diǎn) 1.1 NEC 8位MCU馬達(dá)應(yīng)用
    發(fā)表于 03-17 16:48 ?53次下載

    CODEC,CODEC是什么意思

    CODEC,CODEC是什么意思 CODEC是“COder/DECoder”的縮寫,CODEC芯片負(fù)責(zé)數(shù)字與模擬信號(hào)的轉(zhuǎn)換。它可將電腦里的數(shù)字信號(hào)轉(zhuǎn)變成模擬聲音信
    發(fā)表于 03-23 09:38 ?5990次閱讀

    阿里AI方面的布局和戰(zhàn)略投資出手闊綽

    人工智能如火如荼的當(dāng)下,對(duì)于國(guó)內(nèi)科技巨頭來說,布局AI就是布局未來,因此阿里AI方面的布局
    的頭像 發(fā)表于 12-05 09:03 ?4625次閱讀

    商湯科技智能視覺方面的進(jìn)展和落地應(yīng)用方面的實(shí)踐

    算力方面,今年商湯會(huì)擁有超過14000塊GPU,體現(xiàn)了旺盛的需求,商湯超過18個(gè)行業(yè)有各種各樣的落地場(chǎng)景,在這些行業(yè)里必然有各種各樣不同的基于計(jì)算機(jī)視覺的需求,所以造成對(duì)算力巨大的渴望。我們一
    的頭像 發(fā)表于 11-13 15:53 ?3937次閱讀

    遠(yuǎn)程醫(yī)療如何更好地落地 ADIAI方面的發(fā)展規(guī)劃

    日前爆發(fā)的武漢疫情,人們?cè)俣汝P(guān)注醫(yī)療器械的緊缺,以及關(guān)鍵半導(dǎo)體芯片的作用,同時(shí)思考遠(yuǎn)程醫(yī)療如何更好地落地,智能可穿戴設(shè)備如何提高精度,AI如何加速等。
    發(fā)表于 02-07 16:28 ?923次閱讀

    AI制造領(lǐng)域落地面臨的挑戰(zhàn)

    華為智能制造方面的經(jīng)驗(yàn)對(duì)于中國(guó)制造升級(jí)非常有價(jià)值,了解華為是如何實(shí)現(xiàn)智能制造之前,讓我們先來看看AI制造領(lǐng)域
    的頭像 發(fā)表于 09-03 09:53 ?3158次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>在</b>制造領(lǐng)域<b class='flag-5'>落地</b>面臨的挑戰(zhàn)

    Python語言AI、大數(shù)據(jù)方面的重要性

    Python語言AI、大數(shù)據(jù)方面的重要性
    發(fā)表于 09-02 16:20 ?25次下載

    全球金融機(jī)構(gòu)使用AI方面的主要趨勢(shì)

    2022 年調(diào)查確定了全球金融機(jī)構(gòu)使用 AI 方面的主要趨勢(shì)。
    的頭像 發(fā)表于 04-25 11:39 ?1790次閱讀

    英特爾推動(dòng)AI落地方面的最新成果

    英特爾On產(chǎn)業(yè)創(chuàng)新峰會(huì)(Intel Vision)上,英特爾公布了人工智能產(chǎn)品、軟件和服務(wù)方面取得的多項(xiàng)進(jìn)展,展示了未來辦公,遠(yuǎn)程醫(yī)療,精準(zhǔn)農(nóng)業(yè),現(xiàn)代物流等以技術(shù)為核心的創(chuàng)新案例。
    的頭像 發(fā)表于 05-30 16:54 ?1095次閱讀

    GPSGIS方面的應(yīng)用

    電子發(fā)燒友網(wǎng)站提供《GPSGIS方面的應(yīng)用.pdf》資料免費(fèi)下載
    發(fā)表于 10-23 10:51 ?0次下載
    GPS<b class='flag-5'>在</b>GIS<b class='flag-5'>方面的</b>應(yīng)用

    fpga通信方面的應(yīng)用

    FPGA通信方面的應(yīng)用非常廣泛,以下是一些主要的應(yīng)用場(chǎng)景。
    的頭像 發(fā)表于 03-27 14:10 ?1704次閱讀

    NVIDIA加速識(shí)因智能AI大模型落地應(yīng)用方面的重要作用介紹

    本案例介紹了 NVIDIA 加速識(shí)因智能 AI 大模型落地應(yīng)用方面的重要作用。生成式大模型已廣泛應(yīng)用于各領(lǐng)域,通過學(xué)習(xí)人類思維方式,能快速挖掘海量?jī)?nèi)容,滿足不同需求。
    的頭像 發(fā)表于 03-29 15:28 ?914次閱讀

    微處理器人工智能方面的應(yīng)用

    微處理器人工智能(AI方面的應(yīng)用日益廣泛且深入,成為了推動(dòng)AI技術(shù)發(fā)展的重要力量。本文將從微處理器
    的頭像 發(fā)表于 08-22 14:21 ?1492次閱讀

    AI環(huán)境可持續(xù)發(fā)展方面的作用

    近日,《聯(lián)合國(guó)氣候變化框架公約》締約方會(huì)議第二十九次會(huì)議(COP29)阿塞拜疆巴庫(kù)落下帷幕,與會(huì)者們齊聚于此,共同應(yīng)對(duì)氣候變化。AI 環(huán)境可持續(xù)發(fā)展方面的作用成為了本屆大會(huì)關(guān)注的焦
    的頭像 發(fā)表于 11-27 11:24 ?706次閱讀
    主站蜘蛛池模板: 日本h片在线观看 | 91视频色| 亚洲韩国日本欧美一区二区三区 | 免费 在线观看 视频 | 男女视频在线播放 | 亚洲视频在线一区二区 | 午夜免费片在线观看不卡 | 永久免费人成网ww555kkk手机 | 成人一级网站 | 午夜啪啪网站 | 免费国产不卡午夜福在线观看 | 日韩免费观看一级毛片看看 | 香蕉蕉亚亚洲aav综合 | 一区三区三区不卡 | 黄网站色在线视频免费观看 | 日本高清视频成人网www | 亚洲毛片大全 | 国产免费爽爽视频免费可以看 | 亚1州区2区3区4区产品乱码 | 色婷婷精品视频 | 国内夫妇交换性经过实录 | 2019天天操天天干天天透 | 国产精品一区二区三区免费视频 | 日日干夜夜操视频 | 午夜一级毛片免费视频 | 99综合色| 日本口工全彩无遮拦漫画大 | 成人欧美精品大91在线 | 四虎影院观看视频在线观看 | 免费观看在线观看 | 欧美大片一区二区 | 色老板在线视频一区二区 | 免费观看黄a一级视频 | 九九视频这里只有精品 | 久久精品免视看国产成人2021 | 欧美一级欧美三级 | 91精品国产色综合久久不卡蜜 | 日本不卡免费高清一级视频 | 在线精品国产第一页 | 精品香港经典三级在线看 | 永久黄网站色视频免费 |