91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Armv9 CPU中SVE2的實際用例

Arm社區(qū) ? 來源:Arm社區(qū) ? 2024-10-21 09:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:Arm 終端事業(yè)部消費計算市場高級經(jīng)理 Poulomi Dasgupta

隨著每一代新產(chǎn)品的推出,Arm CPU 都會實現(xiàn)代際性能提升,并引入架構(gòu)改進,以滿足不斷演進的計算工作負(fù)載的需求。本文將重點介紹三個用例,以展示 Armv9 CPU 的架構(gòu)特性在實際場景中產(chǎn)生的影響,特別是在 HDR 視頻解碼(加速 10%)、圖像處理(加速 20%)、主要移動端應(yīng)用中的功能 LibYUV(加速 26%)。

好消息是,本文中討論的一些 Arm SVE2 優(yōu)化現(xiàn)已可供開發(fā)者獲取使用,有望提升熱門媒體應(yīng)用的用戶體驗,進一步改善人們溝通、工作和娛樂的方式。

應(yīng)用開發(fā)者和 OEM 廠商面臨的挑戰(zhàn)

首先,從移動端應(yīng)用開發(fā)者當(dāng)前面臨的挑戰(zhàn)來看,目前市場上有超過 200 萬個安卓應(yīng)用[1]在爭奪用戶的青睞。這些應(yīng)用要想保持競爭力,就必須迅速將創(chuàng)新成果推廣到各種移動設(shè)備上。倘若依賴于功能固定的硬件,會面臨產(chǎn)品上市時間和可移植性等方面的挑戰(zhàn)。

與出色的用戶體驗相關(guān)的指標(biāo),包括應(yīng)用啟動時間、UI 流暢度、每秒詞元 (token) 數(shù)和每秒幀數(shù) (FPS) 穩(wěn)定性等都需要切實滿足用戶期望。因此,OEM 廠商需要在性能提升與更廣泛的用戶需求(如延長電池續(xù)航時間、減少數(shù)據(jù)使用量和設(shè)備成本)之間取得平衡。其中任一方面存在不足,都可能導(dǎo)致用戶不滿意,否定升級移動設(shè)備的價值。

在 Armv9 CPU 上開發(fā)軟件可以解決 OEM 廠商和開發(fā)者所面臨的挑戰(zhàn)。

Armv9 CPU 中 SVE2 的實際用例

讓我們來看三個案例研究,證明軟件優(yōu)化可以加速實際工作負(fù)載。首先,以下是 SVE2 的一個子集和可加速移動設(shè)備上關(guān)鍵工作負(fù)載的 Armv9 CPU 中的新矢量指令:

16 位點積和 8 位矩陣乘法,可加速 HDR 視頻播放和視頻會議。

圖像處理直方圖指令。

聚合讀取和分散存入,用于攝像頭傳感器數(shù)據(jù)的解交織處理。

復(fù)數(shù)指令,用于加速視頻編解碼器中的快速傅里葉變換。

使用這些矢量指令可使優(yōu)化的軟件使用更少的 CPU 周期,帶來兩大好處。第一,CPU 周期減少使得能耗降低,增加電池續(xù)航時間;第二,提高應(yīng)用性能。

案例 1

SVE2 使視頻解碼速度提高 10%

觀看多媒體內(nèi)容是移動設(shè)備上最常見的工作負(fù)載之一,也是移動端網(wǎng)絡(luò)較大的流量來源。因此,廠商不斷追求更高效的編解碼器,希望在節(jié)省網(wǎng)絡(luò)帶寬的同時,支持出色的圖像質(zhì)量。

HDR 技術(shù)由于色彩準(zhǔn)確度更高,可呈現(xiàn)更加逼真的細(xì)節(jié),即使是在非常暗或非常亮的場景中也是如此。它使用 10 位而非 8 位來表示每個色彩通道。AV1 和 VP9 以及其他現(xiàn)代編解碼器,且都支持 HDR 視頻。

AV1 是一種較新的格式,可提供更好的壓縮效果,而 VP9 則在各種瀏覽器和設(shè)備中具有更廣泛的兼容性。一些熱門應(yīng)用都使用 AV1 和 VP9 格式來播放視頻。

SVE2 優(yōu)化使 HDR 視頻解碼速度提高了約 10%,VP9 解碼速度提高了 8%,AV1 解碼速度提高了 10%。這使得 CPU 周期減少約 10%,電量消耗也相應(yīng)減少,讓用戶在移動設(shè)備上播放點播視頻時能夠獲得更長的電池續(xù)航時間。如此一來,無論是觀看快拍、短片還是長視頻,都將變得更加順暢!

對 libdav1d(Av1 解碼器)和 libvpx(Vp9 解碼器)的優(yōu)化代碼已經(jīng)上傳,開發(fā)者現(xiàn)可獲取使用。

案例 2

SVE2 使 LibYUV 速度提高了 26%

值得一提的是,我們每個人都在不知不覺中使用了 LibYUV。

LibYUV 是一個開源庫,用于 RGB 和 YUV 之間的色彩空間轉(zhuǎn)換、攝像頭傳感器數(shù)據(jù)縮放,以及攝像頭濾鏡和旋轉(zhuǎn)。在經(jīng)由視頻解碼器使用之前,它會對來自攝像頭傳感器的數(shù)據(jù)進行處理。在很多情況下,視頻解碼器中的數(shù)據(jù)會先通過 LibYUV 進行處理,然后再發(fā)送去顯示。

SVE2 優(yōu)化使 LibYUV 速度提高了 26%(Armv9 CPU 上多個內(nèi)核的幾何平均值)。LibYUV 中大約有 100 個內(nèi)核已使用 SVE2 進行了優(yōu)化,其他內(nèi)核的優(yōu)化工作正在進行中。部分工作已完成上傳,可在 https://chromium.googlesource.com/libyuv/libyuv/上查看。

LibYUV 作為 Chromium 的一部分進行分發(fā)。Chromium 是一個開源瀏覽器項目,為 Chrome 及主要手機廠商的定制瀏覽器(包括小米瀏覽器和三星瀏覽器等)奠定了基礎(chǔ)。它還被集成到 AOSP 和 Android Jetpack 中。由于 LibYUV 對移動設(shè)備至關(guān)重要,它有望對整體移動端體驗產(chǎn)生深遠(yuǎn)的影響,例如帶來更好的視頻會議體驗、更順暢的豎屏和橫屏模式切換,以及更好的視頻消費體驗,并且大大延長電池續(xù)航時間。

案例 3

SVE2 使計算攝影速度提高 20%

Halide 是一種專門用于圖像處理領(lǐng)域的語言,用于 Adobe Photoshop 等應(yīng)用,一些 OEM 廠商也將它用于攝像頭管線。

SVE2 指令(例如聚合讀取和分散存入指令)和 TBL(可編程查表,用于矢量化小型查詢表)加速了 Halide 中的一些關(guān)鍵計算機視覺流程。iToFDepth(用于感知深度)、雙邊網(wǎng)格(用于邊緣感知色調(diào)映射)和局部拉普拉斯(用于濾鏡)等計算密集型算法在采用 SVE2 后,性能提升了近 20%。

使用 SVE2 來優(yōu)化軟件可以實時應(yīng)用一些攝影效果,為入門級移動設(shè)備開辟了新的可能性,用戶無需專用硬件即可獲得更高質(zhì)量的照片。

Arm 已針對 SVE2 代碼生成優(yōu)化了 Halide 后端。好消息是,一些補丁已經(jīng)上線,其他補丁也正在開發(fā)中。

de02d490-8dae-11ef-a511-92fbcf53809c.png

圖:Halide-SVE2 和 Halide-Neon CPU 周期數(shù)對比

如何更好地使用 SVE2?

SVE2 引入了幾個新指令,非常適合加速關(guān)鍵的實際工作負(fù)載和應(yīng)用。我們將在后續(xù)的技術(shù)文章中更詳細(xì)地討論如何使用 Armv9 CPU 實現(xiàn)一些性能提升,請持續(xù)關(guān)注“Arm 社區(qū)”微信公眾號,敬請期待!

Arm 致力于為生態(tài)系統(tǒng)找到良好的平衡點,更好地兼顧開發(fā)者支持和性能提升。一些針對 SVE2 進行優(yōu)化的開源庫和內(nèi)核已經(jīng)上線,未來還會有更多資源。

Armv9 CPU 的最新進展將使開發(fā)者能夠更快實現(xiàn)創(chuàng)新,為各類移動設(shè)備的最終消費者帶來更好的用戶體驗。還等什么,趕緊采用 SVE2 開始你的開發(fā)項目,實現(xiàn)創(chuàng)新吧!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9353

    瀏覽量

    377737
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11081

    瀏覽量

    217161
  • 圖像處理
    +關(guān)注

    關(guān)注

    27

    文章

    1329

    瀏覽量

    58085
  • 視頻解碼
    +關(guān)注

    關(guān)注

    1

    文章

    51

    瀏覽量

    18563

原文標(biāo)題:Armv9 技術(shù)講堂 | 利用 Armv9 CPU 和 SVE2 加速視頻解碼和圖像處理

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Arm下一代指令架構(gòu)“Armv9”已經(jīng)問世

    Arm的下一代CPU指令集架構(gòu)(ISA:指令集架構(gòu)) Armv9開始推出。該公司正在逐步擴展當(dāng)前的ISA Armv8,而擴展的高潮最終將成為Armv9的搭建橋梁。至于
    的頭像 發(fā)表于 11-13 11:55 ?4.5w次閱讀

    Armv9核心A710、A715和A510微架構(gòu)解讀

    在介紹Armv9系列前,我們先看一下ARM的Cortex-X定制CPU計劃。Cortex-X方案先于Armv9發(fā)布,在Arm發(fā)布A78時,同時也發(fā)布了Cortex-X1這一顆性能強大的CPU
    發(fā)表于 06-12 09:27 ?2.9w次閱讀
    <b class='flag-5'>Armv9</b>核心A710、A715和A510微架構(gòu)解讀

    淺析Armv9-A構(gòu)架上的可伸縮矩陣擴展(SME)

    1Armv8.4-A:支持了8-bit整型的點積運算指令(DOT指令)Armv8.6-A: 支持在向量寄存器里做整型和浮點型的矩陣乘指令,和BFloat16數(shù)據(jù)類型Armv9-A: 支持了SV
    發(fā)表于 08-05 15:02

    一文詳解SIMD架構(gòu)與SVE2的演進

    。在 Armv9 為 ML 和 DSP 擴展矢量處理(來自 Arm Vision Day)什么是 SVESVE2?利用并行執(zhí)行指令(稱為 SIMD(單指令多數(shù)據(jù))指令)可以加
    發(fā)表于 08-12 15:50

    如何在Android用上Armv9 CPU新引入的PAC安全特性和SVE2呢?

    基于Armv9 CPU的手機芯片已經(jīng)被廣泛采用。早在2020年,arm已經(jīng)和google合作將這些新特性帶入到Android 12, NDK r23也支持了PAC, BTI等。1. 如何利用PAC
    發(fā)表于 10-13 11:44

    一文淺析SVESVE2

    計。 實現(xiàn)上是覆蓋式的,支持SVE/SVE2,一定支持Neon。我個人的理解,SVESVE2最大的好處是軟件是靈活的,一開始就考慮到指令
    發(fā)表于 11-02 14:26

    了解Armv9-A體系結(jié)構(gòu)之SVE2簡介

    本指南是Armv9-A 結(jié)構(gòu)的可縮放矢量擴展(SVE2) 第二版第二版的簡短導(dǎo)言。 您可以在此指南中了解 SVE2 的概念和主要特點、 SVE2 的應(yīng)用領(lǐng)域以及
    發(fā)表于 08-02 08:19

    SVE編程示例

    支持。 SVE2是可伸縮向量擴展v2,是具有擴展功能的ARMv8-A SVE的超集。 SVE2指令集添加了全面的整數(shù)算術(shù)支持
    發(fā)表于 08-22 06:29

    重磅!Arm正式推出Armv9架構(gòu)

    當(dāng)?shù)貢r間3月30日,Arm宣布正式推出Armv9架構(gòu),以應(yīng)對全球?qū)o處不在的專業(yè)化處理的需求,這種處理具有越來越強大的安全性和人工智能(AI)能力。Armv9是ARM公司十年來的最大技術(shù)革新。上一代
    發(fā)表于 03-31 09:43 ?2831次閱讀
    重磅!Arm正式推出<b class='flag-5'>Armv9</b>架構(gòu)

    淺談ARM發(fā)布Armv9的三大改進

    英國芯片設(shè)計公司Arm周二發(fā)布了Armv9,這是其在2011年發(fā)布Armv8之后十年來首次推出新的芯片架構(gòu)。Arm表示,與以前的架構(gòu)相比,Armv9提供了三大主要改進,即安全性更高,更好的AI性能,以及總體上速度更快。
    的頭像 發(fā)表于 04-01 15:17 ?2624次閱讀

    Arm推出三款基于Armv9架構(gòu)的全新CPU內(nèi)核

    從全面升級到Armv9架構(gòu),到公布Neoverse V1和N2平臺技術(shù)細(xì)節(jié),再到推出三款基于Armv9架構(gòu)的全新CPU內(nèi)核,短短兩個月時間里,Arm全面計算(Arm Total Com
    的頭像 發(fā)表于 06-12 09:11 ?4623次閱讀

    下一代Arm服務(wù)器CPU內(nèi)核:Neoverse V2和E2

    首先,Armv9的升級帶來了最新Arm架構(gòu)附帶的全套功能。這包括作為架構(gòu)基石功能的安全改進(尤其適用于云共享環(huán)境)以及Arm較新的SVE2矢量擴展。
    發(fā)表于 10-14 10:57 ?1704次閱讀

    Arm微架構(gòu)之Armv9時代

    在介紹Armv9系列前,我們先看一下ARM的Cortex-X定制CPU計劃。Cortex-X方案先于Armv9發(fā)布,在Arm發(fā)布A78時,同時也發(fā)布了Cortex-X1這一顆性能強大的CPU
    的頭像 發(fā)表于 02-06 14:43 ?9787次閱讀

    Armv8架構(gòu)和Armv9架構(gòu)的區(qū)別分析

    新的Armv9兼容CPU所承諾的最大的新功能可能是開發(fā)人員和用戶可以立即看到的——SVE2作為NEON的后繼產(chǎn)品。
    發(fā)表于 03-10 14:02 ?6628次閱讀

    Armv9Armv8服務(wù)器有何不同

    新的Armv9兼容CPU所承諾的最大的新功能可能是開發(fā)人員和用戶可以立即看到的——SVE2作為NEON的后繼產(chǎn)品。 可伸縮矢量擴展(SVE)的于2016年首次亮相,并首次在富士通的A6
    發(fā)表于 03-29 14:02 ?1039次閱讀
    主站蜘蛛池模板: 天天爽夜夜爽精品视频一 | 久久国产午夜精品理论片34页 | 免费黄色三级网站 | 国产在线观看黄 | 国产又黄又爽又猛的免费视频播放 | 91在线激情在线观看 | 手机看片福利久久 | 色综合久久久高清综合久久久 | 手机在线你懂的 | 美女扒开尿口给男人爽免费视频 | 久久久久国产一级毛片高清板 | 久久久久女人精品毛片 | 国产毛片久久国产 | 在线看你懂 | 国产精品9999久久久久仙踪林 | 毛片不卡一区二区三区 | 久久综合免费视频 | 可以免费观看的黄色网址 | 天堂网在线观看 | 黄色大片免费观看 | 一级做a爰片久久毛片毛片 一级做a爰片久久毛片美女图片 | 农村妇女野外一级毛片 | 又污又黄的网站 | 在线视频一区二区三区 | 天天综合色一区二区三区 | 一级无毛片 | 最新国产在线播放 | 久久精品亚瑟全部免费观看 | 中文字幕国产一区 | 午夜看黄网站免费 | 国产欧美高清 | 中文字幕1页 | 伊人网址 | 在线小毛片 | 国产美女免费观看 | 久久免费福利视频 | 免费黄色小视频 | 亚洲午夜网未来影院 | 91大神免费视频 | 久久久www免费人成看片 | 国内色视频 |