在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

完整的Perf支持缺少了什么

lPCU_elecfans ? 來源:電子發燒友網 ? 作者:周凱揚 ? 2021-12-21 09:47 ? 次閱讀

RISC-V在云端、數據中心、汽車與網絡技術中的頻繁創新和亮相,已經讓這一成長中的ISA一只腳邁入了高性能計算場景。然而缺少強大的性能監測工具讓RISC-V的應用優化成了問題,尤其是在RISC-V如今不少軟件源于從非原生移植的情況下,運算性能不能發揮出百分百的實力成了令人頭疼的問題。

與此同時,英特爾ARM都擁有自己專用的性能監控方案,讓開發者可以發揮出其硬件的全部效力,但RISC-V仍然依靠定制或廠商特定的方案,而缺少通用性能監控軟件工具的完整支持。

Perf對RISC-V的支持

系統級的性能優化往往是靠性能剖析和代碼優化來實現的,前者是為了尋找性能瓶頸,后者則是為了改善軟件性能,因此這類性能分析/監控工具成了處理器開發時必不可少的軟件。盡管RISC-V的ISA規范已經定義了硬件性能監控(HPM),但總體支持程度上仍未完善。

就以Linux上的性能分析工具Perf為例,該工具可以借助PMU(性能監控單元)、tracepoint和內核計數器來分析程序中的硬件事件,比如處理器時鐘周期、指令計數器等,也可以分析一些軟件事件,比如Page Fault等。

Perf分為兩種模式,一種是perf stat,一種是perf record。如今上游Linux的perf雖然已經對RISC-V有了支持,但僅對perf stat有一些基本的支持。比如mcycle這一CSR用于處理器運行的時鐘周期計數,而minstret這一CSR則用于退休指令計數。

RISC-V privileged規范中,RISC-V定義了幾種特權模式,分別是U-mode(用戶模式)、S-mode(管理員模式)和M-mode(機器模式)。但目前只有在機器模式下才能對這些寄存器進行讀寫,管理員模式下缺乏可寫入的寄存器。

計數器卻又是每時每刻運行中的,所以現在可以做到周期和指令計數,卻無法啟用、禁用和暫停計數器,無法使用任何可編程計數器和事件采樣。不僅如此,RISC-V的perf不僅無法處理計數器溢出,也不支持溢出中斷。雖然市面上很多RISC-V處理器已經考慮到了這一點,采用定制的形式來完成部分任務,比如Esperanto就為自己的ET-SoC-1千核RISC-V處理器加入了商業級的芯片除錯與性能監控能力,但RISC-V規范本身缺少這些支持,這也就不利于當下RISC-V的開源生態。

完整的Perf支持缺少了什么?

于是我們現在發現管理員模式下無法寫入計數器,也無法改變mcountinhibit來直接開啟或停止計數器,也無法改變mhpmcountern來開啟或禁用直接讀取。接著就是沒有中斷指示器,我們不知道哪一個計數器出現了數值溢出,也沒有事件篩選功能。那么針對這些問題的解決方案是什么,哪些措施才能實現完整的Perf支持呢?來自西部數據的Atish Patra在近期的RISC-V峰會上提出了他以及開發社區所青睞的答案——SBI PMU擴展和sscofpmf ISA擴展。

SBI PMU擴展將作為一個接口,讓管理員模式下的軟件發現硬件計數器的細節,針對特定的perf事件來配置硬件計數器,在請求下開始或停止計數器。除此之外,SBI PMU擴展還引入了固件性能計數器來監控固件事件,比如未對齊的存取指令數、RFENCE和IPI數等等。如今在RISC-V的SBI 1.0版本中我們也可以看到,PMU擴展已經成了該規范的一部分。

接著是sscofpmf擴展,ss代表的是特權架構和管理員級的擴展,cofpmf代表的是溢出計數和特權模式篩選。該擴展新增了一個32位的scountovf只讀寄存器,該寄存器存儲的是29個mhpmcounter的第63位(OF),如此一來就能準確快速地判斷究竟是哪個事件的計數器溢出了。這一擴展已經凍結,目前處于審查狀態,預計不久的將來就會批準,來自Linux內核的支持工作也在推進中。

小結

RISC-V作為一個尚處于發展初期的架構,在某些方面確實還有不及其前輩x86和ARM的地方,我們這次從性能監控上就能看出一些端倪,但RISC-V自身的特性也為它帶來了不小的優勢。

首先,RISC-V是站在巨人的肩膀上發展的,它可以有效地規避以上那些架構走錯的老路。其次,開源開放讓RISC-V有了龐大的社區支持,像以上這些解決方案,其實已經被多次提及,來自社區的力量勢必可以讓RISC-V走得更遠。

審核編輯:何安淇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 監測
    +關注

    關注

    2

    文章

    3868

    瀏覽量

    45307
  • RISC-V
    +關注

    關注

    46

    文章

    2472

    瀏覽量

    48207

原文標題:優化的關鍵,RISC-V中的性能監控

文章出處:【微信號:elecfans,微信公眾號:電子發燒友網】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    了解信號完整性的基本原理

    作者:Cece Chen 投稿人:DigiKey 北美編輯 隨著支持人工智能 (AI) 的高性能數據中心的興起,信號完整性 (SI) 變得至關重要,這樣才能以更高的速度傳輸海量數據。為確保信號完整
    的頭像 發表于 05-25 11:54 ?77次閱讀
    了解信號<b class='flag-5'>完整</b>性的基本原理

    各種常用電路模塊設計原則:電源完整

    課題內容 v 電源完整性設計(文檔) v 疊層設計 v 電源平面 v 去耦電容 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內容有幫助可以關注、點贊、評論支持一下哦~)
    發表于 05-08 16:30

    電源完整性分析及其應用

    的 EMI 性能變差,并直接影響信號完整性。為了提高信號質量、產品的EMI性能,人們開始研究怎樣為信號提供一個穩定、完整的參考平面,并隨之提出了電源完整性的概念。 純分享貼,有需要可以直接下載附件獲取文檔! (如果內容有幫助
    發表于 04-23 15:39

    S32G399ardb3版本中缺少WIC文件IVT標頭,怎么解決?

    我目前正在為 S32G399ARDB3 機器構建 NXP Auto Yocto BSP 38_0。我通過在我的 Yocto 配置中包含以下內容來添加 WIC 卡支持: IMAGE_FSTYPES
    發表于 04-03 07:52

    如何使用離線工具od SPSDK生成完整圖像?

    SDSDK)會生成一個缺少前 4KB 的文件。 這些將由 flashloader 直接在目標上填充,使用將要傳達給它的參數,對吧? 我需要離線工作。我需要生成一個 “完整圖像”,但無法訪問目標。 我該怎么做?
    發表于 03-28 06:51

    聽懂什么是信號完整

    2024年12月20日14:00-16:00中星聯華科技將舉辦“高速信號完整性分析與測試”-“碼”上行動系列線上講堂線上講堂。本期會議我們將為大家介紹高速串行總線傳輸基本框架,什么是信號完整性?高速
    的頭像 發表于 12-15 23:33 ?557次閱讀
    聽懂什么是信號<b class='flag-5'>完整</b>性

    ADS8866按照TI的3線MODE時序讀數,讀出的數據少了3位,為什么?

    ADS8866按照TI的3線MODE時序讀數,讀出的數據少了3位,附件是波形圖
    發表于 11-28 07:39

    高速電路中的信號完整性和電源完整性研究

    高速電路中的信號完整性和電源完整性研究
    發表于 09-25 14:44 ?0次下載

    高速高密度PCB信號完整性與電源完整性研究

    高速高密度PCB信號完整性與電源完整性研究
    發表于 09-25 14:43 ?5次下載

    你對村田的貼片電容器有多少了解?

    你對村田的貼片電容器有多少了解?
    的頭像 發表于 08-26 17:57 ?932次閱讀
    你對村田的貼片電容器有多<b class='flag-5'>少了</b>解?

    官方,buildroot文件系統支持gstreamer嗎?

    的camera或video時,提示找不到服務 defaultServiceProvider::requestService(): no service found for ... 初始定位應該是缺少
    發表于 08-19 09:10

    信號完整性與電源完整性-電源完整性分析

    電子發燒友網站提供《信號完整性與電源完整性-電源完整性分析.pdf》資料免費下載
    發表于 08-12 14:31 ?75次下載

    RTOS SDK中缺少uart_div_modify的定義怎么解決?

    RTOS SDK 中缺少 uart_div_modify 的定義
    發表于 07-18 07:43

    lwip RTOS sdk版本中缺少IGMP怎么解決?

    lwip RTOS sdk 版本中缺少 IGMP
    發表于 07-18 07:14

    在Dify中使用PerfXCloud大模型推理服務

    近日,Dify全面接入了Perf XCloud,借助Perf XCloud提供的大模型調用服務,用戶可在Dify中構建出更加經濟、高效的LLM應用。
    的頭像 發表于 07-15 09:28 ?2358次閱讀
    在Dify中使用PerfXCloud大模型推理服務
    主站蜘蛛池模板: 一级看片免费视频囗交 | 老师下面很湿很爽很紧 | 日本高清加勒比 | 三级毛片免费看 | 日韩在线免费看网站 | 久久三级国产 | 9久久99久久久精品齐齐综合色圆 | 永久免费品色堂 | 能看的黄色网址 | 在线观看亚洲天堂 | 中国人69xxx大全 | 亚洲人成网站色7799在线播放 | 在线www| xxxxbbbb欧美| ccav在线永久免费看 | 国产色爽女| 波多野结衣福利 | 午夜福利123 | 在线视频综合网 | japan日韩xxxx69hd jdav视频在线观看 | 亚洲三级电影在线播放 | 人人干视频在线观看 | 亚洲一级视频在线观看 | 久久夜色精品国产噜噜小说 | 精品一区视频 | 国产精品成人观看视频国产奇米 | 8090yy理论三级在线观看 | 谁有毛片网站 | 国产网站黄 | www.av小视频| 一区二区三区网站在线免费线观看 | 黄色在线播放网站 | bt天堂新版中文在线地址 | 色婷婷视频在线观看 | 欧美大片一区二区 | 艹逼视频软件 | 亚洲人免费视频 | 人人澡人人草 | 欧美色一级 | 亚洲九九香蕉 | 真实一级一级一片免费视频 |