在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

京微齊力HME-P2系列FPGA的pSRAM讀寫例程分析

HME京微齊力 ? 來源:老劉記事兒 ? 2025-05-16 14:19 ? 次閱讀

來源:老劉記事兒

最近有客戶反映國產FPGA京微齊力P2器件內部合封的pSRAM控制器讀寫效率很高,能達80%以上,而且合封了4片8bit位寬pSRAM芯片,按250MHz主頻DDR雙沿讀寫算下來80%效率能跑出12.8Gbps的極限帶寬,即使考慮工程布局布線的限制影響因素,按210MHz主頻也應能跑出10.5Gbps讀寫帶寬。

如果真是這樣,這意味著FPGA + SDRAM架構方案的市場應用生態位面臨著挑戰,因為即使采用200MHz主頻的單顆DDR SDRAM也需要32bit位寬才能在理論上達到100%效率時(不可能實現)的12.8Gbps極限帶寬,而SDRAM控制器設計復雜度導致的邏輯資源消耗、SDRAM芯片較高的功耗特性、外掛SDRAM芯片的成本考量等因素會使FPGA + SDRAM架構方案劣于京微齊力的FPGA內部合封4片pSRAM方案。

那么真實情況如何呢?客戶的傳言是確切的么?

帶著疑問,我要來了京微齊力P2器件的pSRAM讀寫例程,進行核實分析。

根據說明,該例程系統框圖如下:

a1e25bfc-21ba-11f0-9310-92fbcf53809c.png

其中,soc_system_v1模塊是指P2器件中自帶的ARM Cortex-M3硬核,在例程中起到對pSRAM的寄存器初始化和Clock Training作用。Clock Training是上電啟動階段指對psram_clk、psram_clk_90和psram_clk_rd這三個時鐘的相位關系進行初始化校準。這三個時鐘的功能可參閱原廠手冊說明(見下圖),在此我們不作更多推敲討論。

a202a416-21ba-11f0-9310-92fbcf53809c.png

不過顯然可以看出,將pSRAM初始化和Clock Training機制放進FPGA自帶的ARM硬核中,對于節省FPGA邏輯資源占用肯定是很有好處的,而且在ARM硬核中實現對pSRAM寄存器狀態和Training結果的打印監測也是十分方便的。原廠例程中就利用了這一點,下圖為例程中ARM硬核控制pSRAM執行初始化和Clock Training階段串口打印的部分信息,顯示了Clock Training的時鐘窗口掃描結果。

a217f014-21ba-11f0-9310-92fbcf53809c.png

例程提供的pSRAM控制器可允許對4片pSRAM予以分別不同的寄存器初始化配置,使其分別獨立工作在不同的工作狀態下。這為客戶提供了靈活操控的可能性,在必要的應用場合可以靈活搭配形成乒乓操作,譬如4片pSRAM可以配置成同時1寫3讀或3寫1讀,也可以4片統一同步操作讀寫。

例程配套有仿真工程,可以直接從仿真波形中得到pSRAM讀寫效率信息。

仿真例程先是對4片pSRAM分別作了初始化配置動作,而后循環進行Burst 1~128次*2Byte的交替讀寫循環測試。

a2293d88-21ba-11f0-9310-92fbcf53809c.png

每次Burst寫入pSRAM的數據會同步存入雙端口RAM中,再將RAM中的數據取出與從pSRAM中相應地址讀出的數據作一致性比對,如果讀寫比對無誤則psram_cmp_flag信號保持為0,否則一旦發生錯誤就會拉高相應pSRAM的psram_cmp_flag信號。

a243487c-21ba-11f0-9310-92fbcf53809c.png

對交替讀寫循環測試的波形放大可以看到,pSRAM的讀寫過程各有快慢兩種響應速度,姑且稱之為 “快寫”、“慢寫”、“快讀”、“慢讀”。

a269515c-21ba-11f0-9310-92fbcf53809c.png

pSRAM寫操作相關的FPGA端用戶接口信號時序抓取波形示例如下:

a285d656-21ba-11f0-9310-92fbcf53809c.png

pSRAM讀操作相關的FPGA端用戶接口信號時序抓取波形示例如下:

a29b8974-21ba-11f0-9310-92fbcf53809c.png

各路信號的含義和時序關系說明詳情可參見官方應用手冊,此處不作贅述。

a2b6e066-21ba-11f0-9310-92fbcf53809c.png

我們只關心讀寫效率的評估,那么把握重點:

psram_wr_reqin和psram_rd_reqin分別是寫請求和讀請求信號;

wr_req_ack和rd_req_ack分別是寫響應和讀響應信號,其中wr_req_ack的高電平比psram_wdata寫有效數據前移了一拍,而rd_req_ack的高電平與psram_rdata讀有效數據是時序對齊的;

讀寫Burst長度分別由rd_burst_len和wr_burst_len決定,實際Burst拍數分別為rd_burst_len+1 和wr_burst_len+1。

a2e7b83a-21ba-11f0-9310-92fbcf53809c.png

對照仿真波形可以確認,例程中的pSRAM讀寫循環是無縫切換的,沒有冗余間隔,因此psram_wr_reqin和psram_rd_reqin的高電平寬度分別就是寫等待和讀等待時長,即除有效讀/寫操作之外被“浪費”的時間。寫等待和讀等待時長所占用的時鐘周期數分別稱為寫等待拍數和讀等待拍數。

“快寫”、“慢寫”、“快讀”、“慢讀”分別的等待拍數見下表:

讀寫狀態 快寫 慢寫 快讀 慢讀
等待拍數 11 18 19 26

a2fdad70-21ba-11f0-9310-92fbcf53809c.png

“快寫”狀態下,從發起寫請求到第一個有效數據開始寫入,寫等待占用了11個時鐘周期。因此,當Burst為256字節(128拍)時寫效率最高,為:

128/(11+128) =92%

對應P2器件工作在210MHz主頻下的“快寫”帶寬為:

92%×210MHz×2×4片 ×8 bits =12.08 Gbps

a315bdd4-21ba-11f0-9310-92fbcf53809c.png

“慢寫”狀態下,從發起寫請求到第一個有效數據開始寫入,寫等待占用了18個時鐘周期。因此,當Burst為2字節(1拍)時寫效率最低,為:

1/(18+1) = 5.26%

當Burst為256字節(128拍)時,“慢寫”效率為:

128/(18+128) = 87.6%

對應P2器件工作在210MHz主頻下的“慢寫”帶寬為:

87.6%×210MHz×2×4片 ×8 bits

=11.5 Gbps

a32bce58-21ba-11f0-9310-92fbcf53809c.png

“快讀”狀態下,從發起讀請求到第一個有效數據開始讀入,讀等待占用了19個時鐘周期。因此,當Burst為256字節(128拍)時讀效率最高,為:

128/(19+128) =87%

對應P2器件工作在210MHz主頻下的“快讀”帶寬為:

87%×210MHz×2×4片 ×8 bits

=11.42 Gbps

a3451bba-21ba-11f0-9310-92fbcf53809c.png

“慢讀”狀態下,從發起讀請求到第一個有效數據開始讀入,讀等待占用了26個時鐘周期。因此,當Burst為2字節(1拍)時讀效率最低,為:

1/(26+1) = 3.7%

當Burst為256字節(128拍)時,“慢讀”效率為:

128/(26+128) = 83.1%

對應P2器件工作在210MHz主頻下的“慢讀”帶寬為:

83.1%×210MHz×2×4片 ×8 bits

=10.9 Gbps

這樣情況就明了了。也就是說:

京微齊力P2器件的pSRAM寫操作在Burst長度為256字節(128拍)的條件下效率最高,為87.6%至92%之間。

保守估計,按210MHz的大型項目(邏輯資源占用80%以上)真實可用主頻估算,在Burst長度為256字節(128拍)的條件下,其寫帶寬可達11.5 Gbps至12.08 Gbps之間。

京微齊力P2器件的pSRAM讀操作在Burst長度為256字節(128拍)的條件下效率最高,為83.1%至87%之間。

保守估計,按210MHz的大型項目(邏輯資源占用80%以上)真實可用主頻估算,在Burst長度為256字節(128拍)的條件下,其讀帶寬可達10.9 Gbps至11.42 Gbps之間。

當然,需要特別注意的是,由于存在內部自刷新過程,和SDRAM一樣,pSRAM在Burst長度較低時,讀寫效率不高。但Burst突發讀寫長度越長,其讀寫效率越高,速度優勢越明顯。

總體而言,京微齊力FPGA的pSRAM讀寫效率,超出預期!

附P2器件(合封4片pSRAM)在不同Burst長度下的讀寫效率列表以供查閱(注意1拍對應2字節):

a35cdc6e-21ba-11f0-9310-92fbcf53809c.png

a3860b52-21ba-11f0-9310-92fbcf53809c.png

a3a562f4-21ba-11f0-9310-92fbcf53809c.png

a3c79fea-21ba-11f0-9310-92fbcf53809c.png

附在P2器件(合封4片pSRAM)在pSRAM主頻210MHz條件下核算的不同Burst長度下的讀寫速率列表以供查閱(注意1拍對應2字節):

a3e2d486-21ba-11f0-9310-92fbcf53809c.png

a3ffc71c-21ba-11f0-9310-92fbcf53809c.png

a419bc1c-21ba-11f0-9310-92fbcf53809c.png

a43ac1e6-21ba-11f0-9310-92fbcf53809c.png

不過這里可以再引出一個問題:

快寫/慢寫(快讀/慢讀)的比例是多少,有何規律?

此處暫且不表,筆者搬磚之余時間有限,且聽下回分解。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1643

    文章

    21936

    瀏覽量

    613031
  • SDRAM
    +關注

    關注

    7

    文章

    441

    瀏覽量

    55963
  • 京微齊力
    +關注

    關注

    0

    文章

    29

    瀏覽量

    5874

原文標題:老劉記事兒京微齊力FPGA系列之P2器件內部合封pSRAM性能探究(一)

文章出處:【微信號:HME-FPGA,微信公眾號:HME京微齊力】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    齊力:國產FPGA老樹開新花,務實做好消費市場再沖高端

    的意愿強烈,松山湖論壇以市場需求出發,尋找市場中最需要的IC產品,實現“中國創芯”。 ? 齊力(北京)科技有限公司CEO王海力 ?
    的頭像 發表于 05-14 10:16 ?1.1w次閱讀

    國產FPGA簡介

    、智能汽車、電子設備、電力與電源管理、人工智能。 目標市場:金融、電信、政務、汽車、工業互聯、物聯網等領域。 齊力 核心技術:AiPGA芯片(AI in FPGA)、異構計算HPA
    發表于 11-20 16:20

    齊力HME-P1P60 FPGA榮獲年度最佳處理器/FPGA獎項

    2021年度中國IC設計成就獎頒獎典禮于3月18日在上海舉辦。齊力(北京)科技有限公司產品HME-P1P60 FPGA榮獲年度最佳處理器
    的頭像 發表于 03-23 09:33 ?2540次閱讀

    齊力再次榮獲“IC獨角獸”稱號

    2022年6月14日,由賽迪顧問股份有限公司、北京芯合匯科技有限公司聯合主辦的2021-2022(第五屆)中國IC獨角獸遴選活動歷時兩個月,經過層層遴選和綜合評估,齊力(北京)科技有限公司榮獲中國集成電路設計領域“IC獨角獸
    的頭像 發表于 06-15 10:51 ?1680次閱讀

    齊力推出大力神H系列新一代產品H3C08芯片

    2022年8月18日,中國·北京,國內自主研發高端通用FPGA芯片及新一代異構可編程計算芯片的供應商齊力宣布推出其大力神H系列新一代產品
    的頭像 發表于 08-19 10:13 ?3035次閱讀

    基于齊力HME-M7和國產舜銘存儲鐵電存儲器PB85RS2MC的PLC解決方案

    的指令,通過數字式或模擬式的輸入輸出來控制各種類型的機械設備或生產過程。 PLC的主機部分由中央處理器、輸入/輸出接口(I/0接口)通信、擴展接口、儲存器、設備接口和電源等部分構成。其中,基于齊力
    的頭像 發表于 04-19 09:47 ?1077次閱讀
    基于<b class='flag-5'>京</b><b class='flag-5'>微</b><b class='flag-5'>齊力</b><b class='flag-5'>HME</b>-M7和國產舜銘存儲鐵電存儲器PB85RS<b class='flag-5'>2</b>MC的PLC解決方案

    基于FPGA的PLC解決方案

    PLC的主機部分由中央處理器、輸入/輸出接口(I/0接口)通信、擴展接口、儲存器、設備接口和電源等部分構成。其中,基于齊力FPGA HME
    發表于 05-06 14:32 ?1706次閱讀
    基于<b class='flag-5'>FPGA</b>的PLC解決方案

    HME FPGA入門指導:HME-P(飛馬)系列開發板實驗教程——LED流水燈

    熟悉 HME FPGA PLL IP 的使用,實現 LED 流水燈功能。
    的頭像 發表于 05-30 10:04 ?2055次閱讀
    <b class='flag-5'>HME</b> <b class='flag-5'>FPGA</b>入門指導:<b class='flag-5'>HME-P</b>(飛馬)<b class='flag-5'>系列</b>開發板實驗教程——LED流水燈

    基于HME_P060的OLED字符顯示及FUXI工程建立演示

    FUXI軟件安裝可以通過齊力官網下載安裝包,并申請License。
    的頭像 發表于 06-19 10:21 ?1525次閱讀
    基于<b class='flag-5'>HME_P</b>060的OLED字符顯示及FUXI工程建立演示

    齊力采用Imagination AI加速器打造新型智能芯片

    齊力的新型加速芯片是將FPGA、CPU、AI等多種異構計算單元集成在同一個芯片上,采用了領域自適應與邏輯可重構的計算模式,具有“軟件可編程、硬件可重構”的特性。
    的頭像 發表于 07-12 09:56 ?1047次閱讀

    齊力異構FPGA產品幫助行業客戶實現應用創新和性能突破

    ? 2023 慕尼黑上海電子展齊力展位 據齊力產品經理王建海介紹,此次
    的頭像 發表于 07-20 17:24 ?1787次閱讀

    國芯思辰|齊力FPGA HME-HR02PN3Q32在會議音箱系統中的應用

    為了控制會議音箱的同步問題,最簡單的辦法就是采用FPGA芯片來控制多個音箱時鐘同步。在此提一下齊力的FPAGHME-HR02PN3Q32,因為是在室內應用,所以
    的頭像 發表于 07-22 09:48 ?1775次閱讀
    國芯思辰|<b class='flag-5'>京</b><b class='flag-5'>微</b><b class='flag-5'>齊力</b><b class='flag-5'>FPGA</b> <b class='flag-5'>HME</b>-HR02PN3Q32在會議音箱系統中的應用

    齊力助力國內半導體產業高質量發展貢獻核心力量

    11月10日-11日,中國集成電路設計業的高端盛會——2023 ICCAD以“灣區有你,芯向未來” 為主題在廣州保利世貿博覽館成功舉辦,齊力作為國產FPGA 芯片的中堅力量及代表企
    的頭像 發表于 11-13 09:38 ?1215次閱讀

    齊力亮相2024慕尼黑上海電子展

    7月8-10日,為期三天的2024慕尼黑上海電子展(electronica China)在浦東新國際博覽中心成功落下帷幕。齊力攜多個系列產品及豐富的解決方案亮相展會(展位號E4-4
    的頭像 發表于 07-12 10:39 ?1059次閱讀
    <b class='flag-5'>京</b><b class='flag-5'>微</b><b class='flag-5'>齊力</b>亮相2024慕尼黑上海電子展

    對外MBA師生走進科創企業齊力

    為提升MBA學生的科技素養,2024年11月29日下午國際商學院師生走進了成長型科創企業——齊力(北京)科技股份有限公司(以下簡稱
    的頭像 發表于 12-16 11:11 ?581次閱讀
    主站蜘蛛池模板: 国产一级特黄在线播放 | a天堂在线观看 | 911国产自产精选 | 成人影院免费观看 | 最刺激黄a大片免费观看 | 久久影院朴妮唛 | 亚洲欧美日韩在线精品2021 | 精品视频69v精品视频 | 色婷婷亚洲十月十月色天 | 成人欧美一区二区三区视频不卡 | 亚洲产国偷v产偷v自拍色戒 | 四虎影院新网址 | 久久久久久91精品色婷婷 | 午夜神马福利 | 快色视频免费 | 91老色批网站免费看 | 国产亚洲欧美一区 | 国产精品视频久久久 | 日本免费成人 | 国产精品一级毛片不收费 | 亚洲涩色| 色在线免费视频 | 久久9966精品国产免费 | 最近2018年中文字幕大全一 | 免看乌克兰a一级 | 99久久99 | 免费大片黄在线观看日本 | 婷婷丁香综合网 | 国产香港三级理论在线 | 一级特黄aaa大片大全 | 成人影院在线观看视频 | 亚洲欧洲一区二区三区在线 | 欧美三级中文字幕hd | 精品国产一区二区三区成人 | 一级毛片免费毛片一级毛片免费 | 国产一区中文字幕在线观看 | 1024手机看片你懂得的 日韩欧美 | 狠狠做深爱婷婷久久一区 | 欧美性一级交视频 | 操操操干干干 | 天天操天天摸天天爽 |