基于 QDR-IV SRAM 實現(xiàn)網(wǎng)絡(luò)流量管理統(tǒng)計計數(shù)器 IP設(shè)計方案解析
2017-11-12 |
rar |
0.5 MB |
次下載 |
1積分
資料介紹
網(wǎng)絡(luò)路由器帶有用于性能監(jiān)控、流量管理、網(wǎng)絡(luò)追蹤和網(wǎng)絡(luò)安全的統(tǒng)計計數(shù)器。計數(shù)器用來記錄數(shù)據(jù)包到達和離開的次數(shù)以及特定事件的次數(shù),比如當網(wǎng)絡(luò)出現(xiàn)壞包時。數(shù)據(jù)包的到達會使多個不同的統(tǒng)計計數(shù)器發(fā)生更新;但一臺網(wǎng)絡(luò)設(shè)備中的統(tǒng)計計數(shù)器的數(shù)量及其更新速度常常受到存儲技術(shù)的限制。
管理統(tǒng)計計數(shù)器需要高性能的存儲器才能滿足多重的讀—修改—寫操作。本文將描述一種使用IP方法的獨特統(tǒng)計計數(shù)器,這種計數(shù)器的一端可以連接網(wǎng)絡(luò)處理器(NPU),另一端可以連接Xilinx公司的QDR-IV存儲控制器。QDR-IV統(tǒng)計計數(shù)器IP是一種帶有QDR-IV SRAM、為網(wǎng)絡(luò)交流管理和其他計數(shù)器應用提供高效統(tǒng)計計數(shù)器的軟IP。
QDR-IV SRAM概述
QDR-IV SRAM配備兩個雙向數(shù)據(jù)端口A和B,可以在一個時鐘周期內(nèi)完成兩次數(shù)據(jù)寫入或兩次數(shù)據(jù)讀取操作,或一次讀寫結(jié)合的操作。因此,這一特點帶來了額外的靈活性,架構(gòu)師可將之用于讀/寫并不一定平衡的應用中。每個端口在兩個時鐘沿均可進行數(shù)據(jù)傳輸(DDR(雙倍數(shù)據(jù)速率)操作),工作模式為突發(fā)式,每個時鐘周期的突發(fā)長度為兩個字(每個字為X18或X36)。地址總線為通用型,其上升沿和下降沿能分別為端口A和端口B提供地址。部分制造商的QDR-IV SRAM還可支持嵌入式ECC(錯誤檢查和糾正),可從根本上消除軟錯誤,提高存儲器陳列的可靠性。
QDR-IV SRAM分為兩種:高性能 (HP) QDR-IV和超高性能 (XP) QDR-IV。HP設(shè)備的最大運行頻率為667 MHz,而XP設(shè)備的最大運行頻率為1066 MHz。QDR-IV XP能夠通過將存儲空間分成分成8個內(nèi)存條來增加性能,用地址的3個最低有效位(LSB)表示。要求的存儲方案是在同一周期內(nèi)存取不同的內(nèi)存條。從一個周期到另一周期,所有的內(nèi)存條均可存取,系統(tǒng)設(shè)計師可通過規(guī)劃系統(tǒng)架構(gòu)來相應地分配記憶庫地址,以充分發(fā)揮極速存儲器的RTR性能。這樣,開發(fā)人員可以在降低總系統(tǒng)成本的同時大幅提高性能。
統(tǒng)計計數(shù)器IP
QDR IV統(tǒng)計計數(shù)器是一種帶有QDR-IV SRAM,并且為網(wǎng)絡(luò)交流管理和其他計數(shù)器應用提供統(tǒng)計計數(shù)器的軟IP。該IP采用支持系統(tǒng)管理存取端口的讀—修改—寫邏輯。該IP的一端可以連接網(wǎng)絡(luò)處理單元(NPU),另一端可以連接 QDR-IV存儲控制器。由于該統(tǒng)計計數(shù)器支持400Gbps及更快速率的線卡,因此性能僅受限于所使用的FPGA和QDR-IV設(shè)備。
統(tǒng)計計數(shù)器IP的運行
圖1是使用QDR-IV和統(tǒng)計計數(shù)器IP的用例。典型的網(wǎng)絡(luò)處理單元(NPU)以800M的每秒配對物更新速率發(fā)送統(tǒng)計(STATS)更新請求。每一項STATS請求包含在一個72位字中帶有兩個計數(shù)器(數(shù)據(jù)包和字節(jié)計數(shù))的入口/出口包命令令牌。整個計數(shù)器緩存數(shù)據(jù)以1秒為間隔,更新到系統(tǒng)存儲器中的終身計數(shù)器(通常為DRAM)。這一來自NPU的回讀被稱為處理器(PROCS)更新請求。PCIe接口用于傳輸計數(shù)器緩存數(shù)據(jù)以更新終身計數(shù)器。下圖顯示了STATS IP的設(shè)置和與Xilinx存儲控制器、PCIe總線和NPU連接的QDR-IV存儲器。

圖1:帶統(tǒng)計IP、NPU和存儲器的完整基礎(chǔ)架構(gòu)
統(tǒng)計IP適用于HP和XP QDR-IV存儲器。其運行模式通過位于IP設(shè)計頂層接口的單一參數(shù)控制。兩個計數(shù)器(數(shù)據(jù)包和字節(jié))的每個流地址為單72位字。一個144Mb QDR-IV SRAM支持四百萬計數(shù)器。該設(shè)計所要求的IP接口數(shù)量與所使用的QDR-IV SRAM的數(shù)量相當。
正如模塊圖所示,NPU通過4x25Gbps鏈路將統(tǒng)計和處理請求推送到IP中。IP的運行頻率為存儲器存取頻率的四分之一,并且使用四條被稱為“通道”的平行數(shù)據(jù)路徑以匹配存儲器帶寬。在存儲接口HP和XP運行模式中,端口A作為讀取端口,端口B作為寫入端口。每項統(tǒng)計請求對保存在與該請求相關(guān)的獨特存儲位置中的計數(shù)器數(shù)據(jù)進行讀—修改—寫操作。
讀寫請求通過分階段來延遲與QDR-IV存儲器讀取延遲以及存儲控制器延遲的匹配。分階段設(shè)計也作為本地緩存累積延遲過程中的服務(wù)更新請求。在HP模式中,沒有統(tǒng)計/處理器更新地址限制通過四根通道中的任何一根。地址的發(fā)生可能是隨機的,并且無需給每根通道分配特定類型的地址。但由于在XP模式中存儲器的區(qū)塊結(jié)構(gòu)和限制與其相關(guān),因此通道0和1被分配到保存入口流數(shù)據(jù)的奇數(shù)地址位置,通道2和3被分配到保存出口流數(shù)據(jù)的偶數(shù)地址位置。這一獨特的安排可以預防可能在XP模式中發(fā)生的分塊限制位置。
處理器發(fā)出的一秒鐘回讀請求常見于這兩種運行模式。整個存儲位置需要以一秒鐘間隔回讀,因此處理器不發(fā)出連續(xù)請求,并且以一秒鐘間隔時間分布。該活動在每次通過處理器請求讀取后復位存儲器位置。
統(tǒng)計IP架構(gòu)
圖2中的STATS_IP架構(gòu)模塊圖標出了三個子部件:每條通道的同地址比較管道(SACOMP)區(qū)塊、請求-復用-解復用(REQ_MXDMX_CHn)區(qū)塊以及每條QDR IV應用通道1個的4個A-B通道配對計數(shù)器邏輯(ABCH_CTRL_CHn)區(qū)塊實例。

圖2:統(tǒng)計IP架構(gòu)
SACOMP模塊圖包含兩個管道階段,其中一個用于通過比較將同一時鐘周期上的所有四條通道進行壓縮(SACOMP_ChN-to-All),另一個用于對單一通道上的同一地址進行雙向(突發(fā)2)比較(SACOMP_B2BChN)。當兩條或更多條通道在指定的時間實例中為同一地址時,優(yōu)先性最高的通道積累地址相同的通道上出現(xiàn)的數(shù)據(jù),而所有其他優(yōu)先性較低、地址相同的通道都將失效。這確保了單一統(tǒng)計請求覆蓋所有地址相同的通道,從而預防出現(xiàn)任何數(shù)據(jù)一致性問題。比較和積累算法對所有可能的情況進行快速評估。此外,在單根通道上,如果有同一存儲位置的雙向統(tǒng)計更新請求,則最新請求失效,其數(shù)據(jù)通過之前發(fā)生的請求積累。這樣能夠確保任何同一地址位置的雙向存取不會在QDR-IV存儲設(shè)備定義的讀取延遲中發(fā)生。
圖2所示的請求-復用– 解復用(RQMXDMXChn)區(qū)塊接收對應通道數(shù)的處理器更新請求和統(tǒng)計更新請求。由于處理器更新請求的間隔時間固定,因此RQMXDMXchN選擇對應下一個時鐘服務(wù)的處理器請求,并且通過“請求就緒”回壓信號停止統(tǒng)計請求。在開始處理每個一秒更新請求后,RQMXDMXchN停止配置時鐘數(shù)(默認為10)的處理器請求通道以確保不會提供連續(xù)的一秒更新請求服務(wù)。停止信號發(fā)送至NPU,確保在回壓信號失效前不會產(chǎn)生新的請求。該機制能夠在不堵塞這一設(shè)計的情況下處理統(tǒng)計和處理器請求。
管理統(tǒng)計計數(shù)器需要高性能的存儲器才能滿足多重的讀—修改—寫操作。本文將描述一種使用IP方法的獨特統(tǒng)計計數(shù)器,這種計數(shù)器的一端可以連接網(wǎng)絡(luò)處理器(NPU),另一端可以連接Xilinx公司的QDR-IV存儲控制器。QDR-IV統(tǒng)計計數(shù)器IP是一種帶有QDR-IV SRAM、為網(wǎng)絡(luò)交流管理和其他計數(shù)器應用提供高效統(tǒng)計計數(shù)器的軟IP。
QDR-IV SRAM概述
QDR-IV SRAM配備兩個雙向數(shù)據(jù)端口A和B,可以在一個時鐘周期內(nèi)完成兩次數(shù)據(jù)寫入或兩次數(shù)據(jù)讀取操作,或一次讀寫結(jié)合的操作。因此,這一特點帶來了額外的靈活性,架構(gòu)師可將之用于讀/寫并不一定平衡的應用中。每個端口在兩個時鐘沿均可進行數(shù)據(jù)傳輸(DDR(雙倍數(shù)據(jù)速率)操作),工作模式為突發(fā)式,每個時鐘周期的突發(fā)長度為兩個字(每個字為X18或X36)。地址總線為通用型,其上升沿和下降沿能分別為端口A和端口B提供地址。部分制造商的QDR-IV SRAM還可支持嵌入式ECC(錯誤檢查和糾正),可從根本上消除軟錯誤,提高存儲器陳列的可靠性。
QDR-IV SRAM分為兩種:高性能 (HP) QDR-IV和超高性能 (XP) QDR-IV。HP設(shè)備的最大運行頻率為667 MHz,而XP設(shè)備的最大運行頻率為1066 MHz。QDR-IV XP能夠通過將存儲空間分成分成8個內(nèi)存條來增加性能,用地址的3個最低有效位(LSB)表示。要求的存儲方案是在同一周期內(nèi)存取不同的內(nèi)存條。從一個周期到另一周期,所有的內(nèi)存條均可存取,系統(tǒng)設(shè)計師可通過規(guī)劃系統(tǒng)架構(gòu)來相應地分配記憶庫地址,以充分發(fā)揮極速存儲器的RTR性能。這樣,開發(fā)人員可以在降低總系統(tǒng)成本的同時大幅提高性能。
統(tǒng)計計數(shù)器IP
QDR IV統(tǒng)計計數(shù)器是一種帶有QDR-IV SRAM,并且為網(wǎng)絡(luò)交流管理和其他計數(shù)器應用提供統(tǒng)計計數(shù)器的軟IP。該IP采用支持系統(tǒng)管理存取端口的讀—修改—寫邏輯。該IP的一端可以連接網(wǎng)絡(luò)處理單元(NPU),另一端可以連接 QDR-IV存儲控制器。由于該統(tǒng)計計數(shù)器支持400Gbps及更快速率的線卡,因此性能僅受限于所使用的FPGA和QDR-IV設(shè)備。
統(tǒng)計計數(shù)器IP的運行
圖1是使用QDR-IV和統(tǒng)計計數(shù)器IP的用例。典型的網(wǎng)絡(luò)處理單元(NPU)以800M的每秒配對物更新速率發(fā)送統(tǒng)計(STATS)更新請求。每一項STATS請求包含在一個72位字中帶有兩個計數(shù)器(數(shù)據(jù)包和字節(jié)計數(shù))的入口/出口包命令令牌。整個計數(shù)器緩存數(shù)據(jù)以1秒為間隔,更新到系統(tǒng)存儲器中的終身計數(shù)器(通常為DRAM)。這一來自NPU的回讀被稱為處理器(PROCS)更新請求。PCIe接口用于傳輸計數(shù)器緩存數(shù)據(jù)以更新終身計數(shù)器。下圖顯示了STATS IP的設(shè)置和與Xilinx存儲控制器、PCIe總線和NPU連接的QDR-IV存儲器。

圖1:帶統(tǒng)計IP、NPU和存儲器的完整基礎(chǔ)架構(gòu)
統(tǒng)計IP適用于HP和XP QDR-IV存儲器。其運行模式通過位于IP設(shè)計頂層接口的單一參數(shù)控制。兩個計數(shù)器(數(shù)據(jù)包和字節(jié))的每個流地址為單72位字。一個144Mb QDR-IV SRAM支持四百萬計數(shù)器。該設(shè)計所要求的IP接口數(shù)量與所使用的QDR-IV SRAM的數(shù)量相當。
正如模塊圖所示,NPU通過4x25Gbps鏈路將統(tǒng)計和處理請求推送到IP中。IP的運行頻率為存儲器存取頻率的四分之一,并且使用四條被稱為“通道”的平行數(shù)據(jù)路徑以匹配存儲器帶寬。在存儲接口HP和XP運行模式中,端口A作為讀取端口,端口B作為寫入端口。每項統(tǒng)計請求對保存在與該請求相關(guān)的獨特存儲位置中的計數(shù)器數(shù)據(jù)進行讀—修改—寫操作。
讀寫請求通過分階段來延遲與QDR-IV存儲器讀取延遲以及存儲控制器延遲的匹配。分階段設(shè)計也作為本地緩存累積延遲過程中的服務(wù)更新請求。在HP模式中,沒有統(tǒng)計/處理器更新地址限制通過四根通道中的任何一根。地址的發(fā)生可能是隨機的,并且無需給每根通道分配特定類型的地址。但由于在XP模式中存儲器的區(qū)塊結(jié)構(gòu)和限制與其相關(guān),因此通道0和1被分配到保存入口流數(shù)據(jù)的奇數(shù)地址位置,通道2和3被分配到保存出口流數(shù)據(jù)的偶數(shù)地址位置。這一獨特的安排可以預防可能在XP模式中發(fā)生的分塊限制位置。
處理器發(fā)出的一秒鐘回讀請求常見于這兩種運行模式。整個存儲位置需要以一秒鐘間隔回讀,因此處理器不發(fā)出連續(xù)請求,并且以一秒鐘間隔時間分布。該活動在每次通過處理器請求讀取后復位存儲器位置。
統(tǒng)計IP架構(gòu)
圖2中的STATS_IP架構(gòu)模塊圖標出了三個子部件:每條通道的同地址比較管道(SACOMP)區(qū)塊、請求-復用-解復用(REQ_MXDMX_CHn)區(qū)塊以及每條QDR IV應用通道1個的4個A-B通道配對計數(shù)器邏輯(ABCH_CTRL_CHn)區(qū)塊實例。

圖2:統(tǒng)計IP架構(gòu)
SACOMP模塊圖包含兩個管道階段,其中一個用于通過比較將同一時鐘周期上的所有四條通道進行壓縮(SACOMP_ChN-to-All),另一個用于對單一通道上的同一地址進行雙向(突發(fā)2)比較(SACOMP_B2BChN)。當兩條或更多條通道在指定的時間實例中為同一地址時,優(yōu)先性最高的通道積累地址相同的通道上出現(xiàn)的數(shù)據(jù),而所有其他優(yōu)先性較低、地址相同的通道都將失效。這確保了單一統(tǒng)計請求覆蓋所有地址相同的通道,從而預防出現(xiàn)任何數(shù)據(jù)一致性問題。比較和積累算法對所有可能的情況進行快速評估。此外,在單根通道上,如果有同一存儲位置的雙向統(tǒng)計更新請求,則最新請求失效,其數(shù)據(jù)通過之前發(fā)生的請求積累。這樣能夠確保任何同一地址位置的雙向存取不會在QDR-IV存儲設(shè)備定義的讀取延遲中發(fā)生。
圖2所示的請求-復用– 解復用(RQMXDMXChn)區(qū)塊接收對應通道數(shù)的處理器更新請求和統(tǒng)計更新請求。由于處理器更新請求的間隔時間固定,因此RQMXDMXchN選擇對應下一個時鐘服務(wù)的處理器請求,并且通過“請求就緒”回壓信號停止統(tǒng)計請求。在開始處理每個一秒更新請求后,RQMXDMXchN停止配置時鐘數(shù)(默認為10)的處理器請求通道以確保不會提供連續(xù)的一秒更新請求服務(wù)。停止信號發(fā)送至NPU,確保在回壓信號失效前不會產(chǎn)生新的請求。該機制能夠在不堵塞這一設(shè)計的情況下處理統(tǒng)計和處理器請求。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 基于聚類分析和SVM的無線網(wǎng)絡(luò)流量預測模型 13次下載
- 最大熵網(wǎng)絡(luò)流量預測和控制器預部署PPME模型 18次下載
- IP網(wǎng)絡(luò)流量矩陣估計方法 0次下載
- 基于QDR-IV SRAM實現(xiàn)高性能網(wǎng)絡(luò)系統(tǒng)設(shè)計解析 0次下載
- 使用QDR-IV設(shè)計高性能網(wǎng)絡(luò)系統(tǒng) 1次下載
- 一種使用IP方法的獨特統(tǒng)計計數(shù)器 10次下載
- 用于DDR、QDR和QDR-IV SRAM的超薄型三路輸出μmodule穩(wěn)壓器 7次下載
- 園區(qū)網(wǎng)絡(luò)流量管理與優(yōu)化_李振剛 0次下載
- 集成計數(shù)器實現(xiàn)N進制計數(shù) 0次下載
- 多功能計數(shù)器設(shè)計方案
- 基于FPGA的網(wǎng)絡(luò)流量計設(shè)計與實現(xiàn)
- 基于FPGA的網(wǎng)絡(luò)流量計設(shè)計與實現(xiàn)
- 網(wǎng)絡(luò)流量監(jiān)測和管理平臺的設(shè)計與實現(xiàn)
- 網(wǎng)絡(luò)流量測量的研究與實現(xiàn)
- 分布式網(wǎng)絡(luò)流量監(jiān)測
- 同步計數(shù)器和異步計數(shù)器的區(qū)別 4660次閱讀
- 計數(shù)器怎么用 計數(shù)器的作用有哪些 5655次閱讀
- LTM4632為三個電源軌提供完整的高性能穩(wěn)壓器解決方案 1318次閱讀
- 利用IP流量發(fā)生器實現(xiàn)IPTV測試儀的設(shè)計方案 2612次閱讀
- 完整QDR-IV設(shè)計高性能網(wǎng)絡(luò)系統(tǒng)詳解 6681次閱讀
- 任意進制計數(shù)器設(shè)計方案匯總(七款模擬電路設(shè)計原理詳解) 7.5w次閱讀
- 7進制計數(shù)器設(shè)計方案匯總(三種模擬電路設(shè)計過程詳細) 6w次閱讀
- 6進制計數(shù)器設(shè)計方案匯總(三款模擬電路原理圖分享) 7.7w次閱讀
- 5進制計數(shù)器設(shè)計方案匯總(三款計數(shù)器的電路原理圖) 6.9w次閱讀
- 16進制計數(shù)器設(shè)計方案匯總(四種電路設(shè)計原理圖及仿真程序分享) 7.8w次閱讀
- 20進制計數(shù)器設(shè)計方案匯總(三款仿真電路設(shè)計原理詳細) 1.3w次閱讀
- 八進制計數(shù)器設(shè)計方案匯總(四款模擬電路原理實現(xiàn)過程) 9.9w次閱讀
- 2進制計數(shù)器設(shè)計方案匯總(五款模擬電路設(shè)計原理及過程詳解) 2.3w次閱讀
- 10進制計數(shù)器設(shè)計方案匯總(六款電路設(shè)計原理及程序分享) 8w次閱讀
- Linux高速網(wǎng)絡(luò)流量的監(jiān)控、計算方法詳解 5408次閱讀
下載排行
本周
- 1第十一屆 藍橋杯 單片機設(shè)計與開發(fā)項目 省賽 程序設(shè)計試題及源碼
- 90.88KB | 23次下載 | 3 積分
- 2TM16737 LED驅(qū)動控制專用電路中文手冊
- 1.24 MB | 4次下載 | 1 積分
- 3PT2031電容式觸摸控制ASIC中文手冊
- 0.56 MB | 2次下載 | 免費
- 4UTC ULN2003 7CH達林頓下沉式驅(qū)動器規(guī)格書
- 0.40 MB | 1次下載 | 1 積分
- 5IGBT驅(qū)動設(shè)計資料
- 7.80 MB | 1次下載 | 5 積分
- 6國民技術(shù)_N32G435系列數(shù)據(jù)手冊
- 3.27 MB | 1次下載 | 免費
- 7女工程師跟你分享和嵌入式的不解之緣(可下載)
- 524.21 KB | 1次下載 | 免費
- 8電工學習資料大全
- 0.00 MB | 1次下載 | 免費
本月
- 1STM32CubeMX用于STM32配置和初始化C代碼生成
- 21.90 MB | 638次下載 | 免費
- 2STM32開發(fā)板教程之STM32開發(fā)指南免費下載
- 24.88 MB | 177次下載 | 3 積分
- 3EN60335-1安規(guī)標準 中文版本
- 1.86 MB | 53次下載 | 1 積分
- 4DeepSeek從入門到精通
- 5.07 MB | 25次下載 | 免費
- 5第十一屆 藍橋杯 單片機設(shè)計與開發(fā)項目 省賽 程序設(shè)計試題及源碼
- 90.88KB | 23次下載 | 3 積分
- 6NR-E531TX-XN冰箱說明書
- 8.64 MB | 19次下載 | 免費
- 7STM32單片機無人機設(shè)計
- 8.81 MB | 8次下載 | 免費
- 8華為硬件工程師手冊目前最全版本
- 1.02 MB | 8次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935126次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420063次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191377次下載 | 10 積分
- 5十天學會AVR單片機與C語言視頻教程 下載
- 158M | 183336次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81583次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73814次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論