Ack/Nak是一種由硬件實現的,完全自動的機制,目的是保證TLP有效可靠地傳輸。Ack DLLP用于確認TLP被成功接收,Nak DLLP則用于表明TLP傳輸中遇到了錯誤。
如上圖所示,發送方會對每一個TLP在Replay Buffer中做備份,直到其接收到來自接收方的Ack DLLP,確認該DLP已經成功的被接受,才會刪除這個備份。如果接收方發現TLP存在錯誤,則會向發送發發送Nak DLLP,然后發送方會從Replay Buffer中取出數據,重新發送該TLP。
Ack/Nak機制內部的詳細結構圖如下圖所示:
下面對圖中的各個Elements分別做一個簡單地介紹。
首先是發送端的Elements:
來個大圖特寫:
NEXT_TRANSMIT_SEQ Counter
NEXT_TRANSMIT_SEQ Counter,即NTS計數器,是一個12位的計數器。當數據鏈路層處于DL-Down狀態或者復位時,該計數器會被初始化為0。該計數器只會執行加一操作,也就是說當其到達最大值4095時,在進行加一操作則會變成0(Roll Over)。該計數器用于產生下一個待發送的TLP的序列號(Sequence Number)。每一個序列號都是與一個TLP所唯一對應的,可以說這個序列號正是整個Ack/Nak機制的關鍵。
LCRC Generator
LCRC產生器用于產生一個32位的CRC值,其作用于整個TLP和其對應的序列號。
Replay Buffer
Replay Buffer是Mindshare書中的叫法,在PCIe Spec中,這個Buffer的名稱叫做Retry Buffer。Replay Buffer中按照傳輸順序,存儲了整個TLP、序列號和LCRC,如下圖所示:
當發送端收到來自接收端的Ack DLLP時,會將Buffer中相應的TLP(包括對應的序列號和LCRC)移除;如果接收到的是Nak DLLP,則會將Buffer中響應的TLP(包括對應的序列號和LCRC)重新發送給接收端。
REPLAY_TIMER Count
REPLAY_TIMER是一種看門狗定時器,當該定時器溢出,則表明發送端已經發送了一個或者多個TLP,但是并未收到來自接收端的應答信號(Ack/Nak)。此時,發送端會將Replay Buffer中的TLP重新發送,并將看門狗定時器重啟。
只要發送端發送了任何TLP,該定時器便會啟動,在接收到來自接收端的應答信號之前都會持續地運行。當收到應答信號之后,定時器會立即被清零。此時如果Replay Buffer仍然有TLP(表明還有TLP被發送,但是仍未得到應答),定時器又會被立即被重新啟動。如果Buffer中是空的,則定時器不會被重新啟動,直到新的TLP被發送。
REPLAY_NUM Count
這是一個2位的計數器,用于記錄同一個TLP發送失敗的次數,當其值從11b變為00b時(溢出了,表示嘗試發送某個TLP失敗了4次),數據鏈路層會自動地強制物理層重新進行鏈路訓練(即LTSSM進入Recovery狀態)。當完成鏈路訓練之后,便會重新發送之前發送失敗的TLP。
當發送端接收到來自接收端的Nak DLLP或者發送端的看門狗定時器(REPLAY_TIMER)溢出時,該計數器都會被加一;當接收到Ack DLLP時,該計數器則會被清零。
ACKD_SEQ
ACKD_SEQ寄存器用于存儲最近接收到的Ack或者Nak DLLP中的序列號。當復位或者數據鏈路層處于無效狀態時,該寄存器會被初始化為全1。關于ACKD_SEQ寄存器的具體用法會在后續的文章中,用例子的形式詳細說明。
DLLP CRC Check
接收端在接收到來自發送端的DLLP后,首先會檢查其DLLP CRC,如果發現有錯誤,則會直接將其丟棄,認為其實無效的DLLP。
然后是接收端的Elements:
首先來一張大圖特寫:
LCRC Error Check
顧名思義,LCRC Error Check用于檢查接收到的TLP是否存在錯誤。如果存在錯誤,則將對應的TLP直接丟棄,然后產生一個Nak DLLP發送給發送端,讓其重新發送該TLP。
NEXT_RCV_SEQ
NEXT_RCV_SEQ是一個12位的計數器,即Next Receive Sequence Number,其值為已經成功接收的TLP的序列號加1。主要用于檢查當前接收到的TLP是不是應該接收到的TLP。
如果NEXT_RCV_SEQ和當前接收到的TLP中的序列號的值相等,則認為這是一個有效的TLP,但是接收端并不會立即向發送端發送Ack DLLP,而是等到AckNak_LATENCY_TIMER溢出時才向發送端發送Ack DLLP。也就是說,一個Ack DLLP可能會對應多個TLP,接收端不會每成功接收到一個TLP便向發送端發送Ack DLLP。
如果當前接收到的TLP中的序列號小于NEXT_RCV_SEQ(且差值不超過2048),則認為該TLP之前已經成功發送過了,此次是重復發送。需要注意的是,PCIe Spec認為重復發送并不是一個錯誤,只是直接將該TLP丟棄,并沒有Nak或者Error Reporting,但是會返回一個包含有上一次成功接收的TLP的序列號(NRS-1)的Ack DLLP給發送端。
如果當前接收到的TLP的序列號大于NEXT_RCV_SEQ,表明傳輸過程中漏掉了一些TLP。此時,接收端會返回Nak DLLP,并直接丟棄該TLP。
一個簡單的例子如下圖所示:
NAK_SCHEDULED Flag
NAK_SCHEDULED是一個標志位,當接收端產生Nak DLLP時,該標志位會被置位。當接收端成功接收到有效的TLP時,該標志位會被清零。需要特別注意的是,當該標志位處于置位狀態時,接收端不應產生其他的Nak DLLP。
AckNak_LATENCY_TIMER
AckNak_LATENCY_TIMER定時器會在接收端成功接收到有效的TLP,且并未向發送端返回Ack DLLP之前運行。當AckNak_LATENCY_TIMER定時器溢出時,接收端會立即向發送端返回Ack DLLP(攜帶的序列號為NRS-1,即一個Ack對應多個有效的TLP)。無論接收端返回Ack還是Nak,該定時器都會被復位,但是只有當接收端再次收到有效的TLP時,該定時器才會被重新啟動。
該定時器(REPLAY_TIMER)的值是由PCIe Spec規定的和Lane的數量與Max_Payload有關,Gen1的值如下圖所示:
Gen2(5GT/s)如下圖所示:
注:該定時器(REPLAY_TIMER)的值是AckNak_LATENCY_TIMER定時器值的三倍。
Ack/Nak Generator
顯然,Ack/Nak Generator的功能是產生Ack或者Nak DLLP。其格式如下:
最后,介紹一下PCIe Spec中推薦的包優先級順序。我們知道,PCIe總線通信中,存在多種類型的包,包括TLP、DLLP和Ordered Sets等。為了能夠是總線達到最優的傳輸效率,PCIe Spec推薦對這些包的優先級做如下的設置:(當然這只是推薦,并沒有強制廠商一定要這要去實現)。
-
ACK
+關注
關注
0文章
28瀏覽量
11178 -
PCIe
+關注
關注
15文章
1260瀏覽量
83193 -
NAK
+關注
關注
0文章
4瀏覽量
3741
原文標題:【博文連載】PCIe掃盲——Ack/Nak 機制詳解(一)
文章出處:【微信號:ChinaAET,微信公眾號:電子技術應用ChinaAET】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論