DMA是一種無(wú)需CPU的參與就可以讓外設(shè)和系統(tǒng)內(nèi)存之間進(jìn)行雙向數(shù)據(jù)傳輸?shù)挠布C(jī)制。使用DMA可以使系統(tǒng)CPU從實(shí)際的I/O數(shù)據(jù)傳輸過(guò)程中擺脫出來(lái),從而大大提高系統(tǒng)的吞吐率。DMA經(jīng)常與硬件體系結(jié)構(gòu)特別是外設(shè)的總線(xiàn)技術(shù)密切相關(guān)。
一、DMA控制器硬件結(jié)構(gòu)
DMA允許外圍設(shè)備和主內(nèi)存之間直接傳輸 I/O 數(shù)據(jù), DMA 依賴(lài)于系統(tǒng)。每一種體系結(jié)構(gòu)DMA傳輸不同,編程接口也不同。
數(shù)據(jù)傳輸可以以?xún)煞N方式觸發(fā):一種軟件請(qǐng)求數(shù)據(jù),另一種由硬件異步傳輸。
a --軟件請(qǐng)求數(shù)據(jù)
調(diào)用的步驟可以概括如下(以read為例):
(1)在進(jìn)程調(diào)用 read 時(shí),驅(qū)動(dòng)程序的方法分配一個(gè) DMA 緩沖區(qū),隨后指示硬件傳送它的數(shù)據(jù)。進(jìn)程進(jìn)入睡眠。(2)硬件將數(shù)據(jù)寫(xiě)入 DMA 緩沖區(qū)并在完成時(shí)產(chǎn)生一個(gè)中斷。
(3)中斷處理程序獲得輸入數(shù)據(jù),應(yīng)答中斷,最后喚醒進(jìn)程,該進(jìn)程現(xiàn)在可以讀取數(shù)據(jù)了。
b --由硬件異步傳輸
在 DMA 被異步使用時(shí)發(fā)生的。以數(shù)據(jù)采集設(shè)備為例:
(1)硬件發(fā)出中斷來(lái)通知新的數(shù)據(jù)已經(jīng)到達(dá)。(2)中斷處理程序分配一個(gè)DMA緩沖區(qū)。(3)外圍設(shè)備將數(shù)據(jù)寫(xiě)入緩沖區(qū),然后在完成時(shí)發(fā)出另一個(gè)中斷。(4)處理程序利用DMA分發(fā)新的數(shù)據(jù),喚醒任何相關(guān)進(jìn)程。
網(wǎng)卡傳輸也是如此,網(wǎng)卡有一個(gè)循環(huán)緩沖區(qū)(通常叫做 DMA 環(huán)形緩沖區(qū))建立在與處理器共享的內(nèi)存中。每一個(gè)輸入數(shù)據(jù)包被放置在環(huán)形緩沖區(qū)中下一個(gè)可用緩沖區(qū),并且發(fā)出中斷。然后驅(qū)動(dòng)程序?qū)⒕W(wǎng)絡(luò)數(shù)據(jù)包傳給內(nèi)核的其它部分處理,并在環(huán)形緩沖區(qū)中放置一個(gè)新的 DMA 緩沖區(qū)。
驅(qū)動(dòng)程序在初始化時(shí)分配DMA緩沖區(qū),并使用它們直到停止運(yùn)行。
二、DMA通道使用的地址
DMA通道用dma_chan結(jié)構(gòu)數(shù)組表示,這個(gè)結(jié)構(gòu)在kernel/dma.c中,列出如下:
如果dma_chan_busy[n].lock != 0表示忙,DMA0保留為DRAM更新用,DMA4用作級(jí)聯(lián)。DMA 緩沖區(qū)的主要問(wèn)題是,當(dāng)它大于一頁(yè)時(shí),它必須占據(jù)物理內(nèi)存中的連續(xù)頁(yè)。
由于DMA需要連續(xù)的內(nèi)存,因而在引導(dǎo)時(shí)分配內(nèi)存或者為緩沖區(qū)保留物理 RAM 的頂部。在引導(dǎo)時(shí)給內(nèi)核傳遞一個(gè)"mem="參數(shù)可以保留 RAM 的頂部。例如,如果系統(tǒng)有 32MB 內(nèi)存,參數(shù)"mem=31M"阻止內(nèi)核使用最頂部的一兆字節(jié)。稍后,模塊可以使用下面的代碼來(lái)訪(fǎng)問(wèn)這些保留的內(nèi)存:
dmabuf = ioremap( 0x1F00000 /* 31M */, 0x100000 /* 1M */);
分配 DMA 空間的方法,代碼調(diào)用kmalloc(GFP_ATOMIC)直到失敗為止,然后它等待內(nèi)核釋放若干頁(yè)面,接下來(lái)再一次進(jìn)行分配。最終會(huì)發(fā)現(xiàn)由連續(xù)頁(yè)面組成的DMA 緩沖區(qū)的出現(xiàn)。
一個(gè)使用 DMA 的設(shè)備驅(qū)動(dòng)程序通常會(huì)與連接到接口總線(xiàn)上的硬件通訊,這些硬件使用物理地址,而程序代碼使用虛擬地址。基于 DMA 的硬件使用總線(xiàn)地址而不是物理地址,有時(shí),接口總線(xiàn)是通過(guò)將 I/O 地址映射到不同物理地址的橋接電路連接的。甚至某些系統(tǒng)有一個(gè)頁(yè)面映射方案,能夠使任意頁(yè)面在外圍總線(xiàn)上表現(xiàn)為連續(xù)的。
當(dāng)驅(qū)動(dòng)程序需要向一個(gè) I/O 設(shè)備(例如擴(kuò)展板或者DMA控制器)發(fā)送地址信息時(shí),必須使用 virt_to_bus 轉(zhuǎn)換,在接受到來(lái)自連接到總線(xiàn)上硬件的地址信息時(shí),必須使用 bus_to_virt 了。
三、DMA操作函數(shù)
寫(xiě)一個(gè)DMA驅(qū)動(dòng)的主要工作包括:DMA通道申請(qǐng)、DMA中斷申請(qǐng)、控制寄存器設(shè)置、掛入DMA等待隊(duì)列、清除DMA中斷、釋放DMA通道
因?yàn)?DMA 控制器是一個(gè)系統(tǒng)級(jí)的資源,所以?xún)?nèi)核協(xié)助處理這一資源。內(nèi)核使用DMA 注冊(cè)表為 DMA 通道提供了請(qǐng)求/釋放機(jī)制,并且提供了一組函數(shù)在 DMA 控制器中配置通道信息。
以下具體分析關(guān)鍵函數(shù)(linux/arch/arm/mach-s3c2410/dma.c)
四、DMA映射
一個(gè)DMA映射就是分配一個(gè) DMA 緩沖區(qū)并為該緩沖區(qū)生成一個(gè)能夠被設(shè)備訪(fǎng)問(wèn)的地址的組合操作。一般情況下,簡(jiǎn)單地調(diào)用函數(shù)virt_to_bus 就設(shè)備總線(xiàn)上的地址,但有些硬件映射寄存器也被設(shè)置在總線(xiàn)硬件中。映射寄存器(mapping register)是一個(gè)類(lèi)似于外圍設(shè)備的虛擬內(nèi)存等價(jià)物。在使用這些寄存器的系統(tǒng)上,外圍設(shè)備有一個(gè)相對(duì)較小的、專(zhuān)用的地址區(qū)段,可以在此區(qū)段執(zhí)行 DMA。通過(guò)映射寄存器,這些地址被重映射到系統(tǒng) RAM。映射寄存器具有一些好的特性,包括使分散的頁(yè)面在設(shè)備地址空間看起來(lái)是連續(xù)的。但不是所有的體系結(jié)構(gòu)都有映射寄存器,特別地,PC 平臺(tái)沒(méi)有映射寄存器。
在某些情況下,為設(shè)備設(shè)置有用的地址也意味著需要構(gòu)造一個(gè)反彈(bounce)緩沖區(qū)。例如,當(dāng)驅(qū)動(dòng)程序試圖在一個(gè)不能被外圍設(shè)備訪(fǎng)問(wèn)的地址(一個(gè)高端內(nèi)存地址)上執(zhí)行 DMA 時(shí),反彈緩沖區(qū)被創(chuàng)建。然后,按照需要,數(shù)據(jù)被復(fù)制到反彈緩沖區(qū),或者從反彈緩沖區(qū)復(fù)制。
根據(jù) DMA 緩沖區(qū)期望保留的時(shí)間長(zhǎng)短,PCI 代碼區(qū)分兩種類(lèi)型的 DMA 映射:
a -- 一致 DMA 映射
它們存在于驅(qū)動(dòng)程序的生命周期內(nèi)。一個(gè)被一致映射的緩沖區(qū)必須同時(shí)可被 CPU 和外圍設(shè)備訪(fǎng)問(wèn),這個(gè)緩沖區(qū)被處理器寫(xiě)時(shí),可立即被設(shè)備讀取而沒(méi)有cache效應(yīng),反之亦然,使用函數(shù)pci_alloc_consistent建立一致映射。
b -- 流式 DMA映射
流式DMA映射是為單個(gè)操作進(jìn)行的設(shè)置。它映射處理器虛擬空間的一塊地址,以致它能被設(shè)備訪(fǎng)問(wèn)。應(yīng)盡可能使用流式映射,而不是一致映射。這是因?yàn)樵谥С忠恢掠成涞南到y(tǒng)上,每個(gè) DMA 映射會(huì)使用總線(xiàn)上一個(gè)或多個(gè)映射寄存器。具有較長(zhǎng)生命周期的一致映射,會(huì)獨(dú)占這些寄存器很長(zhǎng)時(shí)間――即使它們沒(méi)有被使用。使用函數(shù)dma_map_single建立流式映射。
1、建立一致 DMA 映射
函數(shù)pci_alloc_consistent處理緩沖區(qū)的分配和映射,函數(shù)分析如下(在include/asm-generic/pci-dma-compat.h中):
結(jié)構(gòu)dma_coherent_mem定義了DMA一致性映射的內(nèi)存的地址、大小和標(biāo)識(shí)等。結(jié)構(gòu)dma_coherent_mem列出如下(在arch/i386/kernel/pci-dma.c中):
函數(shù)dma_alloc_coherent分配size字節(jié)的區(qū)域的一致內(nèi)存,得到的dma_handle是指向分配的區(qū)域的地址指針,這個(gè)地址作為區(qū)域的物理基地址。dma_handle是與總線(xiàn)一樣的位寬的無(wú)符號(hào)整數(shù)。 函數(shù)dma_alloc_coherent分析如下(在arch/i386/kernel/pci-dma.c中):
當(dāng)不再需要緩沖區(qū)時(shí)(通常在模塊卸載時(shí)),應(yīng)該調(diào)用函數(shù) pci_free_consitent 將它返還給系統(tǒng)。
2、建立流式 DMA 映射
在流式 DMA 映射的操作中,緩沖區(qū)傳送方向應(yīng)匹配于映射時(shí)給定的方向值。緩沖區(qū)被映射后,它就屬于設(shè)備而不再屬于處理器了。在緩沖區(qū)調(diào)用函數(shù)pci_unmap_single撤銷(xiāo)映射之前,驅(qū)動(dòng)程序不應(yīng)該觸及其內(nèi)容。
在緩沖區(qū)為 DMA 映射時(shí),內(nèi)核必須確保緩沖區(qū)中所有的數(shù)據(jù)已經(jīng)被實(shí)際寫(xiě)到內(nèi)存。可能有些數(shù)據(jù)還會(huì)保留在處理器的高速緩沖存儲(chǔ)器中,因此必須顯式刷新。在刷新之后,由處理器寫(xiě)入緩沖區(qū)的數(shù)據(jù)對(duì)設(shè)備來(lái)說(shuō)也許是不可見(jiàn)的。
如果欲映射的緩沖區(qū)位于設(shè)備不能訪(fǎng)問(wèn)的內(nèi)存區(qū)段時(shí),某些體系結(jié)構(gòu)僅僅會(huì)操作失敗,而其它的體系結(jié)構(gòu)會(huì)創(chuàng)建一個(gè)反彈緩沖區(qū)。反彈緩沖區(qū)是被設(shè)備訪(fǎng)問(wèn)的獨(dú)立內(nèi)存區(qū)域,反彈緩沖區(qū)復(fù)制原始緩沖區(qū)的內(nèi)容。
函數(shù)pci_map_single映射單個(gè)用于傳送的緩沖區(qū),返回值是可以傳遞給設(shè)備的總線(xiàn)地址,如果出錯(cuò)的話(huà)就為 NULL。一旦傳送完成,應(yīng)該使用函數(shù)pci_unmap_single 刪除映射。其中,參數(shù)direction為傳輸?shù)姆较颍≈等缦拢?/p>
PCI_DMA_TODEVICE 數(shù)據(jù)被發(fā)送到設(shè)備。PCI_DMA_FROMDEVICE如果數(shù)據(jù)將發(fā)送到 CPU。PCI_DMA_BIDIRECTIONAL數(shù)據(jù)進(jìn)行兩個(gè)方向的移動(dòng)。PCI_DMA_NONE 這個(gè)符號(hào)只是為幫助調(diào)試而提供。
函數(shù)pci_map_single分析如下(在arch/i386/kernel/pci-dma.c中)
函數(shù)dma_map_single映射一塊處理器虛擬內(nèi)存,這塊虛擬內(nèi)存能被設(shè)備訪(fǎng)問(wèn),返回內(nèi)存的物理地址,函數(shù)dma_map_single分析如下(在include/asm-i386/dma-mapping.h中):
3、分散/集中映射
分散/集中映射是流式 DMA 映射的一個(gè)特例。它將幾個(gè)緩沖區(qū)集中到一起進(jìn)行一次映射,并在一個(gè) DMA 操作中傳送所有數(shù)據(jù)。這些分散的緩沖區(qū)由分散表結(jié)構(gòu)scatterlist來(lái)描述,多個(gè)分散的緩沖區(qū)的分散表結(jié)構(gòu)組成緩沖區(qū)的struct scatterlist數(shù)組。
分散表結(jié)構(gòu)列出如下(在include/asm-i386/scatterlist.h):
每一個(gè)緩沖區(qū)的地址和長(zhǎng)度會(huì)被存儲(chǔ)在 struct scatterlist 項(xiàng)中,但在不同的體系結(jié)構(gòu)中它們?cè)诮Y(jié)構(gòu)中的位置是不同的。下面的兩個(gè)宏定義來(lái)解決平臺(tái)移植性問(wèn)題,這些宏定義應(yīng)該在一個(gè)pci_map_sg被調(diào)用后使用:
函數(shù)pci_map_sg完成分散/集中映射,其返回值是要傳送的 DMA 緩沖區(qū)數(shù);它可能會(huì)小于 nents(也就是傳入的分散表項(xiàng)的數(shù)量),因?yàn)榭赡苡械木彌_區(qū)地址上是相鄰的。一旦傳輸完成,分散/集中映射通過(guò)調(diào)用函數(shù)pci_unmap_sg 來(lái)撤銷(xiāo)映射。 函數(shù)pci_map_sg分析如下(在include/asm-generic/pci-dma-compat.h中):
五、DMA池
許多驅(qū)動(dòng)程序需要又多又小的一致映射內(nèi)存區(qū)域給DMA描述子或I/O緩存buffer,這使用DMA池比用dma_alloc_coherent分配的一頁(yè)或多頁(yè)內(nèi)存區(qū)域好,DMA池用函數(shù)dma_pool_create創(chuàng)建,用函數(shù)dma_pool_alloc從DMA池中分配一塊一致內(nèi)存,用函數(shù)dmp_pool_free放內(nèi)存回到DMA池中,使用函數(shù)dma_pool_destory釋放DMA池的資源。
結(jié)構(gòu)dma_pool是DMA池描述結(jié)構(gòu),列出如下:
函數(shù)dma_pool_create給DMA創(chuàng)建一個(gè)一致內(nèi)存塊池,其參數(shù)name是DMA池的名字,用于診斷用,參數(shù)dev是將做DMA的設(shè)備,參數(shù)size是DMA池里的塊的大小,參數(shù)align是塊的對(duì)齊要求,是2的冪,參數(shù)allocation返回沒(méi)有跨越邊界的塊數(shù)(或0)。
函數(shù)dma_pool_create返回創(chuàng)建的帶有要求字符串的DMA池,若創(chuàng)建失敗返回null。對(duì)被給的DMA池,函數(shù)dma_pool_alloc被用來(lái)分配內(nèi)存,這些內(nèi)存都是一致DMA映射,可被設(shè)備訪(fǎng)問(wèn),且沒(méi)有使用緩存刷新機(jī)制,因?yàn)閷?duì)齊原因,分配的塊的實(shí)際尺寸比請(qǐng)求的大。如果分配非0的內(nèi)存,從函數(shù)dma_pool_alloc返回的對(duì)象將不跨越size邊界(如不跨越4K字節(jié)邊界)。這對(duì)在個(gè)體的DMA傳輸上有地址限制的設(shè)備來(lái)說(shuō)是有利的。
函數(shù)dma_pool_create分析如下(在drivers/base/dmapool.c中):
函數(shù)dma_pool_alloc從DMA池中分配一塊一致內(nèi)存,其參數(shù)pool是將產(chǎn)生塊的DMA池,參數(shù)mem_flags是GFP_*位掩碼,參數(shù)handle是指向塊的DMA地址,函數(shù)dma_pool_alloc返回當(dāng)前沒(méi)用的塊的內(nèi)核虛擬地址,并通過(guò)handle給出它的DMA地址,如果內(nèi)存塊不能被分配,返回null。
函數(shù)dma_pool_alloc包裹了dma_alloc_coherent頁(yè)分配器,這樣小塊更容易被總線(xiàn)的主控制器使用。這可能共享slab分配器的內(nèi)容。
函數(shù)dma_pool_alloc分析如下(在drivers/base/dmapool.c中):
六、一個(gè)簡(jiǎn)單的使用DMA 例子
示例:下面是一個(gè)簡(jiǎn)單的使用DMA進(jìn)行傳輸?shù)尿?qū)動(dòng)程序,它是一個(gè)假想的設(shè)備,只列出DMA相關(guān)的部分來(lái)說(shuō)明驅(qū)動(dòng)程序中如何使用DMA的。
函數(shù)dad_transfer是設(shè)置DMA對(duì)內(nèi)存buffer的傳輸操作函數(shù),它使用流式映射將buffer的虛擬地址轉(zhuǎn)換到物理地址,設(shè)置好DMA控制器,然后開(kāi)始傳輸數(shù)據(jù)。
函數(shù)dad_interrupt是中斷處理函數(shù),當(dāng)DMA傳輸完時(shí),調(diào)用這個(gè)中斷函數(shù)來(lái)取消buffer上的DMA映射,從而讓內(nèi)核程序可以訪(fǎng)問(wèn)這個(gè)buffer。
函數(shù)dad_open打開(kāi)設(shè)備,此時(shí)應(yīng)申請(qǐng)中斷號(hào)及DMA通道
在與open 相對(duì)應(yīng)的 close 函數(shù)中應(yīng)該釋放DMA及中斷號(hào)。
函數(shù)dad_dma_prepare初始化DMA控制器,設(shè)置DMA控制器的寄存器的值,為 DMA 傳輸作準(zhǔn)備。
函數(shù)dad_dma_isdone用來(lái)檢查 DMA 傳輸是否成功結(jié)束。
-
控制器
+關(guān)注
關(guān)注
113文章
16816瀏覽量
182103 -
寄存器
+關(guān)注
關(guān)注
31文章
5397瀏覽量
122627 -
dma
+關(guān)注
關(guān)注
3文章
569瀏覽量
101964
原文標(biāo)題:關(guān)于嵌入式Linux下的DMA技術(shù),你需要知道的都在這里了
文章出處:【微信號(hào):gh_c472c2199c88,微信公眾號(hào):嵌入式微處理器】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
ZYNQ開(kāi)發(fā)案例之DMA控制器系統(tǒng)設(shè)計(jì)
DMA與DMA控制器

基于DMA控制器的UART串行通信設(shè)計(jì)

LED顯示系統(tǒng)DMA控制器的設(shè)計(jì)

實(shí)時(shí)圖像處理系統(tǒng)的DMA控制器設(shè)計(jì)

Crossbar的多通道DMA控制器設(shè)計(jì)

dma控制器芯片8257資料介紹

dma控制器由什么組成

基于SystemC的可配置多通道DMA控制器的設(shè)計(jì)

dma控制器的組成
MCU學(xué)習(xí)筆記_DMA原理

基于STM32F407的DMA解析-ADC單通道DMA讀取數(shù)據(jù)

stm32中的DMA你搞懂了嗎!!!

STM32的DMA的五大問(wèn)題

Xilinx高性能PCIe DMA控制器IP,8個(gè)DMA通道

評(píng)論