Linux操作系統(tǒng)之快速內(nèi)存操作技術(shù)
我們總希望能在內(nèi)核空間和用戶空間自由交換數(shù)據(jù),傳統(tǒng)的方式是采用內(nèi)核提供的vma機制,通過copy_to/from_user之類的方法來實現(xiàn)。這對于高速數(shù)據(jù)塊傳送是不可取的。 其實kswapd有時交換數(shù)據(jù)至外存時,性能相當(dāng)差,一般而言,你的PC主存并不見得就用盡了,而且很多應(yīng)用并是你所關(guān)心的,但卻實實在在消耗你的計算資源,此時,你可能會想到采用實地址操作你的應(yīng)用(盡管有MMU的支持),在uClinux中,當(dāng)沒有MMU時,工作起來是挺爽的。
本文引用地址:http://m.ptau.cn/article/201610/305315.htm最方便的,最高效的,無非是實地址下,操作物理內(nèi)存,相當(dāng)于DMA.盡管Linux 2.6內(nèi)核在VMA方面的性能要優(yōu)于2.4,但swap機制有一定的缺限。在VxWorks中,對內(nèi)存的管理是很細致且精確的。如果你在Linux下申請大塊內(nèi)存操作時,當(dāng)觸發(fā)kswap快速交換回主存時,你會發(fā)現(xiàn)你的計算機 哪一段時間,幾乎要休息幾分鐘,盡管你看起來free輸出的面已經(jīng)很多了,但此時的外存幾乎一直忙著,且CPU負(fù)荷相當(dāng)重,這時也可能你根本就沒做任何操作。
有沒有辦法既在VMA機制下工作,又能直接處理主存數(shù)據(jù)呢?
回答是肯定的。內(nèi)核啟動后,會將主存映射為/dev/mem,當(dāng)我們在VMA中申請一塊邏輯區(qū)間后,將轉(zhuǎn)換的物理地址傳與用戶空間,用戶空間就可以線性操作這段區(qū)間了,直接采用mmap就可以在物理主存中讀寫。
還有更快的方式嗎?不采用mmap行嗎?
當(dāng)然有,當(dāng)VMA將物理區(qū)塊地址及大小傳與用戶空間后,用戶完全可以采用地址讀寫模式,這幾近于機器指令操作了(可以獨立于OS之外)。 此種實現(xiàn)方式很簡單,首先打開/dev/mem,直接定位至VMA傳上來的地址就可以操作了,無需mmap.通知用戶空間,可以采用procfs/sysfs等。
強烈建議:在邊界控制上,一定要精確細致,不推薦初學(xué)者采用,一旦越界,可能引起“Kernel Panic”。 更有可能就DOWN了。 對于此實現(xiàn)方式,建議參考mapper(LDD3)程序。 同時,也可以用mapper檢查讀寫是否正確。
新的IA32中,PAGE_SIZE = 4K MAX_ORDER = 11 ,gfp最大申請4M線性邏輯空間,減去PAGE_OFFSET即可得到物理地址。 如果采用了HIMEM和NUMA,請參見Kernel關(guān)于內(nèi)存映射的算法。 當(dāng)主存達到1G或超過時,請減小用戶空間大小。
隨著硬件技術(shù)的發(fā)展,VMA在主存相當(dāng)大時,可以考慮進行修正,完全可以集中采用物理映射方式。沒必要交換了。否則,反而影響性能。 32位平臺,如果主存2G,采用SWAP會使得性能有較大下降。 而在大容量數(shù)據(jù)傳輸時,也不可能采用SWAP方式的,不允許換出。 建議Linus在VMA中加入進程分類,不平類別的應(yīng)用,分配不同的內(nèi)存塊。 小數(shù)據(jù)PAGE_SIZE = 4K/大數(shù)據(jù)4M/128M. 地址模式全轉(zhuǎn)換為64位,兼容32位,當(dāng)應(yīng)用于Embedded系統(tǒng)時,直接使用32位模式。
如將做成多個微系統(tǒng),不同微核,運行不同應(yīng)用(不同的進程管理,內(nèi)存管理,文件管理),只是接口可以統(tǒng)一,不同標(biāo)志而已。
評論