基于ARM的嵌入式系統(tǒng)程序開發(fā)要點(五)
上述過程中的一個特點是:func1()還是使用通常的BL指令來進(jìn)行子程序調(diào)用,而 func2()返回時則直接使用“BX LR”,沒有對LR進(jìn)行判斷和最低位的設(shè)置。這是因為當(dāng)執(zhí)行BL指令對LR進(jìn)行保存時,其最低位會被自動設(shè)置,以滿足返回時狀態(tài)切換的需要,可直接使用 “BX LR”。
在上面的例子中,為了讓編譯器在編譯函數(shù)func2()時使用BX而不是BL進(jìn)行返回,必須告訴編譯器要按照滿足交互工作要求的方式進(jìn)行編譯。在ARM的編譯器選項設(shè)置中,應(yīng)選擇“-apcs /interwork”。這樣,函數(shù)的返回指令會被正確設(shè)置,并且當(dāng)鏈接器進(jìn)行目標(biāo)代碼的鏈接時,能夠在需要的地方插入正確的鏈接代碼實現(xiàn)狀態(tài)切換。
當(dāng)然,插入了鏈接代碼會相應(yīng)地增加代碼長度,通常一段veneer包含3條指令,即12B字節(jié)長度??梢杂?ldquo;-info veneers”選項使鏈接器輸出所有veneers的位置和長度信息。
4交互程序之間的兼容性
因為在指定交互選項后,編譯及鏈接后的輸出代碼跟在無交互情況下不同,所以當(dāng)多個源文件如果使用了不同的設(shè)置進(jìn)行編譯,相互之間的調(diào)用可能產(chǎn)生兼容性問題。圖5說明了這些關(guān)系。

在一個使用交互工作的項目工程管理中,對此要加以仔細(xì)考慮。
5V5架構(gòu)的擴(kuò)展
ARM在V5版本的架構(gòu)中,對ARM/Thumb的交互增加了新的支持。針對前面第3節(jié)中提到的函數(shù)調(diào)用和返回問題,V5版本中專門對指令做了擴(kuò)展。
①增加了新指令BLX,解決了原來BX和BL指令各自的欠缺。使交互的函數(shù)調(diào)用可以由一條指令實現(xiàn),省去了跳轉(zhuǎn)代碼的開銷。
②擴(kuò)展了以PC為目標(biāo)地址的數(shù)據(jù)傳輸指令功能。PC加載值的最低位將被自動送到狀態(tài)寄存器CPSR的T狀態(tài)位。也就是說,通過給PC賦值的方法也能實現(xiàn)狀態(tài)的切換,這樣就使習(xí)慣的函數(shù)返回方法——從堆棧中恢復(fù)寄存器,也能實現(xiàn)交互調(diào)用函數(shù)的正確返回了。
所以,V5架構(gòu)以后的代碼,不再需要額外的鏈接代碼,縮小了代碼長度,提高了狀態(tài)切換時的執(zhí)行效率。當(dāng)然,在V5及以后的架構(gòu)中,繼續(xù)保持了對以前代碼的良好兼容性。
6Thumb-2
ARM和Thumb因為其各自的優(yōu)勢,都得到了極為廣泛的應(yīng)用。在一個應(yīng)用程序中,用戶要根據(jù)系統(tǒng)的具體情況靈活分配,使用不同的編譯器,把不同的代碼編譯成ARM或Thumb,以希望得到最優(yōu)的代碼長度和性能平衡。這樣做能夠達(dá)到系統(tǒng)優(yōu)化的目的,但是也給設(shè)計人員帶來了額外的交互處理工作。最近,ARM公司公布了一項新的發(fā)明——Thumb-2指令集,該指令集同時包含32位和16位指令,在代碼長度和性能之間作了最佳的平衡。這樣,以后用戶就可以用一個統(tǒng)一的Thumb-2編譯器來解決現(xiàn)在面臨的很多問題了。
如圖6所示,是Thumb-2指令集跟ARM和Thumb之間的比較。

引證文獻(xiàn)
1. 楊志強(qiáng)嵌入式系統(tǒng)設(shè)計與發(fā)展 [期刊論文] -青海師范大學(xué)學(xué)報(自然科學(xué)版)2005(03)
2. 劉志勇 基于ARM的無線視頻傳輸硬件系統(tǒng)的初步研究與開發(fā) [學(xué)位論文] 碩士2005
3. 李晶 基于 LINUX的無線局域網(wǎng)芯片驅(qū)動程序的設(shè)計與開發(fā) [學(xué)位論文] 碩士2005
評論