国产肉体XXXX裸体137大胆,国产成人久久精品流白浆,国产乱子伦视频在线观看,无码中文字幕免费一区二区三区 国产成人手机在线-午夜国产精品无套-swag国产精品-国产毛片久久国产

新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 采用硬件加速發(fā)揮MicroBlaze處理能力

采用硬件加速發(fā)揮MicroBlaze處理能力

作者:Karsten Trott博士 賽靈思(德國慕尼黑) 現(xiàn)場應用工程師 時間:2010-03-09 來源:電子產(chǎn)品世界 收藏

  為了加速這種基礎操作,只需要在快速單工鏈路(FSL)上連接一個非常簡單的內(nèi)核。標準FSL實施方案使用FSL總線(包括同步或異步FIFO)將數(shù)據(jù)從 內(nèi)核傳輸?shù)紽SL 器IP核。帶FIFO 的FSL總線與FIFO可對上述兩者間的數(shù)據(jù)存取進行去耦。

本文引用地址:http://m.ptau.cn/article/106702.htm

  如果采用帶FIFO的標準FSL總線,則一般情況下執(zhí)行時間為4個周期:一個周期用來將上的數(shù)據(jù)通過FSL寫入FIFO;一個周期用來將數(shù)據(jù)從FIFO 傳輸?shù)紽SL IP;一個周期用來把結(jié)果從FSL IP傳送回 FSL總線的FIFO中;最后一個周期則負責從FSL總線讀出結(jié)果并傳輸至 MicroBlaze。

  MicroBlaze到FSL總線的連接以及FSL總線到FSL IP的連接可在EDK的圖形視圖中輕松創(chuàng)建。

  這樣代碼要長得多,效率也有大幅度提升,但時間還是太長了,執(zhí)行2萬次操作現(xiàn)在仍然大概需要52ms。

  隨后客戶在互聯(lián)網(wǎng)上進行了一些調(diào)查,找到一種更好的算法,把代碼改編為:

unsigned x = value;
   unsigned r;
   x = (((x & 0xaaaaaaaa) >> 1) | ((x
& 0x55555555) << 1));
   x = (((x & 0xcccccccc) >> 2) | ((x
& 0x33333333) << 2));
 x = (((x & 0xf0f0f0f0) >> 4) | ((x
& 0x0f0f0f0f) << 4));
 x = (((x & 0xff00ff00) >> 8) | ((x
& 0x00ff00ff) << 8));
 r = ((x >> 16) | (x << 16));
 return r;

  這個代碼看起來效率高,短小精悍。而且它不需要會造成流水線中斷的分支。它在這個核心系統(tǒng)上運行只需29 個周期。

  不過這個算法需要在1 、2、4、8和16位之間進行移位操作。我們在MicroBlaze的屬性窗口中激活桶式移位器。不管移位操作的長度如何,采用桶式移位器可允許我們在一個周期內(nèi)完成移位指令。這樣可以讓純軟件算法在 MicroBlaze上運行得稍快一些。

  激活MicroBlaze硬件上的桶式移位器可將處理算法所需時間縮短到22個周期。與第一個版本的軟件算法相比,此算法得到了顯著改善。目前采用此算法,執(zhí)行所有 2萬次操作只需8.8ms,效率提升了10倍,不過仍未達到客戶要求。

  不過效率還有提升的空間。算法中的時延非常關鍵,應盡可能地縮短。但在我們的實施方案中,采用兩根FSL總線仍需要四個時鐘周期。不過我們可以通過將 MicroBlaze與器之間的現(xiàn)有連接方式改為直接連接,便可將時延減半,縮短至兩個時鐘周期。這樣一個周期用于將數(shù)據(jù)寫入 FSL器IP,而另一個周期則負責讀回結(jié)果。

  在采用直接連接方式時,需注意幾個問題。首先,協(xié)IP應存儲輸入,并以寄存方式提供結(jié)果。請注意在執(zhí)行此操作時沒有使用帶FIFO的FSL總線。

  此外,以不同時鐘速率運行 MicroBlaze和FSL硬件加速器IP 容易發(fā)生問題。為避免發(fā)生沖突,設計人員最好將MicroBlaze和 FSL硬件加速器IP的運行速率設為一致。

  不過,如何在不使用FSL總線的情況下將MicroBlaze和FSL硬件加速器IP直接連接起來呢?這很簡單,只需將MicroBlaze和硬件加速器的數(shù)據(jù)線連接起來即可。如果需要,可再添加握手信號。



評論


相關推薦

技術專區(qū)

關閉