基于FPGA的高速數(shù)據(jù)傳輸研究

作者：王紅兵強景周珍龍時間：2016-08-29 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

編者按：大數(shù)據(jù)發(fā)展如火如荼，解決串行數(shù)據(jù)高速傳輸已成當(dāng)務(wù)之急。本文正是以此為出發(fā)點，介紹了Xilinx FPGA內(nèi)嵌的高速串行收發(fā)器RocketIO。測試結(jié)果表明，RocketIO收發(fā)器的傳輸速度最高可達6.6Gbps，可以完全勝任各種高速數(shù)據(jù)的傳輸與處理。

摘要：大數(shù)據(jù)發(fā)展如火如荼，解決串行數(shù)據(jù)高速傳輸已成當(dāng)務(wù)之急。本文正是以此為出發(fā)點，介紹了Xilinx FPGA內(nèi)嵌的高速串行收發(fā)器RocketIO。測試結(jié)果表明，RocketIO收發(fā)器的傳輸速度最高可達6.6Gbps，可以完全勝任各種高速數(shù)據(jù)的傳輸與處理。

本文引用地址：http://m.ptau.cn/article/201608/296187.htm

引言

　　近年來，電子行業(yè)的發(fā)展走進了黃金時期，優(yōu)勢明顯的串行傳輸無論在速度上還是信號完整性上都得到了飛速發(fā)展。無論高速AD采樣后的數(shù)據(jù)接收，還是高速實時數(shù)據(jù)的傳輸與處理，都離不開高速串行總線。尤其對大型的采集系統(tǒng)，往往需要在單位時間里采集到成百上千個高精度的實時數(shù)據(jù)，這就要求在進行串行傳輸時速率達到百兆，甚至千兆每秒的級別。而Xilinx FPGA所提出的RocketIO 正是一種完全可以滿足當(dāng)前需求的解決方案。

　　本文主要介紹了RocketIO GTX的原理，并在此基礎(chǔ)上提出設(shè)計中需要注意的設(shè)計要點，最后進行了板間高速數(shù)據(jù)傳輸?shù)臏y試，給出了實時數(shù)據(jù)的采樣波形圖。

1 RocketIO GTX收發(fā)器介紹

　　RocketIO GTX是Xilinx公司FPGA內(nèi)嵌的一種可配置的高速串行數(shù)據(jù)收發(fā)器，其傳輸速度在600Mbps～6.6Gbps^[4]。該公司Virtex-5與Virtex-6系列FPGA都內(nèi)嵌了RocketIO GTX，且其結(jié)構(gòu)和工作原理也基本相同^[1]，本文將以Virtex-6 系列FPGA內(nèi)嵌的GTX為重點進行介紹。

1.1 RocketIO GTX主要特點

　　● 每個通道收發(fā)器支持從600Mbps～6.6Gbps的全雙工傳輸速率;

　　● 收發(fā)器內(nèi)嵌發(fā)送時鐘生成電路和接收時鐘恢復(fù)電路;

　　● 差分輸出端5級可配置電壓(110mV～1130mV);

　　● 發(fā)送端支持可編程預(yù)加重/去加重，和判定反饋均衡(DFE);

　　● 支持可編程差分輸出電壓擺幅(110mv～1130mv)和可編程預(yù)加重;

　　● 收發(fā)器支持直接和交流耦合方式，可兼容多種高速接口標(biāo)準(zhǔn);

　　● 片內(nèi)集成可編程差分終端電阻;

　　● 支持片內(nèi)多種環(huán)回測試模式;

　　● PCS集成多種可選編碼功能，如comma字符對齊、8B/10B編碼、時鐘修正和通道綁定^[2]。

1.2 RockerIO GTX內(nèi)部結(jié)構(gòu)

　　RocketIO GTX收發(fā)器由兩部分組成：PCS(Physical Coding Sublayer)和PMA(Physical Media Attachment，物理媒介層)，如圖1所示。

　　其中 PMA部分主要包括串行和解串器、發(fā)送和接收驅(qū)動器、時鐘產(chǎn)生和恢復(fù)單元;PCS 部分主要包括 8B/10B 編解碼、通道綁定、時鐘修正和 CRC校驗?zāi)K。

基于FPGA-1.jpg

　　● 8B/10B 編解碼

　　8B/10B編碼機制是進行高速串行傳輸時普遍采用的編碼方式，其實現(xiàn)原理是將8位字符根據(jù)對應(yīng)碼表轉(zhuǎn)化為10位字符，這種轉(zhuǎn)換保證了通道的直流平衡性，有利于交直流耦合，提高信道傳輸質(zhì)量。

　　● 通道綁定

　　通道綁定(Channel Bonding)，一種通過一定協(xié)議將多個串行通道綁定達到并行傳輸，目的在于實現(xiàn)對數(shù)據(jù)吞吐率增大的技術(shù)。綁定原理是，在所有并列的串行通道中，定義一個主通道，其它均為從通道，主通道發(fā)送同步使能信號來與其它從通道進行對齊，從而解決各個通道數(shù)據(jù)同步問題，實現(xiàn)串行通道的并行綁定。

　　● 串行器和解串器

　　在發(fā)送端，收發(fā)器把輸入GTX的參考時鐘作20倍頻，作為發(fā)送線路的參考時鐘，然后將經(jīng)過編碼的并行數(shù)據(jù)轉(zhuǎn)化為串行數(shù)據(jù)，從串行差分端發(fā)送出去;在接收端，時鐘恢復(fù)電路從比特流中提取出時鐘相位和頻率，恢復(fù)出接收時鐘，將串行數(shù)據(jù)解碼并轉(zhuǎn)化為并行數(shù)據(jù)，送入用戶接口以進行其他操作。

　　● 時鐘修正

　　時鐘修正(Clock Correction)目的在于發(fā)送端與接收端的時鐘匹配，在收發(fā)器的TX端，對要發(fā)送的串行數(shù)據(jù)中插入特定的修正序列，RX端通過這些修正序列提供的信息對時鐘進行修正。

基于FPGA-2.jpg

2 RocketIO GTX設(shè)計要點

　　要使RocketIO模塊以最佳性能工作，實際設(shè)計中需要考慮到諸多設(shè)計因素，本節(jié)將對設(shè)計中經(jīng)常遇到的問題進行討論。

2.1 參考時鐘

　　高速串行數(shù)據(jù)的傳輸中，為了實現(xiàn)高速，對時鐘的要求當(dāng)然就更為苛刻，這就要求用來驅(qū)動收發(fā)器的時鐘必須具備高性能、低抖動的特點。一般來講，GTX收發(fā)器提供了3種參考時鐘的驅(qū)動方式：

　?、購耐獠縂TX專用時鐘端口輸入來驅(qū)動時鐘路由;

　?、趶南噜廞uard的專用時鐘路由獲取;

　　③從FPGA內(nèi)部獲取。

　　每個Quad中都擁有兩個專用差分時鐘輸入MGTREFCLK0[P/N]和MGTREFCLK1[P/N]，它們是時鐘源的接口，為整個GTX的時鐘提供保障。在設(shè)計中，當(dāng)選用這種方式的時鐘供應(yīng)時，需要對原語IBUFDS_GTXE1進行例化。需將原語IBUFDS_GTXE1的輸出做為GTXE1的端口MGTREFCLKTX^[0]和MGTREFCLKRX^[0]的輸入。需要注意的是，即使在設(shè)計中未使用TX PLL，MGTREFCLKTX^[0]仍然需要被連接^[5]。單個外部參考時鐘用法如圖2所示。

　　前兩種參考時鐘的驅(qū)動方式都是使用GTX所集成的專用時鐘路由，在精度上能得到很好的保障。第三種由內(nèi)部全局時鐘網(wǎng)絡(luò)提供，會引入更大的抖動，而且驅(qū)動能力也有限，因此要盡量避免使用。

基于FPGA-3.jpg

2.2 用戶時鐘

　　GTX的接收端和發(fā)送端都有兩個用戶時鐘，這里以發(fā)送端為例進行介紹。這兩個時鐘分別為：TXUSRCLK和TXUSRCLK2。其中TXUSRCLK2是發(fā)送端TX的用戶時鐘，允許用戶直接使用，由GTX的內(nèi)部時鐘TXOUTCLK驅(qū)動。用戶將并行數(shù)據(jù)傳輸?shù)桨l(fā)送接口，在用戶時鐘上升沿被采樣并送入發(fā)送緩沖，經(jīng)過編碼以及串行化之后發(fā)送出去。TXUSRCLK是PCS內(nèi)部邏輯時鐘，不允許用戶直接使用，其大小取決于如下公式^[3]：

　　由于在設(shè)計中通常會選擇8B/10B編碼，因此16bit并行數(shù)據(jù)經(jīng)過編碼后變?yōu)?0bit。這里需要注意的是，需要設(shè)置屬性GEN_TXUSRCLK=TRUE。此時，TXUSRCLK端口必須拉低，邏輯時鐘TXUSRCLK由GTX內(nèi)部提供，并且用戶時鐘TXUSRCLK2大小與TXUSRCLK相同^[4]。當(dāng)設(shè)計中線速率選為3Gbps，可知用戶時鐘TXUSRCLK應(yīng)為150MHz。時鐘結(jié)構(gòu)如圖3所示。

　　GTX的接收端RX與TX基本相似，也包括兩個用戶時鐘分別為：RXUSRCLK和RXUSRCLK2。其中，RXUSRCLK2是GTX接收端的用戶時鐘，由恢復(fù)時鐘RXRECCLK驅(qū)動。RXUSRCLK的驅(qū)動方式和屬性設(shè)置與發(fā)送端一致^[5]。

2.3 Comma 檢測對齊

　　Comma檢測對齊模塊是高速數(shù)據(jù)傳輸中必不可少的重要模塊，高速數(shù)據(jù)的識別對齊是傳輸中的核心問題。在RX接收模塊中，串行數(shù)據(jù)轉(zhuǎn)換為并行前，必須經(jīng)過邊界字符對齊才能對所傳輸?shù)臄?shù)據(jù)進行識別，才能有后續(xù)的并行數(shù)據(jù)。在實現(xiàn)高速串行信號發(fā)送時，TX端會先發(fā)送comma字符，然后再發(fā)送數(shù)據(jù)。對應(yīng)的RX接收端通過comma探測，當(dāng)檢測到comma字符后，需要進行對齊，然后接收數(shù)據(jù)^[6]。

　　GTX收發(fā)器的comma模塊在實際解碼應(yīng)用中通常選K28.1、K28.5和K28.7為comma字符，具體根據(jù)項目需求來選擇。設(shè)計中，為了確保數(shù)據(jù)的對齊，通常會選擇發(fā)送2000個左右的同步字符。在TX端發(fā)送K字符時，賦值TXCHARISK=2’b01,TXDATA=16’h43BC。這里TXCHARISK=2’b11表明對應(yīng)數(shù)據(jù)的低字節(jié)為K字符，對應(yīng)比特流中的comma字符。需要注意的是，當(dāng)TXCHARISK=2’b11，發(fā)送TXDATA=16’hBCBC時，由于TXDATA中高八位和低八位相同，這樣在接收端容易出現(xiàn)錯位8位的情況。如圖4所示。

基于FPGA-4.jpg

　　造成這種情況的原因是，在進行K字符探測對齊的過程中，將兩個K字符的低字節(jié)和下一個的高字節(jié)組合，這樣探測對齊系統(tǒng)會認(rèn)為實現(xiàn)了對齊過程，在接下來的數(shù)據(jù)接收過程中會以這種方式進行對齊。

基于FPGA-5.jpg

3 應(yīng)用系統(tǒng)

　　基于RcoketIO GTX的高速串行傳輸，設(shè)計出了一個高速數(shù)據(jù)采集存儲系統(tǒng)，采集端使用XC6VLX240T，存儲端使用XC5VFX240T。由圖5可以看出，ADC的高速數(shù)據(jù)是通過其自帶JESD204B接口與V6實現(xiàn)GTX互聯(lián)的，V6與V5兩FPGA間的數(shù)據(jù)傳輸也采用GTX傳輸，后面SATA設(shè)計中還是使用GTX來實現(xiàn)的。

　　從數(shù)據(jù)流來看，AD將采集的高速數(shù)據(jù)通過GTX(配置成JESD204B接口)送入Virtex-6，經(jīng)過一定的數(shù)據(jù)處理后通過GTX發(fā)送至Virtex-5 FPGA，最終通過GTX(配置成SATA接口)存入磁盤陣列。由此可見，RocketIO GTX是整個系統(tǒng)中高速數(shù)據(jù)傳輸?shù)暮诵摹?/p>

基于FPGA-6.jpg

4 實驗結(jié)果和分析

　　通常對系統(tǒng)設(shè)計中GTX通路的連接需要進行測試，以下將通過本V6端的PCS遠端測試來驗證其工作性能，也就是V6端發(fā)送測試數(shù)據(jù)至V5然后通過PCS環(huán)回至V6接收端，來看數(shù)據(jù)的正確與否。chipscope采樣如圖6所示。

　　由于遠端PCS環(huán)回模式可以同時測試兩端GTX的通信情況，故由圖6可知，XC6VLX240T、XC5VFX240T可以正常通信。

　　高速數(shù)據(jù)傳輸中，經(jīng)常要對數(shù)據(jù)進行各種轉(zhuǎn)換，而數(shù)據(jù)的拼接與拆分是最常用的手段，圖7是對一路 0000-FFFF的遞增碼，將遞增碼拆分成兩路分別為4K數(shù)據(jù)和43BC。也就是將一個遞增碼分成TRIG1和TRIG2的兩路GTX數(shù)據(jù)進行發(fā)送來測試數(shù)據(jù)的正確性。

　　由數(shù)據(jù)總線圖可以看出，兩路數(shù)據(jù)成完美遞增狀態(tài)。

5 結(jié)束語

　　本文以高速數(shù)據(jù)傳輸為出發(fā)點，介紹了基于RocketIO GTX 的解決方案，并給出了以GTX為核心的應(yīng)用系統(tǒng)設(shè)計。由此可見，采用 RocketIO收發(fā)器進行高速串行數(shù)據(jù)的傳輸，在保證速度的前提下，傳輸過程中的信號完整性也得到了極大的保障，為高速數(shù)據(jù)的傳輸提供速度和質(zhì)量上的保證。

參考文獻：

　　[1]Xilinx. Virtex-6 Family Overview[M]. USA:Xilinx, 2012.

　　[2]Xilinx. Virtex-6 FPGA GTX Transceivers User Guide[M]. USA:Xilinx,2011.

　　[3]李大鵬,陳長勝,王世奎等.基于FPGA的高速串行傳輸接口研究與實現(xiàn)[J]. 航空計算技術(shù),2008,38(2):100-103.

　　[4] Abhijit Athavale,Carl Christensen.High-Speed Serial I/O Made Simple[J].USA:Xilinx

　　Corporation.2005.4.

　　[5]徐文波，田耘.Xilinx FPGA 開發(fā)使用教程[M].北京：清華大學(xué)出版社，2012.7. [4] Xilinx.Virtex-5 FPGA [6]RocketIO GTX Transciver Wizard v1.5 Getting Started Guid[S].USA:Xilinx,2008

本文來源于中國科技期刊《電子產(chǎn)品世界》2016年第8期第42頁，歡迎您寫論文時引用，并注明出處。

国产肉体XXXX裸体137大胆,国产成人久久精品流白浆,国产乱子伦视频在线观看,无码中文字幕免费一区二区三区国产成人手机在线-午夜国产精品无套-swag国产精品-国产毛片久久国产

新聞中心

基于FPGA的高速數(shù)據(jù)傳輸研究

評論

相關(guān)推薦

技術(shù)專區(qū)

国产肉体XXXX裸体137大胆,国产成人久久精品流白浆,国产乱子伦视频在线观看,无码中文字幕免费一区二区三区 国产成人手机在线-午夜国产精品无套-swag国产精品-国产毛片久久国产

新聞中心

基于FPGA的高速數(shù)據(jù)傳輸研究

評論

相關(guān)推薦

技術(shù)專區(qū)

国产肉体XXXX裸体137大胆,国产成人久久精品流白浆,国产乱子伦视频在线观看,无码中文字幕免费一区二区三区国产成人手机在线-午夜国产精品无套-swag国产精品-国产毛片久久国产