自適應計算架構可應對靈活多變的創(chuàng)新
——訪靈思總裁兼首席執(zhí)行官Victor Peng
本文引用地址:http://m.ptau.cn/article/201912/408656.htm王?瑩?(《電子產品世界》編輯,北京?100036)
編者按:數(shù)據(jù)中心的發(fā)展趨勢是什么?如何用芯片、板卡和軟件平臺應對千變萬化的創(chuàng)新應用?2019年12月,“第3屆賽靈思開發(fā)者大會(XDF)亞洲站”在京盛大舉行,賽靈思領航人Victor Peng做了解答。
賽靈思的目標是“打造靈活應變、萬物智能世界”。為此,公司有三大戰(zhàn)略:①數(shù)據(jù)中心優(yōu)先;②加速核心市場發(fā)展;③驅動自適應計算。歸根結蒂,是讓更多的軟硬件開發(fā)者能使用并受益于賽靈思強大的自適應計算平臺。
1 數(shù)據(jù)中心迎來顛覆性變革
爆炸性增長的數(shù)據(jù)帶來了數(shù)據(jù)中心顛覆性的變革:需要高吞吐量的性能和極低的延時,同時要面對摩爾定律消亡帶來的性能提升瓶頸。圖靈獎得主John Hennessy和David Patterson最近都提到,架構創(chuàng)新已經進入到一個新的黃金時代。因為傳統(tǒng)架構對于現(xiàn)在的任務應用已經應付不了,行業(yè)亟需架構創(chuàng)新。為此,賽靈思的產品和平臺在特定領域架構(DSA)、異構計算加速、近網絡計算和近存儲數(shù)據(jù)方面實現(xiàn)了創(chuàng)新。
賽靈思的數(shù)據(jù)中心業(yè)務發(fā)展強勁,在2019年9月結束的最新的一個季度,業(yè)務同比增長24%,季度增長92%。賽靈思的主要做法是打造生態(tài)系統(tǒng),加速計算、存儲、搜索、網絡等應用,推出分布式自適應計算。
1)打造生態(tài)系統(tǒng)
目前,賽靈思已經培訓工業(yè)界及學術界7千多名開發(fā)人員,約有800多個加速器合作伙伴,而且有95個發(fā)布的應用。
2)加速計算、存儲、搜索、網絡等應用
從計算加速和傳統(tǒng)CPU比較的例子可見,傳統(tǒng)的數(shù)據(jù)中心服務器有1個CPU連接網絡,通過NIC(網絡接口控制器)和PCIe連接到存儲設備。而當CPU擁有賽靈思FPGA,以及即將推出的賽靈思Versal ACAP(自適應計算加速平臺)的加速,將會實現(xiàn)速度的巨大提升。
在存儲加速領域,賽靈思也在廣泛部署,已經和IBM、美光、三星等開展了合作,部署加速存儲和計算存儲,從而可以實現(xiàn)數(shù)據(jù)在最近的地方處理。
眾所周知,很多地方的數(shù)據(jù)增長是呈指數(shù)級的,存儲和搜索的響應是非常關鍵的,賽靈思的產品也可以加速。具體地,可以加速壓縮/解壓縮、解密。賽靈思單一的加速器可以把加速性能提升4倍,而且是非常線性的。
另外,賽靈思也提供網絡加速,例如在SmartNIC行業(yè)剛剛開始采用網絡加速的領域。SmartNIC可以通過移除惡意數(shù)據(jù)包提供更好的安全性,并通過將網絡堆棧從CPU卸載到SmartNIC來加速數(shù)據(jù)包處理。這不僅打破了網絡性能瓶頸,而且縮短了CPU應用執(zhí)行的周期,從而提高了TCO(總擁有成本)。
對于雙插槽DC(數(shù)據(jù)中心)服務器,使用基于賽靈思的智能網卡,數(shù)據(jù)吞吐量加快了3~6倍,CPU利用率提高了1.5倍。賽靈思芯片是軟硬件可編程的,因此可實現(xiàn)用1個開發(fā)板就能定制化地滿足不同客戶部署的需求。
3)數(shù)據(jù)中心的未來:分布式自適應計算數(shù)據(jù)中心的未來發(fā)展趨勢是什么?首先,業(yè)界對數(shù)據(jù)中心的需求是不斷增長的。數(shù)據(jù)中心分為公有云、私有云、混合云或企業(yè)云等。其次,數(shù)據(jù)中心運營商們都想大幅提升數(shù)據(jù)集的利用率,提高高性能,并減少能耗,降低OPEX(資本性支出)/TCO。這可以通過可分解和可組合的方式實現(xiàn),具體地,使用SmartNIC、固態(tài)硬盤和計算加速器將資源分解為單獨的CPU庫來實現(xiàn),然后根據(jù)需要組合這些資源,以滿足任何工作負載的需要。
例如,如果控制和網絡密集型工作負載是基于CPU的,只要把更多資源分配給CPU即可。對于工作與計算為基礎的項目,例如AI網絡等,也可以給這種計算網絡分配更多資源。如果與技術分析比較相關的,也可以把這些資源分配給這種計算網絡。所以ACAP可以針對專用需求來分配更多的資源,以及想要加速的相關數(shù)據(jù)集,ACAP就可以配置好,而且這是動態(tài)的,可以較高程度地來利用現(xiàn)有的技術,不管是CPU、存儲數(shù)據(jù),還是加速器,ACAP都可以提升其性能。
ACAP有三大價值,①TCO方面,可動態(tài)優(yōu)化工作負載,加速和提高加速器的高利用率;②延時低;③加速可以定制化,即用戶可以采用所有新的創(chuàng)新,諸如用神經元網絡(NN)優(yōu)化,而不用添加額外的部件/器件。
2 加速核心市場發(fā)展
包括汽車、醫(yī)療等。以汽車行業(yè)為例。賽靈思在汽車業(yè)有大量的創(chuàng)新,自動駕駛、ADAS等方面是有非常多的應用。十多年來,賽靈思在汽車業(yè)已出貨了1.7億片以上的器件。其中,ADAS領域有6700萬片。賽靈思擁有200家ADAS和自動駕駛客戶群,包括全球主要的Tier1(一級供應商)、整車廠和初創(chuàng)企業(yè)。
賽靈思最近發(fā)布的ZU7和ZU11 Zynq UtraScale+產品符合汽車安全、質量和可靠性要求,滿足了在L2到L4自動駕駛車輛的功率限制范圍內對數(shù)據(jù)聚合、預處理和傳感器數(shù)據(jù)分布的需求。
3 軟硬件的平臺轉型
多年來,賽靈思持續(xù)進行硬件和軟件的平臺化轉型。
3.1 硬件平臺化
賽靈思宣布正研發(fā)7 nm架構及全新的產品系列Versal,Versal將采用自適應計算架構(ACAP)。2019年,Versal芯片已經開始在早期客戶中實現(xiàn)(如圖1)。
開發(fā)了加速器卡,并用于多個行業(yè)。2018年推出Alveo PCI加速器卡。迄今賽靈思一共有四大產品系列:U200,U250,U280和U50。其中,U280集成了HBM存儲,提供超高性能。U50集成了第2代HBM2,實現(xiàn)小型封裝的突破,是業(yè)界第1款半高半長、支持PCIeGen4的自適應加速器卡。
目前,賽靈思最先進的處理器芯片是擁有360億晶體管的7nm Versal ACAP,已發(fā)貨給客戶和合作伙伴。同時賽靈思現(xiàn)在也有新的Versal PCIe通用開發(fā)板,已經準備就緒,可以使開發(fā)者以10倍速度開始構建和加速應用。
3.2 軟件平臺化
為了擁有一個完整的平臺,除了硬件平臺外,也需要軟件的統(tǒng)一開發(fā)平臺,2019年10月,賽靈思推出了Vitis,是用于從嵌入式終端設備到邊緣和云應用的統(tǒng)一開發(fā)環(huán)境。
Vitis可以支持異構架構,例如Zynq SoC和VersalACAP,開發(fā)人員在開發(fā)軟件時利用自己所習慣的方式,在無需硬件專業(yè)知識的情況下就可獲得優(yōu)化硬件的好處。
總之,硬件優(yōu)化可以簡單到用幾個關鍵的加速內核就可利用強大的特定領域架構(DSA)。Vitis配合賽靈思開發(fā)板后,現(xiàn)可以免費下載。
本文來源于科技期刊《電子產品世界》2020年第01期第1頁,歡迎您寫論文時引用,并注明出處。
評論