國產CPU里程碑!龍芯最強處理器、自研GPGPU來了,披露Tock“三劍客”
編輯 | Panken芯東西11月28日報道,今日,國產CPU企業(yè)龍芯中科自主研發(fā)的新一代CPU 3A6000發(fā)布,這也是我國國產CPU領域的最新里程碑成果。龍芯3A6000采用龍芯自主指令系統(tǒng)龍架構(LoongArch),是龍芯第四代64位高性能微架構LA664的首款產品,且主要IP核均自主研發(fā),采用成熟工藝生產,主頻達到2.5GHz,支持多線程技術,全芯片共8個邏輯內核。
在第三季度業(yè)績說明會上,胡偉武還提到:“我們正在努力提高每GHz性能接近或達到蘋果CPU的水平?!彼€透露,“3B6000將爭取每GHz的性能再提高20%-30%,在此基礎上用先進工藝提高主頻。”
▲龍芯中科技術股份有限公司董事長胡偉武
同時,龍芯中科推出了打印機主控芯片龍芯2P0500,這是國內首款基于自主指令系統(tǒng)的打印機主控芯片。
01.將自主化優(yōu)勢轉化成技術優(yōu)勢性能追上十代酷睿四核處理器
當下全球的信息產業(yè)構建在西方主導的x86體系之上。胡偉武談道,2021年我國硅上工業(yè)企業(yè)利潤率為6.8%,其中電子工業(yè)利潤率為5.9%。2021年我國電子工業(yè)的利潤總額為8283億元,蘋果一個公司就達到946億美元。
胡偉武談道,CPU和操作系統(tǒng)是信息產業(yè)的底座,但還有更底層的根技術被卡脖子,比如指令系統(tǒng)、芯片生產工藝和設備材料等。因此,龍芯中科要構建獨立于x86和Arm的第三套新型信息技術體系和產業(yè)生態(tài),其自研的指令集架構龍架構就是第三套體系的基礎。
龍芯中科有三大系列CPU產品,龍芯3號CPU系列是面向桌面、服務器應用,龍芯2號SOC系列,面向工控和終端應用,龍芯1號面向的是嵌入式專門應用。
胡偉武稱,龍芯的主要IP核均自主研發(fā),目前龍芯的軟硬IP核數量已經有上百種。下圖中,龍芯3A6000結構圖中4個方塊就是4個核,標紅的就是3A6000用到的IP。其中,PCIe的IP為自主研發(fā),可以做得很小并且成本更低,這也是自己做IP的好處。
3A6000有4個物理核和8個邏輯核,主頻2.0GHz到2.5GHz,還有片內集成安全可信模塊,支持安全啟動和國密算法。
首先,3A6000采用龍芯第四代64位高性能微架構LA664,這一架構有兩個特點,首先是大幅提升性能,其次是實現了同時多線程技術。胡偉武透露,龍芯的芯片是一個套殼加Tock+Tick,基于第二代GS464E,3A3000性能提升1.6倍。
龍芯3號系列芯片按照Tick-Tock路線發(fā)展,Tick指的是工藝節(jié)點的增強,Tock指的是微體系結構的增強。
第三代架構是GS464V、LA464,與3A3000相比,3A4000工藝沒變,通過結構優(yōu)化性能提高了兩倍,3A5000采用更先進工藝性能提升了1.5倍。
3A6000采用的是第四代架構,使得CPU在相同工藝下性能比上一代產品大幅提高。根據電子四院的報告,3A6000單線程通用處理性能提升60%,多進程通用處理性能提升100%。
定點單線程的性能分數是43分,CPU 2017的單線程性能是5分。
3A6000的性能達到十代酷睿四核處理器水平,2.5GHz的龍芯3A6000和3.6GHz的酷睿i3比較數據如下:
胡偉武稱,龍芯中科走出了一條基于成熟工藝,通過設計優(yōu)化提高性能的道路,標志著在弱一點的工藝條件下,與英特爾、AMD等的產品性能可比。下一步龍芯中科將繼續(xù)基于成熟制程研發(fā),達到英特爾先進工藝的性能。
2013年,胡偉武就在反思,中國CPU和國外先進水平的主要性能差距在什么地方?是通用處理能力不行、還是專業(yè)處理能力不行?是單核性能不足還是核數不夠?是設計能力不行還是工藝不行?
他認為,剛剛提到的43分,就相當于3A6000“研究生畢業(yè)”。并且當時龍芯3A1000主頻差距在2-3倍,每GHz性能差距為4-6倍。
目前,龍芯中科已經完成了通用處理性能技術補課,十代酷睿是2020年的產品,胡偉武稱,現在很多人電腦上還用的是八代、九代酷睿,今年龍芯中科推出的3A6000已經達到市場主流水準。
龍芯中科已經完成龍芯3C6000設計,龍芯3C6000采用單硅片16核32線程,通用處理性能成倍提升,內存采用DDR4-3200x4,訪存帶寬比上一代3C5000成倍提高。
胡偉武認為,龍架構指令系統(tǒng)是龍芯的一個貢獻,片間互聯就是龍芯的第二個貢獻,未來,龍芯中科都會開放。
龍芯中科突破片間高速互聯技術,對標的是nVLink、CXL,這也是破解Chiplet技術的關鍵。片間互聯可以大幅降低延遲提高帶寬效率。
在GPGPU方面,龍芯第二代自研圖形處理器LG200有圖形加速、科學計算加速、AI加速三個功能,右邊是GPGPU的結構圖。
02.自主化優(yōu)勢轉化為軟件生態(tài)優(yōu)勢三大階段完成生態(tài)建設
指令系統(tǒng)是軟件生態(tài)的基礎,2020年,龍芯中科推出龍芯指令系統(tǒng)結構LoongArch,簡稱龍架構或LA架構,完成了自主知識產權評估。
胡偉武透露,構建龍架構軟件生態(tài)分三個階段。
首先是夯實基礎,龍芯中科的架構已經得到國際開源軟件認可,開發(fā)者可以完全基于龍架構的國際開源軟件直接構建出完整的操作系統(tǒng)。其次,該框架得到了國內操作系統(tǒng)和基礎應用的認可和支持,目前支持統(tǒng)信、麒麟、歐拉、龍蜥、開源鴻蒙等操作系統(tǒng),支持WPS、微信、QQ、釘釘、騰訊會議、美團等應用。
第二要克服Linux生態(tài)碎片化的特點,實現不同分支及版本的應用兼容。龍芯平臺支持不同版本不同分支,如麒麟的應用在統(tǒng)信上可以跑,統(tǒng)信的應用在麒麟生態(tài)上也可以跑。
龍芯中科已經升級完成,目前正在做廣泛兼容,在龍架構上運行x86、Windows應用,但不能運行Windows,還有運行安卓應用。
第三是自主應用。胡偉武稱,龍芯中科要推出自主編程框架,就像安卓、iOS等一樣有自己的應用平臺。
在廣泛兼容方面,通過二進制方案運行x86應用,龍芯中科要架起兩座橋,一個是把x86的指令翻譯成龍架構指令,一個是把Windows接口翻譯成Linux接口。
龍架構的一大優(yōu)勢就是可以自由加指令,將不侵權的功能類似的指令加進去,翻譯時就相當于英文翻中文。
打印機驅動是Linux的一大難題,多數打印機只有Windows驅動,沒有Linux驅動?,F在龍芯架構可以支持95%以上的打印機。
通過二進制翻譯運行x86應用,龍芯生態(tài)可以運行絕大多數x86和Linux應用,用戶體驗流暢,對于x86/Windows應用可以大量運行。龍芯下一代處理器將完善對二進制翻譯的支持,如x87的80位浮點指令。
03.構建獨立于x86和Arm之外的生態(tài)體系
3A6000性能達到市場主流產品水平,龍芯架構的基礎軟件生態(tài)基本建成,龍芯中科要構建獨立于x86和Arm體系的自主信息技術體系。
為了加強生態(tài)體系建設,龍芯中科要與合作伙伴共建。首先解決做龍架構芯片企業(yè)少的問題,龍芯中科將CPU IP核開放授權,且不收版稅。未來,龍架構指令系統(tǒng)也會開放授權。
04.結語:自研CPU任重道遠
以通用CPU、GPU為代表的計算芯片是算力的基石,是計算系統(tǒng)和信息基礎設施的核心,當下核心技術受制于人是我國產業(yè)發(fā)展最大的隱患。近年來,以龍芯中科為代表的企業(yè)推動核心技術突破,使得國產芯片性能持續(xù)提升,供應鏈的可持續(xù)性、生態(tài)完備性上也取得進步。
此次,龍芯中科正式發(fā)布龍架構,并開放了IP授權,同時,國產操作系統(tǒng)、應用軟件的協(xié)同發(fā)展,將加速國產CPU生態(tài)建設。面對新一輪科技革命和產業(yè)革命加速演進,以龍芯中心為代表的國產玩家正在通過自主研發(fā)、創(chuàng)新突破一步步探索芯片研發(fā)的天花板,推動國產CPU性能和成熟度不斷提升。 科普視頻
未來,AI將惠及每一個人,這一切如何實現?聯想集團發(fā)布的系列主題視頻,將從AI終端到行業(yè)專屬定制AI,乃至更智能的社會,展開一副人工智能全圖景。
*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。