ICC GCC傻傻分不清?聊一聊編譯器那些事兒
CPU這東西,大家除了關(guān)注工藝、主頻、核心數(shù)量等規(guī)格信息之外,更在意的應(yīng)該就是性能表現(xiàn)了。反應(yīng)CPU性能的測試可謂是相當(dāng)多樣,但要說起最權(quán)威的,那就不得不提SPEC
CPU測試了。
SPEC的全稱是Standard Performance Evaluation Corporation,翻譯過來是標(biāo)準(zhǔn)性能評估組織,它是一個全球性的第三方非營利性組織,由計算機廠商、系統(tǒng)集成商、大學(xué)、研究機構(gòu)、咨詢等多家公司組成,目標(biāo)是建立、維護一套用于評估計算機系統(tǒng)的標(biāo)準(zhǔn)。
在CPU性能測試上,SPEC CPU 2006是SPEC組織推出的最新版的軟件(上一個版本SPEC CPU 2000已經(jīng)基本沒有人用了),同時也是最受行業(yè)認(rèn)可的測試軟件。SPEC CPU 2006包括了CINT2006和CFP2006兩個子項目,前者用于測量和對比整數(shù)性能,而后者則用于測量和對比浮點性能。在各種處理器的SPEC CPU 2006測試結(jié)果上,我們往往會看到ICC或是GCC的字樣,那么ICC和GCC又分別代表什么呢?
ICC:全稱Intel C++ Compiler,是Intel開發(fā)的C/C++/Fortran編譯器套裝,適用于Linux、Microsoft和Mac OS X操作系統(tǒng),沒有非IA指令集版本(就是說僅供x86架構(gòu)CPU使用)。ICC廣泛應(yīng)用于高性能計算、分布式計算等商業(yè)計算領(lǐng)域,其向量化和并行化性能是業(yè)界的標(biāo)桿,能夠充分發(fā)揮現(xiàn)代處理器的特性。

ICC編譯器套裝提供兩個版本,針對高性能計算機測試采用前者,而后者面向嵌入式及移動設(shè)備
GCC:全稱GNU Compiler Collection,GNU編譯器套裝,是廣泛應(yīng)用的Linux系統(tǒng)的默認(rèn)編譯器(特別是用于編譯Linux內(nèi)核)。GCC能夠支持多種架構(gòu)的處理器,跨平臺特性相對出色。不過,GNU組織要求全部的代碼由自己完成(防止版權(quán)問題),所以GCC雖然有廣泛的硬件支持,但是在各硬件平臺上卻并不是性能最優(yōu)的編譯器。

GCC官方LOGO
到底啥是編譯器?
所謂編譯器,就是將“一種語言(通常為高級語言)”翻譯為“另一種語言(通常為低級語言→匯編語言)”的程序。它的主要工作流程:
高級語言源代碼→預(yù)處理器→編譯器→匯編語言,匯編語言再經(jīng)過匯編器→目標(biāo)文件→鏈接器生成可執(zhí)行程序。
在這個流程中,高級語言指的就是源代碼,如Pascal、C、C++、fortran、Java等,而目標(biāo)文件指的是包含CPU可以執(zhí)行的二進制指令的集合。也就是說,編譯器起到的作用就是將程序源代碼“翻譯”成匯編語言,既然是“翻譯”工作,往往就有Good和Better的區(qū)別,而從上面的介紹我們能夠看出,不同的操作系統(tǒng),能夠使用的編譯器是不同的,那這個編譯效率自然也就存在差異。
同時,CPU也是區(qū)分不同架構(gòu)的,比如x86、MIPS、ARM、Power等等,不同架構(gòu)的CPU往往運行不同的操作系統(tǒng),如x86架構(gòu)CPU可以運行Windows、Linux(Android)和Mac OS X,而MIPS等其他架構(gòu)CPU往往只能運行基于Linux開發(fā)的操作系統(tǒng)。
所以,不同架構(gòu)的CPU,根據(jù)適合的操作系統(tǒng),在SPEC CPU測試過程中編譯器的選擇上是不一定是唯一的,而選擇哪一種編譯器,站在CPU研發(fā)者的角度上,無疑會選擇能讓CPU性能發(fā)揮到最大的編譯器。
ICC | GCC | |
x86+Windows | √ | √ |
x86+Linux | √ | √ |
PPC/MIPS+Windows | 不存在 | 不存在 |
PPC/MIPS+Linux | × | √ |
通過前面對ICC和GCC的解讀,不難看出兩者的區(qū)別。ICC和GCC都可以運行在Windows和Linux下,Intel是x86架構(gòu)CPU的老大,配合x86架構(gòu)CPU開發(fā)了ICC,能夠最大程度的發(fā)揮出x86架構(gòu)CPU的真實性能。GCC能夠配合更多種類架構(gòu)的CPU加以使用,適用平臺更廣,但從CPU性能發(fā)揮的角度上看,大而廣很難和專而精比拼。
但是,綜合x86 CPU和Windows系統(tǒng)的市場占有率這兩個因素來看,在CPU測試過程中,ICC和GCC的采用率又是怎樣呢?
第三方商業(yè)機構(gòu)更多采用ICC,GCC寥寥無幾
SPEC官網(wǎng)上公布著大量的專業(yè)機構(gòu)測試結(jié)果供大家研究分析,筆者選定了全部的整數(shù)單任務(wù)測試結(jié)果進行分析,通過爬蟲抓取了約8600個測試結(jié)果,并對測試中使用的編譯器進行了數(shù)據(jù)統(tǒng)計:

結(jié)果是使用ICC編譯器的測試結(jié)果高達95%,而GCC不足0.1%。這些測試結(jié)果基本都是獨立的第三方商業(yè)機構(gòu)的測試結(jié)果,具有很高的參考價值。數(shù)據(jù)顯示,ICC編譯器的使用在SPEC CPU 2006測試中具有壓倒性的優(yōu)勢,而GCC則幾乎沒有商業(yè)機構(gòu)使用。
上述統(tǒng)計還反映了一個事實,就是Intel和AMD的x86架構(gòu)處理器在桌面及服務(wù)器領(lǐng)域的壟斷性優(yōu)勢。而從其中非x86架構(gòu)CPU的測試結(jié)果來看,僅剩的數(shù)個測試成績,Power、Sparc全部使用的是針對自家指令集優(yōu)化過的編譯器,而非GCC,這也側(cè)面反映了GCC“大而廣”的一些問題。
產(chǎn)生這個現(xiàn)象的原因要從SPEC CPU測試成績產(chǎn)生方法來說起:SPEC組織使用一臺1997年的Ultra Enterprise 2主機(處理器為296MHz UltraSPARC II Processor)作為參考對象,在其上運行了全部的SPEC CPU 2006子測試,并把每一項的測試結(jié)果的用時(中間數(shù))定位系數(shù)1。
實際測試中,假定被測試的CPU運行某項子測試的用時為A,而Ultra Enterprise 2主機同一項子測試用時為B,則用B/A,即可得到被測試CPU該項子測試的成績,而各子測試成績的幾何平均值記為總成績。
即SPEC各子項成績是相對于Ultra Enterprise 2計算出來的(Ultra Enterprise 2各項成績計為1,總分也是1)。

從中可以看出的是,作為參考成績的測試結(jié)果也并沒有使用GCC,而是Sparc自家的編譯器。
ICC GCC哪個更好?
實際上,SPEC CPU測試的是應(yīng)用程序的運行時間,這個是被測機器處理器、緩存、內(nèi)存、編譯器、操作系統(tǒng)等等部分性能的綜合體現(xiàn),并不是某個編譯器或者某個CPU的單獨測試結(jié)果,而且軟硬件平臺綜合體現(xiàn)的結(jié)果,即按照官方規(guī)則正確跑出來的分都是可比的。SPEC CPU測試結(jié)果追求的是程序運行用時越短越好,測試成績的優(yōu)劣固然重要,但是編譯器的真正的用途是“翻譯語言”,在同樣的硬件平臺(CPU)下,“翻譯”的越快就可以理解為應(yīng)用啟動或進行某種運算的用時更少,這就是選擇編譯器的重要性,也是現(xiàn)代應(yīng)用優(yōu)化的方向。
拿ICC和GCC相比,ICC是針對x86架構(gòu)CPU使用的編譯器,ICC在現(xiàn)代高性能計算領(lǐng)域廣泛使用的向量化、并行化能力較強,而GCC作為跨平臺性的編譯器,在這方面性能較差,但是針對某些偏門的CPU指令集而言,GCC是唯一的選擇。
ICC、GCC兩者廣泛應(yīng)用于商業(yè)環(huán)境中、都會被應(yīng)用于處理器、OS及編譯器開發(fā)、測試之中。有些愛好者擔(dān)心ICC過度優(yōu)化,結(jié)果不準(zhǔn)確,其實這大可不必。SPEC CPU是有嚴(yán)格的測試標(biāo)準(zhǔn)的,每一項測試都要求嚴(yán)格和參考結(jié)果一致,任何過度優(yōu)化導(dǎo)致的程序計算錯誤都不會被計算在結(jié)果之中。實際上,ICC在多年的高性能計算領(lǐng)域已經(jīng)證明了自己的可靠性,而GCC在過往版本中,也會有編譯出錯、計算結(jié)果不正確等現(xiàn)象。

ICC GCC區(qū)別好比如此 懂得人自然懂
最后筆者想要強調(diào)的是,硬件平臺性能發(fā)揮需要合適的編譯器來加以配合,合適的才是最好的,如果編譯器不能合理使用,那又有何意義呢?
評論