基于HSA,聯發(fā)科技用多核異構主攻深度學習
“2016年全球異構計算HSA峰會”于8月下旬在京拉開帷幕,本次峰會由全球異構系統(tǒng)架構(HSA)聯盟和中國半導體行業(yè)協(xié)會(CSIA)共同主辦。聯發(fā)科技(MTK)公司介紹了其主攻深度學習的十核三叢集架構技術,以及對HSA的貢獻。會后,筆者采訪了該公司高級技術總監(jiān)Roy Ju先生。
本文引用地址:http://m.ptau.cn/article/201609/296605.htmMTK的異構技術歷程
2015年推出了Device Fusion軟件技術,可以自動地根據應用程序執(zhí)行的特性,觀察適合在CPU、還是在GPU等上面運行,或者在CPU和GPU上同時運行。
公司今年又首創(chuàng)了十核三叢集架構,采用大中小核技術,可以平衡性能功耗比,并已將該架構應用到高端芯片——曦力X20上,再輔以CorePilot3.0,可實現高性能、低功耗和優(yōu)秀的用戶體驗。
展望未來,聯發(fā)科技將幫助開發(fā)者來進行深度學習方面的應用。深度學習可由HSA(異構系統(tǒng)架構)實現,適合多種應用領域,諸如物體辨識,人臉/場景/年齡識別、針對性廣告、活動/手勢識別、情景感知計算等。
深度學習的挑戰(zhàn)
由于深度學習的運算量非常大,需要采用異構計算。因為如果只在傳統(tǒng)的CPU上執(zhí)行,可能達不到性能需求。通過放到加速器上面,可以使運行的效率與功耗有顯著提高,即“CPU+”方法。當然選核只是一個開始。
之后,異構硬件之間的架構要做很多優(yōu)化。由于有了HSA,開發(fā)者就可以用同一個界面,不再會因為下面的硬件不同而做特別的優(yōu)化。HSA能夠很好地將需要大計算量的應用,調度到諸如GPU和DSP等能效表現更佳的計算單元上去運行,從而避免了總是在能耗更大的CPU上運行。因此,用戶能夠同時獲得高性能和低能耗。另外,HSA注重降低GPU的驅動過載,而且這個特性近來也被應用到了一些新型圖像API上,從而有助于提升在線游戲體驗。
HSA與聯發(fā)科技
HSA是在2012年6月正式成立的,由聯發(fā)科技等六家企業(yè)共同發(fā)起。如果希望不同IP之間能夠有不同的組合,博采眾長,界面就要定義得很清楚。因此,HSA成立之初就廣發(fā)英雄帖,召集天下企業(yè)加盟。因為HSA聯盟如果一開始就很局限,格局就做不大。
加入HSA聯盟以后,聯盟成員可以提供一些代碼幫助研制規(guī)格。運作過程通常是這樣的:在討論的過程中,代碼通常是不對外公開的。但在規(guī)格完成對外公開后,絕大部分代碼內容通常都會批準公開,最后一關由董事會批準。如要得到HSA的LOGO,通常要經過測試。
與其他公司相比,聯發(fā)科技的HSA策略特點是:除了開發(fā)自己的IP外,也集成來自第三方的IP,從系統(tǒng)和平臺層面部署HSA技術。其實,HSA是一項平臺性技術,需要多個IP模塊的緊密合作以支持平臺上的多個特性,包括共享虛擬內存、信號、隊列語言等。因此,聯發(fā)科技領導著多廠商(Multi-vendor)工作組,定義和標準化來自不同供應商的不同IP模塊間的互操作,通過創(chuàng)造公平的競爭環(huán)境,汲取生態(tài)系統(tǒng)中來自不同IP廠商的技術精華。
評論