基于HSA，聯發(fā)科技用多核異構主攻深度學習

作者：王瑩時間：2016-09-06 來源：電子產品世界

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

　　“2016年全球異構計算HSA峰會”于8月下旬在京拉開帷幕，本次峰會由全球異構系統(tǒng)架構(HSA)聯盟和中國半導體行業(yè)協(xié)會(CSIA)共同主辦。聯發(fā)科技(MTK)公司介紹了其主攻深度學習的十核三叢集架構技術，以及對HSA的貢獻。會后，筆者采訪了該公司高級技術總監(jiān)Roy Ju先生。

本文引用地址：http://m.ptau.cn/article/201609/296605.htm

　　MTK的異構技術歷程

　　2015年推出了Device Fusion軟件技術，可以自動地根據應用程序執(zhí)行的特性，觀察適合在CPU、還是在GPU等上面運行,或者在CPU和GPU上同時運行。

　　公司今年又首創(chuàng)了十核三叢集架構，采用大中小核技術，可以平衡性能功耗比，并已將該架構應用到高端芯片——曦力X20上，再輔以CorePilot3.0，可實現高性能、低功耗和優(yōu)秀的用戶體驗。

　　展望未來，聯發(fā)科技將幫助開發(fā)者來進行深度學習方面的應用。深度學習可由HSA(異構系統(tǒng)架構)實現，適合多種應用領域，諸如物體辨識，人臉/場景/年齡識別、針對性廣告、活動/手勢識別、情景感知計算等。

　　深度學習的挑戰(zhàn)

　　由于深度學習的運算量非常大，需要采用異構計算。因為如果只在傳統(tǒng)的CPU上執(zhí)行，可能達不到性能需求。通過放到加速器上面，可以使運行的效率與功耗有顯著提高，即“CPU+”方法。當然選核只是一個開始。

　　之后，異構硬件之間的架構要做很多優(yōu)化。由于有了HSA，開發(fā)者就可以用同一個界面，不再會因為下面的硬件不同而做特別的優(yōu)化。HSA能夠很好地將需要大計算量的應用，調度到諸如GPU和DSP等能效表現更佳的計算單元上去運行，從而避免了總是在能耗更大的CPU上運行。因此，用戶能夠同時獲得高性能和低能耗。另外，HSA注重降低GPU的驅動過載，而且這個特性近來也被應用到了一些新型圖像API上，從而有助于提升在線游戲體驗。

　　HSA與聯發(fā)科技

　　HSA是在2012年6月正式成立的，由聯發(fā)科技等六家企業(yè)共同發(fā)起。如果希望不同IP之間能夠有不同的組合，博采眾長，界面就要定義得很清楚。因此，HSA成立之初就廣發(fā)英雄帖，召集天下企業(yè)加盟。因為HSA聯盟如果一開始就很局限，格局就做不大。

　　加入HSA聯盟以后，聯盟成員可以提供一些代碼幫助研制規(guī)格。運作過程通常是這樣的：在討論的過程中，代碼通常是不對外公開的。但在規(guī)格完成對外公開后,絕大部分代碼內容通常都會批準公開，最后一關由董事會批準。如要得到HSA的LOGO，通常要經過測試。

　　與其他公司相比，聯發(fā)科技的HSA策略特點是：除了開發(fā)自己的IP外，也集成來自第三方的IP，從系統(tǒng)和平臺層面部署HSA技術。其實，HSA是一項平臺性技術，需要多個IP模塊的緊密合作以支持平臺上的多個特性，包括共享虛擬內存、信號、隊列語言等。因此，聯發(fā)科技領導著多廠商(Multi-vendor)工作組，定義和標準化來自不同供應商的不同IP模塊間的互操作，通過創(chuàng)造公平的競爭環(huán)境，汲取生態(tài)系統(tǒng)中來自不同IP廠商的技術精華。