人工智能探境科技之得“芯”應手
1 AI處理平臺的前世今生
人工智能(AI)是當前熱度很高的一個技術名詞,其技術應用推廣由來已久,曾經依托于高度密集計算的通用平臺,主要是基于中央處理器(CPU)的計算器,或是基于數字信號處理器(DSP)的實時嵌入式系統(tǒng),然后逐步發(fā)展和演化成為深度學習的有效實現手段,由此對核心處理器平臺提出更高更嚴苛的要求,從而催生了專用AI處理平臺。筆者曾有十多年從事DSP業(yè)務拓展的經歷,對于AI處理平臺創(chuàng)新并開創(chuàng)一個全新的智能化局面充滿了好奇,于是拜訪了北京探境科技有限公司,與魯勇董事長進行探討,對于以神經網絡處理方式來構建具有顛覆式AI架構有了深度的了解。
首先我們從處理器的基本架構談起。眾所周知,CPU的體系是沿用經典計算機的馮·諾依曼體系,而DSP則采用哈佛結構,且不斷改進。DSP將地址總線和數據總線分開以便提高存儲器訪問速度,又增加流水線結構,旨在有效提高處理速度,特別有益于以系列乘加為主體的卷積運算,而這正是數字濾波器的基本結構。語音處理技術發(fā)展得益于DSP,然而其應用卻受制于其通用性,使得包括語音識別在內的智能語音應用局限性較大。對于智能圖像和智能視頻處理同樣存在這樣的問題,所以構建具有針對性的新型AI平臺,最大限度地匹配目標應用勢在必行。
圖1 SFA體系架構示意圖
2 生根于SFA的芯片架構
新型AI平臺必然是一個神經網絡處理器NPU(Neural Processing Unit),魯勇指出業(yè)界芯片最核心的設計指標是PPA(Perform Power Area),即性能、功耗、還有與成本相關的芯片面積,AI處理平臺要在架構上有重大突破必定要立足于此。探境科技公司初創(chuàng)就確定創(chuàng)立自主的AI架構,其最終目標是既要有面向神經網絡的通用性,又把重點放在提升數據管理和調度效率的針對性。與DSP解決的計算復雜度即“算力”問題不同, AI面對處理的對象是龐大的數據包,要讓海量數據柔和、順利地傳遞到計算單元里來,就要更好地實現存取的匹配。在這過程中解決指數級增長的存儲問題是關鍵,有個專業(yè)名稱叫“存儲墻”,只有打破其束縛,才能使AI處理算法游刃有余。探境科技獨創(chuàng)的SFA(Storage First Architecture)存儲優(yōu)先架構,用存儲來驅動計算能力,推翻馮·諾依曼體系,完全區(qū)別于之前各類處理器芯片的架構。如圖1所示即為SFA體系架構示意圖。
實測數據表明,SFA體系具有超高能效比,在同等條件下,數據訪問可降低10~100倍,存儲子系統(tǒng)功耗下降10倍。采用28 nm工藝,系統(tǒng)能效超過4T+OPS/W。
圖2 基于VOI611的語音識別模組及框圖
3 基于SFA架構AI芯片的優(yōu)勢
AI設計公司的判定標準在于是否有能力設計AI芯片,這是魯勇所持的觀點,那么代表著技術高低的絕對判斷就是AI芯片的PPA。基于SFA的AI芯片目前具有語音和圖像兩個分支,語音芯片最重要的關注點在于A,就是一定性能下的低成本,采用55 nm工藝可以減少投片費用,獲得很高的性價比。而圖像芯片關注2個P,就是追求高性能下的低功耗,采用能效比較高的28 nm工藝,其實探境科技實現的能力已經超過業(yè)界12 nm工藝所達到的水平。
與符合現有AI需求特征的芯片一樣,SFA芯片需要支持各種各樣的神經網絡,這些神經網絡則根據不同的應用場景放不同算法。事實上,SFA能夠支持所有已知深度學習神經網絡,等同于GPU的兼容性,對神經網絡的參數沒有限制,對數據類型也沒有限制,其中包括INT4/INT8/INT16/FP16/自定義浮點,還有自適應稀疏數據處理等。
此外,SFA架構真正符合商業(yè)應用的AI芯片架構的特點在于:①采用成熟設計方案,無需對底層器件進行修改設計,商業(yè)化路徑快;②通用性高,芯片面向的場景眾多,必須支持多種算法才可以被商業(yè)化;③易用性高,用戶學習成本低,模型移植簡單。
在談及SFA芯片開發(fā)的感受,魯勇不無感慨地說,探境科技自2017起零基礎自主創(chuàng)新,沒有可參考的東西。他本人雖有多年Marvell的工作經歷,但背景領域卻沒有相通之處。然而,多年的芯片設計經驗使他在技能訓練上有共同點,那就是對于結構化算法的理解。關于芯片開發(fā)的心得,魯勇認為首先是技術路徑順暢,其次是實現流程嚴謹,所以僅用一年半就開發(fā)完成并一次流片成功。還有,就是市場把握準確,將市場與銷售工作緊密結合,真正做到AI芯片應用的落地。
圖3 前景廣闊的語音識別智能化家電應用
4 落地在語音識別智能應用
探境科技堅持著“接地氣”的原則,努力使其AI芯片貼近用戶和貼近市場需求,首款通用型AI芯片是音旋風VOI611,是目前業(yè)界綜合性能最好的離在線語音方案,將SFA的NPU與ARM-M3的MCU結合,并集成音頻Codec和多種接口。VOI611作為針對嵌入式產品的深度學習語音識別芯片,具有強大的降噪功能,在60 dB環(huán)境噪音下識別率可達到98%以上;雙麥即可實現麥克風陣列的效果,支持10 m遠場識別、噪聲抑制、音源定位等功能;命令識別數量最高為200個,憑借深度學習技術,不針對特定人,也不需要持續(xù)更新。
既然定位為以技術和產品驅動的AI芯片公司,就需要具備相輔相成的2個能力,即AI芯片創(chuàng)建能力和AI算法構建。探境科技不僅提供包含算法的異構單片系統(tǒng)(SoC)芯片,也要提供完整“交鑰匙(Turn-Key)”的模組解決方案,從而以全能型選手姿態(tài)來全面符合市場需求。為此,所交付的產品要全面滿足客戶的需要,其技術核心的七到八成在于客戶對算法語音識別效果的認可。圖2所示為基于VOI611的語音識別模組的實物圖和系統(tǒng)框圖。
在探境科技的實驗室里,魯勇做了語音控制產品演示,特別是在抗擊疫情中發(fā)揮了顯著作用的聲控電梯控制器,全程無需按鍵接觸,體現了語音交互的好處。筆者亦應邀體驗了各類智能語音產品,驚喜地感受到不僅是電梯,還有燈具、空調、風扇等各種各樣電器,都成了“聽話”的智能化設備。
AI語音識別芯片的另一個重要的應用領域就是汽車,這就對技術指標提出更高的要求,探境語音算法的多項“黑科技”將大顯身手,包括性能優(yōu)異適應性強的自研AI降噪算法、高計算強度神經網絡HONN技術、更強大更具魯棒性的雙麥識別技術,當然必須具備的還有車規(guī)級的芯片標準。
此外,自創(chuàng)立伊始,圖像就是探境志在必得的重要領域。目前,探境科技正在加緊開發(fā)為視覺領域設計、與量身定制神經網絡相結合的高度集成AI芯片,并將提供具有智能圖像深度學習算法的全棧式方案,預計明年發(fā)布,未來將助力安防監(jiān)控系統(tǒng)、機器視覺系統(tǒng)、汽車自動駕駛,及新型零售系統(tǒng)等領域智能化水平的全面提升。
評論