地平線鄭治泰：深度解讀軟件2.0時代AI無人化“玩法” ｜ GTIC2020

發(fā)布人：芯東西時間：2020-12-14 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

GTIC 2020全球AI芯片創(chuàng)新峰會剛剛在北京圓滿收官！在這場全天座無虛席、全網(wǎng)直播觀看人數(shù)逾150萬次的高規(guī)格AI芯片產(chǎn)業(yè)峰會上，19位產(chǎn)學(xué)界重磅嘉賓從不同維度分享了對中國AI芯片自主創(chuàng)新和應(yīng)用落地的觀察與預(yù)判。

在峰會上午場，地平線首席戰(zhàn)略官鄭治泰，發(fā)表了題為《軟件2.0時代AI芯片的挑戰(zhàn)》的演講。

鄭治泰認為，AI系統(tǒng)的數(shù)據(jù)系統(tǒng)和計算系統(tǒng)，是軟件2.0時代的兩大要素。在未來，機器將解決AI系統(tǒng)中的大部分問題，而人類科學(xué)家則負責對AI系統(tǒng)的算法參數(shù)進行調(diào)優(yōu)。據(jù)此，地平線推出MAPS（在精度有保障范圍內(nèi)的平均處理速度）評估方法，為人類科學(xué)家調(diào)優(yōu)AI系統(tǒng)提供輔助。MAPS系統(tǒng)可通過可視化、量化的方式，在合理的精度范圍內(nèi)，從“快”和“準”兩個維度評估芯片對數(shù)據(jù)的平均處理速度。此外，鄭治泰透露，地平線征程5芯片正在研發(fā)中，將于明年發(fā)布。相比業(yè)界某品牌同樣計劃于明年發(fā)布的GPU新品，征程5芯片有望實現(xiàn)至少3倍的性能提升。

在過去的五年中，地平線取得了比較好的商業(yè)成就。去年到今年，地平線的AI芯片實現(xiàn)量產(chǎn)上車，并已達到10萬的出貨量。明年，地平線將挑戰(zhàn)100萬的AI芯片出貨量。

這些商業(yè)結(jié)果源于地平線對技術(shù)棧、技術(shù)趨勢的把握。在今天看得到的商業(yè)化落地結(jié)果背后，最根本的是面向未來的思考。

借助GTIC 2020 AI芯片創(chuàng)新峰會的平臺，鄭治泰分享了其對軟件2.0時代的思考，并回顧了人工智能發(fā)展的歷史。

鄭治泰認為，在軟件2.0時代，數(shù)據(jù)系統(tǒng)和計算系統(tǒng)兩個部分構(gòu)成了整個AI系統(tǒng)。這其中，無論是數(shù)據(jù)系統(tǒng)還是計算系統(tǒng)，均由機器學(xué)習技術(shù)來解決最困難、最復(fù)雜的部分，人已經(jīng)不在其中發(fā)揮太多的作用。

當人和專家不再成為數(shù)據(jù)系統(tǒng)和計算的瓶頸的時候，人類社會將會發(fā)生質(zhì)變，人類將大踏步地進入到AI時代。到那時，由自動駕駛引發(fā)的機器人時代也必將開啟。

未來要實現(xiàn)AI系統(tǒng)的閉環(huán)無人化應(yīng)用

鄭治泰認為，AI問題，特別是面向一個復(fù)雜物理世界的問題，需要一個新的解決范式。

傳統(tǒng)的算法采用的是拆解問題的范式，即把問題分解為子系統(tǒng)、子系統(tǒng)被分解為子模塊、在子模塊應(yīng)用核心的算法?，F(xiàn)在看來，這種方式幾乎失靈了。

大家可以想見，假設(shè)一臺車在北京出廠，它的用戶可能在新疆、海南、沙漠等地。如果這臺車產(chǎn)生的巨量corner case（極端情況），只能依靠專家、標定人員、測試人員進行重新優(yōu)化和迭代算法，那么我們可能永遠無法實現(xiàn)人工智能驅(qū)動的自動駕駛。

也就是說，在未來的時候，我們需要實現(xiàn)整個人工智能系統(tǒng)的閉環(huán)無人化應(yīng)用。

回顧機器視覺的發(fā)展，非常經(jīng)典的應(yīng)用是用機器視覺方法識別圖片中的貓狗。這一應(yīng)用中，計算機識別不同的點陣數(shù)據(jù)，并進行數(shù)據(jù)計算。最終，計算機給出一個范式，確定圖片中是貓還是狗。這個問題剛被提出時，大家認為它的難度僅相當于一個本科生暑假作業(yè)的難度。

但是人類社會對AI走進物理世界的追求并未停止。在整個科技向前發(fā)展的過程中，盡管面臨失敗，科學(xué)家仍一次又一次地嘗試，去掌控發(fā)展的節(jié)奏和參與其中。

最初，機器視覺鼻祖馬爾提出“分解”的機器視覺方法。1986年到1990年間，人們用分解的方案解決機器視覺問題，即對整個圖進行描邊，形成有景深信息的二維圖片，再通過完整的幾何計算，抽象出三維物體。后來，人們發(fā)現(xiàn)這一解決方案存在局限性，這是因為當面對不同角度下同一物體的圖片，或者同一角度不同光影下的物體圖片時，計算機無法用上述的拆解數(shù)學(xué)模型去定義物體。

在1990年代，人工智能進入到下一個階段?？茖W(xué)家往后退了一步，將所有的物體類別定義出來，全部由數(shù)據(jù)系統(tǒng)使用機器識別方法去實現(xiàn)，通過不斷調(diào)優(yōu)、不停移動分類面，提升識別的精度和準確率。

后來，人們又發(fā)現(xiàn)這一方法仍無法解決所有問題。在整個物理世界中，一臺車面對著十分復(fù)雜的外部環(huán)境，人類想用幾個簡單的數(shù)學(xué)公式集合完成整個定義是不可能的。

2012年至今，機器視覺發(fā)生了一個深刻的變革。科學(xué)家和碼農(nóng)開始把整個計算過程全部交由機器去做，讓計算機做識別，而科學(xué)家則承擔模型結(jié)構(gòu)和算法超參數(shù)調(diào)優(yōu)的工作。這一過程中，基于隨機的算法和參數(shù)，科學(xué)家評估輸入輸出的結(jié)果，不斷對不正確的gap進行反向調(diào)優(yōu)。

2017年，專家又后退一步，將模型結(jié)構(gòu)設(shè)計也交由機器學(xué)習來設(shè)計，依賴TPU提供的充沛算力。到2019年，機器設(shè)計的模型性能遠超過人類專家設(shè)計出來的模型。

在軟件2.0時代，不增加數(shù)據(jù)的量，而增加計算量的時候，人們發(fā)現(xiàn)模型識別的錯誤率下降一半。如果數(shù)據(jù)量和計算量都提升的話，模型識別錯誤率下降三分之二。增加計算量、增加數(shù)據(jù)量，都可以自動化進行。這意味著機器自動化、持續(xù)降低識別錯誤率是可能的。

為什么在海量數(shù)據(jù)和大模型的時代，機器會比人更加厲害？鄭治泰稱，這是因為人類專家在抽象、局部有限的小數(shù)據(jù)、小模型應(yīng)用中占據(jù)優(yōu)勢。但在大數(shù)據(jù)、大模型的應(yīng)用中，計算機的準確識別和網(wǎng)絡(luò)設(shè)計能力，能夠超常發(fā)揮。

現(xiàn)在，利用機器學(xué)習重新開發(fā)和設(shè)計網(wǎng)絡(luò)模型、重新計算識別的精度協(xié)議的趨勢，并沒有顯示出終止的跡象，這就催生出一個非常重要的可能性，即我們可以面向物理世界，提供AI服務(wù)，即全自動無人駕駛汽車等“像人一樣的智能”。

借助MAPS評估方法為產(chǎn)業(yè)鏈賦能

針對AI系統(tǒng)的數(shù)據(jù)和計算，這兩大軟件2.0時代的核心要素，人類工程師在打造數(shù)據(jù)系統(tǒng)的閉環(huán)、提升數(shù)據(jù)閉環(huán)效率的同時，還要結(jié)合軟件和硬件底層的邏輯設(shè)計，逐步提高計算的效率和性能。

基于此，地平線提出MAPS（在精度有保障范圍內(nèi)的平均處理速度）的概念和評估方法。借助這套方法，客戶可以直接面向物理世界，評估AI系統(tǒng)的效能。這一方法并不是單純計算峰值算力或軟件的算法效率，而是計算這兩者在物理世界可接受的精度范圍內(nèi)的處理速度。地平線計算的是什么？是AI系統(tǒng)能跑得多快、跑得多準。

為實現(xiàn)數(shù)據(jù)閉環(huán)，幾乎所有的AI公司都在圍繞數(shù)據(jù)的搜集、采集、標注、模型訓(xùn)練進行部署。相較而言，地平線是利用自身的核心技術(shù)能力，給整個行業(yè)賦能。如果客戶需要打造一套完整的數(shù)據(jù)閉環(huán)，地平線可以為其提供技術(shù)支持和服務(wù)。

鄭治泰透露，目前，地平線正與國內(nèi)頭部的汽車企業(yè)攜手，打造不少于3～5個聯(lián)合實驗室。

通過這種聯(lián)合實驗室，地平線計劃為車企提供毫無保留的技術(shù)支持。地平線秉持開放賦能的宗旨，可以提供芯片，也可以提供芯片+工具鏈，還可以提供芯片+工具鏈+算法。此外，就算客戶想要完全脫離地平線的技術(shù)產(chǎn)品來打造AI能力，地平線也會100%為客戶賦能。針對物理世界中的海量數(shù)據(jù)問題，地平線以幫助合作伙伴具備真正的AI生產(chǎn)力為目標。

2015年，地平線成立，初創(chuàng)團隊具備算法背景。當時，團隊發(fā)現(xiàn)在處理邊緣計算時，需要在物理世界中定義一個問題，提出算法模型。根據(jù)算法模型重新定義適合這個算法模型的芯片架構(gòu)，芯片流片后，再回到物理世界中，求得一個最優(yōu)解。

鄭治泰認為，在計算閉環(huán)中，人類科學(xué)家需要做到三件事：

第一，人類科學(xué)家要持續(xù)提升這顆芯片的有效計算效率和計算能力；

第二，人類科學(xué)家要持續(xù)提升算法的效率；

第三，人類科學(xué)家需根據(jù)要解決的實際問題，進行聯(lián)合調(diào)優(yōu)，得到最優(yōu)解。

地平線團隊認為，用傳統(tǒng)模型來進行計算能力評估的方式是有局限性的。

首先，一些模型早已過時，而要解決未來自動駕駛場景中的實際問題，需要更先進的模型。芯片在設(shè)計的時候，就需要考慮到對未來模型、算法的引進。其次，同一個芯片搭載不同的模型，其利用率也會表現(xiàn)出差異。

基于這兩點，地平線從算法開始進行產(chǎn)品開發(fā)，然后再設(shè)計芯片，進而回到場景中去解決實際問題。

地平線征程5芯片明年發(fā)布，性能有望超競品3倍

據(jù)鄭治泰分享，地平線團隊MAPS評測結(jié)果顯示，市場上的高能效芯片，通常達到約30%的利用率。

人工智能面臨識別、檢測兩個問題。在識別方面，相比市面上現(xiàn)有最好、最普遍的端側(cè)GPU產(chǎn)品，地平線的征程3芯片用8%的功耗實現(xiàn)了50%的MAPS，具備4～6倍的能耗優(yōu)勢；征程5芯片用50%的功耗實現(xiàn)了5倍的MAPS，實現(xiàn)了將近10倍的能耗優(yōu)勢。

檢測方面，地平線征程5芯片用50%的功耗實現(xiàn)了13倍的MAPS，達到26倍的提升。據(jù)稱，明年上述GPU品牌推出的新品，相比其上代產(chǎn)品實現(xiàn)了7倍的性能提升。基于此，地平線將于明年推出的征程5芯片，相比該品牌明年發(fā)布的GPU新品，將有至少3倍的提升。

近期，地平線科學(xué)家定義的有效評估人工智能計算效能的方法，正為整個產(chǎn)業(yè)鏈賦能。鄭治泰提到，地平線希望，產(chǎn)業(yè)鏈伙伴都能使用這一方法，讓整個產(chǎn)業(yè)進入非常良性的循環(huán)。

展望未來，人類科學(xué)家要做的事情并不多，其中包括搭建和調(diào)優(yōu)整個系統(tǒng)、看著機器用海量數(shù)據(jù)輸出結(jié)果等。這就是軟件2.0所暗示的未來，自動駕駛、無人駕駛等人工智能應(yīng)用，將普惠到每個人的生活。

以上是鄭治泰演講內(nèi)容的完整整理。除鄭治泰外，在本屆GTIC 2020 AI芯片創(chuàng)新峰會期間，清華大學(xué)微納電子系尹首一教授，比特大陸、燧原科技、黑芝麻智能、壁仞科技、光子算數(shù)、知存科技、億智電子、豪微科技等芯片創(chuàng)企，全球FPGA領(lǐng)先玩家賽靈思，知名IP供應(yīng)商安謀中國、Imagination，全球EDA巨頭Cadence，以及北極光創(chuàng)投、中芯聚源等知名投資機構(gòu)，分別分享了對AI芯片產(chǎn)業(yè)的觀察與思考。如感興趣更多嘉賓演講的核心干貨，歡迎關(guān)注芯東西后續(xù)推送內(nèi)容。

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點，如有侵權(quán)請聯(lián)系工作人員刪除。