地平線鄭治泰:深度解讀軟件2.0時代AI無人化“玩法” | GTIC2020
在峰會上午場,地平線首席戰(zhàn)略官鄭治泰,發(fā)表了題為《軟件2.0時代AI芯片的挑戰(zhàn)》的演講。
鄭治泰認為,AI系統(tǒng)的數(shù)據(jù)系統(tǒng)和計算系統(tǒng),是軟件2.0時代的兩大要素。在未來,機器將解決AI系統(tǒng)中的大部分問題,而人類科學(xué)家則負責對AI系統(tǒng)的算法參數(shù)進行調(diào)優(yōu)。據(jù)此,地平線推出MAPS(在精度有保障范圍內(nèi)的平均處理速度)評估方法,為人類科學(xué)家調(diào)優(yōu)AI系統(tǒng)提供輔助。MAPS系統(tǒng)可通過可視化、量化的方式,在合理的精度范圍內(nèi),從“快”和“準”兩個維度評估芯片對數(shù)據(jù)的平均處理速度。此外,鄭治泰透露,地平線征程5芯片正在研發(fā)中,將于明年發(fā)布。相比業(yè)界某品牌同樣計劃于明年發(fā)布的GPU新品,征程5芯片有望實現(xiàn)至少3倍的性能提升。 在過去的五年中,地平線取得了比較好的商業(yè)成就。去年到今年,地平線的AI芯片實現(xiàn)量產(chǎn)上車,并已達到10萬的出貨量。明年,地平線將挑戰(zhàn)100萬的AI芯片出貨量。
這些商業(yè)結(jié)果源于地平線對技術(shù)棧、技術(shù)趨勢的把握。在今天看得到的商業(yè)化落地結(jié)果背后,最根本的是面向未來的思考。 借助GTIC 2020 AI芯片創(chuàng)新峰會的平臺,鄭治泰分享了其對軟件2.0時代的思考,并回顧了人工智能發(fā)展的歷史。 鄭治泰認為,在軟件2.0時代,數(shù)據(jù)系統(tǒng)和計算系統(tǒng)兩個部分構(gòu)成了整個AI系統(tǒng)。這其中,無論是數(shù)據(jù)系統(tǒng)還是計算系統(tǒng),均由機器學(xué)習技術(shù)來解決最困難、最復(fù)雜的部分,人已經(jīng)不在其中發(fā)揮太多的作用。 當人和專家不再成為數(shù)據(jù)系統(tǒng)和計算的瓶頸的時候,人類社會將會發(fā)生質(zhì)變,人類將大踏步地進入到AI時代。到那時,由自動駕駛引發(fā)的機器人時代也必將開啟。
未來要實現(xiàn)AI系統(tǒng)的閉環(huán)無人化應(yīng)用
鄭治泰認為,AI問題,特別是面向一個復(fù)雜物理世界的問題,需要一個新的解決范式。 傳統(tǒng)的算法采用的是拆解問題的范式,即把問題分解為子系統(tǒng)、子系統(tǒng)被分解為子模塊、在子模塊應(yīng)用核心的算法?,F(xiàn)在看來,這種方式幾乎失靈了。 大家可以想見,假設(shè)一臺車在北京出廠,它的用戶可能在新疆、海南、沙漠等地。如果這臺車產(chǎn)生的巨量corner case(極端情況),只能依靠專家、標定人員、測試人員進行重新優(yōu)化和迭代算法,那么我們可能永遠無法實現(xiàn)人工智能驅(qū)動的自動駕駛。 也就是說,在未來的時候,我們需要實現(xiàn)整個人工智能系統(tǒng)的閉環(huán)無人化應(yīng)用。 回顧機器視覺的發(fā)展,非常經(jīng)典的應(yīng)用是用機器視覺方法識別圖片中的貓狗。這一應(yīng)用中,計算機識別不同的點陣數(shù)據(jù),并進行數(shù)據(jù)計算。最終,計算機給出一個范式,確定圖片中是貓還是狗。這個問題剛被提出時,大家認為它的難度僅相當于一個本科生暑假作業(yè)的難度。 但是人類社會對AI走進物理世界的追求并未停止。在整個科技向前發(fā)展的過程中,盡管面臨失敗,科學(xué)家仍一次又一次地嘗試,去掌控發(fā)展的節(jié)奏和參與其中。
最初,機器視覺鼻祖馬爾提出“分解”的機器視覺方法。1986年到1990年間,人們用分解的方案解決機器視覺問題,即對整個圖進行描邊,形成有景深信息的二維圖片,再通過完整的幾何計算,抽象出三維物體。后來,人們發(fā)現(xiàn)這一解決方案存在局限性,這是因為當面對不同角度下同一物體的圖片,或者同一角度不同光影下的物體圖片時,計算機無法用上述的拆解數(shù)學(xué)模型去定義物體。 在1990年代,人工智能進入到下一個階段??茖W(xué)家往后退了一步,將所有的物體類別定義出來,全部由數(shù)據(jù)系統(tǒng)使用機器識別方法去實現(xiàn),通過不斷調(diào)優(yōu)、不停移動分類面,提升識別的精度和準確率。 后來,人們又發(fā)現(xiàn)這一方法仍無法解決所有問題。在整個物理世界中,一臺車面對著十分復(fù)雜的外部環(huán)境,人類想用幾個簡單的數(shù)學(xué)公式集合完成整個定義是不可能的。 2012年至今,機器視覺發(fā)生了一個深刻的變革。科學(xué)家和碼農(nóng)開始把整個計算過程全部交由機器去做,讓計算機做識別,而科學(xué)家則承擔模型結(jié)構(gòu)和算法超參數(shù)調(diào)優(yōu)的工作。這一過程中,基于隨機的算法和參數(shù),科學(xué)家評估輸入輸出的結(jié)果,不斷對不正確的gap進行反向調(diào)優(yōu)。 2017年,專家又后退一步,將模型結(jié)構(gòu)設(shè)計也交由機器學(xué)習來設(shè)計,依賴TPU提供的充沛算力。到2019年,機器設(shè)計的模型性能遠超過人類專家設(shè)計出來的模型。 在軟件2.0時代,不增加數(shù)據(jù)的量,而增加計算量的時候,人們發(fā)現(xiàn)模型識別的錯誤率下降一半。如果數(shù)據(jù)量和計算量都提升的話,模型識別錯誤率下降三分之二。增加計算量、增加數(shù)據(jù)量,都可以自動化進行。這意味著機器自動化、持續(xù)降低識別錯誤率是可能的。 為什么在海量數(shù)據(jù)和大模型的時代,機器會比人更加厲害?鄭治泰稱,這是因為人類專家在抽象、局部有限的小數(shù)據(jù)、小模型應(yīng)用中占據(jù)優(yōu)勢。但在大數(shù)據(jù)、大模型的應(yīng)用中,計算機的準確識別和網(wǎng)絡(luò)設(shè)計能力,能夠超常發(fā)揮。 現(xiàn)在,利用機器學(xué)習重新開發(fā)和設(shè)計網(wǎng)絡(luò)模型、重新計算識別的精度協(xié)議的趨勢,并沒有顯示出終止的跡象,這就催生出一個非常重要的可能性,即我們可以面向物理世界,提供AI服務(wù),即全自動無人駕駛汽車等“像人一樣的智能”。
針對AI系統(tǒng)的數(shù)據(jù)和計算,這兩大軟件2.0時代的核心要素,人類工程師在打造數(shù)據(jù)系統(tǒng)的閉環(huán)、提升數(shù)據(jù)閉環(huán)效率的同時,還要結(jié)合軟件和硬件底層的邏輯設(shè)計,逐步提高計算的效率和性能。 基于此,地平線提出MAPS(在精度有保障范圍內(nèi)的平均處理速度)的概念和評估方法。借助這套方法,客戶可以直接面向物理世界,評估AI系統(tǒng)的效能。這一方法并不是單純計算峰值算力或軟件的算法效率,而是計算這兩者在物理世界可接受的精度范圍內(nèi)的處理速度。地平線計算的是什么?是AI系統(tǒng)能跑得多快、跑得多準。 為實現(xiàn)數(shù)據(jù)閉環(huán),幾乎所有的AI公司都在圍繞數(shù)據(jù)的搜集、采集、標注、模型訓(xùn)練進行部署。相較而言,地平線是利用自身的核心技術(shù)能力,給整個行業(yè)賦能。如果客戶需要打造一套完整的數(shù)據(jù)閉環(huán),地平線可以為其提供技術(shù)支持和服務(wù)。 鄭治泰透露,目前,地平線正與國內(nèi)頭部的汽車企業(yè)攜手,打造不少于3~5個聯(lián)合實驗室。 通過這種聯(lián)合實驗室,地平線計劃為車企提供毫無保留的技術(shù)支持。地平線秉持開放賦能的宗旨,可以提供芯片,也可以提供芯片+工具鏈,還可以提供芯片+工具鏈+算法。此外,就算客戶想要完全脫離地平線的技術(shù)產(chǎn)品來打造AI能力,地平線也會100%為客戶賦能。針對物理世界中的海量數(shù)據(jù)問題,地平線以幫助合作伙伴具備真正的AI生產(chǎn)力為目標。
2015年,地平線成立,初創(chuàng)團隊具備算法背景。當時,團隊發(fā)現(xiàn)在處理邊緣計算時,需要在物理世界中定義一個問題,提出算法模型。根據(jù)算法模型重新定義適合這個算法模型的芯片架構(gòu),芯片流片后,再回到物理世界中,求得一個最優(yōu)解。 鄭治泰認為,在計算閉環(huán)中,人類科學(xué)家需要做到三件事: 第一,人類科學(xué)家要持續(xù)提升這顆芯片的有效計算效率和計算能力; 第二,人類科學(xué)家要持續(xù)提升算法的效率; 第三,人類科學(xué)家需根據(jù)要解決的實際問題,進行聯(lián)合調(diào)優(yōu),得到最優(yōu)解。 地平線團隊認為,用傳統(tǒng)模型來進行計算能力評估的方式是有局限性的。 首先,一些模型早已過時,而要解決未來自動駕駛場景中的實際問題,需要更先進的模型。芯片在設(shè)計的時候,就需要考慮到對未來模型、算法的引進。其次,同一個芯片搭載不同的模型,其利用率也會表現(xiàn)出差異。 基于這兩點,地平線從算法開始進行產(chǎn)品開發(fā),然后再設(shè)計芯片,進而回到場景中去解決實際問題。
地平線征程5芯片明年發(fā)布,性能有望超競品3倍
據(jù)鄭治泰分享,地平線團隊MAPS評測結(jié)果顯示,市場上的高能效芯片,通常達到約30%的利用率。 人工智能面臨識別、檢測兩個問題。在識別方面,相比市面上現(xiàn)有最好、最普遍的端側(cè)GPU產(chǎn)品,地平線的征程3芯片用8%的功耗實現(xiàn)了50%的MAPS,具備4~6倍的能耗優(yōu)勢;征程5芯片用50%的功耗實現(xiàn)了5倍的MAPS,實現(xiàn)了將近10倍的能耗優(yōu)勢。 檢測方面,地平線征程5芯片用50%的功耗實現(xiàn)了13倍的MAPS,達到26倍的提升。據(jù)稱,明年上述GPU品牌推出的新品,相比其上代產(chǎn)品實現(xiàn)了7倍的性能提升。基于此,地平線將于明年推出的征程5芯片,相比該品牌明年發(fā)布的GPU新品,將有至少3倍的提升。 近期,地平線科學(xué)家定義的有效評估人工智能計算效能的方法,正為整個產(chǎn)業(yè)鏈賦能。鄭治泰提到,地平線希望,產(chǎn)業(yè)鏈伙伴都能使用這一方法,讓整個產(chǎn)業(yè)進入非常良性的循環(huán)。 展望未來,人類科學(xué)家要做的事情并不多,其中包括搭建和調(diào)優(yōu)整個系統(tǒng)、看著機器用海量數(shù)據(jù)輸出結(jié)果等。這就是軟件2.0所暗示的未來,自動駕駛、無人駕駛等人工智能應(yīng)用,將普惠到每個人的生活。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。