東芝開(kāi)發(fā)出帶DNN的汽車(chē)級(jí)圖像識(shí)別芯片（SoC）

作者：山田裕時(shí)間：2019-05-07 來(lái)源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

　　2019年2月，東芝開(kāi)發(fā)出一款汽車(chē)級(jí)圖像識(shí)別芯片（SoC），與東芝上一代產(chǎn)品相比，該產(chǎn)品使深度學(xué)習(xí)加速器的速度提升10倍，功效提高4倍。由于新產(chǎn)品加入了深度神經(jīng)網(wǎng)絡(luò)（DNN）模仿大腦神經(jīng)網(wǎng)絡(luò)的算法，與傳統(tǒng)模式識(shí)別和機(jī)器學(xué)習(xí)相比，DNN的識(shí)別處理精度要高得多，預(yù)計(jì)該產(chǎn)品將會(huì)在汽車(chē)領(lǐng)域得到廣泛應(yīng)用。這也是東芝目前最新的AI方向的產(chǎn)品。

本文引用地址：http://m.ptau.cn/article/201905/400294.htm

　　值得一提的是，東芝的這項(xiàng)技術(shù)成果已于2019年2月19日在美國(guó)舊金山舉行的2019 IEEE國(guó)際固態(tài)電路會(huì)議（ISSCC）上公之于眾，并且新系統(tǒng)級(jí)芯片符合全球汽車(chē)功能安全標(biāo)準(zhǔn)ISO26262的要求。

　　東芝通過(guò)在硬件上實(shí)現(xiàn)深度學(xué)習(xí)的DNN加速器解決了這一難題。它具有三大特點(diǎn)。

　　? 并行MAC單元。DNN處理需要大量MAC計(jì)算。東芝的新產(chǎn)品有四個(gè)處理器，每個(gè)處理器包含256個(gè)MAC單元。因此提高了DNN的處理速度。

　　? 減少了動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器（DRAM）存取。傳統(tǒng)的系統(tǒng)級(jí)芯片沒(méi)有本地內(nèi)存，無(wú)法在靠近DNN執(zhí)行單元的位置保存臨時(shí)數(shù)據(jù)，并且在訪問(wèn)本地內(nèi)存時(shí)會(huì)產(chǎn)生較大功耗。同時(shí)，加載用于MAC計(jì)算的加權(quán)數(shù)據(jù)也會(huì)產(chǎn)生較大功耗。東芝新產(chǎn)品可在DNN執(zhí)行單元附近執(zhí)行靜態(tài)隨機(jī)存取存儲(chǔ)器（SRAM），并將DNN處理分為多個(gè)子處理塊，因此可將臨時(shí)數(shù)據(jù)保存在SRAM內(nèi)，從而減少了DRAM存取。此外，東芝還在加速器上增加了一個(gè)解壓縮單元?？赏ㄟ^(guò)解壓縮單元加載預(yù)先壓縮并存儲(chǔ)在DRAM中的加權(quán)數(shù)據(jù)。因此，降低了加載來(lái)自DRAM的加權(quán)數(shù)據(jù)時(shí)產(chǎn)生的功耗。

　　? 減少了SRAM存取。傳統(tǒng)深度學(xué)習(xí)需要在處理DNN的每一層之后訪問(wèn)DRAM，因此功耗過(guò)高。該加速器在DNN的DNN執(zhí)行單元中設(shè)計(jì)有管線層結(jié)構(gòu)，以便在一次SRAM存取期間執(zhí)行一系列DNN計(jì)算。