大算力芯片

算力256TOPS，典型功耗35W，存算一體芯片殺入智能駕駛

第一電動(dòng)大牛作者 HiEV 2023-05-10 20:28

作者 | 張祥威

編輯 | 德新

“最高物理算力256 TOPS，典型功耗35W，基于12nm制程工藝?！?nbsp;

5月10日，后摩智能發(fā)布首款基于存算一體架構(gòu)的智駕芯片——鴻途?H30，并公布上述關(guān)鍵指標(biāo)。

算力、數(shù)據(jù)和算法，并稱(chēng)AI的三大核心要素。其中，算力屬于基礎(chǔ)設(shè)施，又被稱(chēng)為新時(shí)代的原油。隨著ChatGPT語(yǔ)言大模型的出現(xiàn)，AI迎來(lái)了自己的iPhone時(shí)刻，算力的重要性也愈加凸顯。

走在最前的英偉達(dá)，不斷推出更高算力的芯片，一些玩家選擇了跟隨，另外一些選擇另辟道路，通過(guò)存算一體、量子計(jì)算等突破算力瓶頸。

后摩智能的存算一體芯片H30，便是一道新的解題思路，也讓主機(jī)廠(chǎng)、Tier 1有了更多新選擇。

一、飆升的算力需求，待打破的“存儲(chǔ)、功耗”墻

英偉達(dá)旗艦AI芯片H100，隨著AI生成式大模型受到廣泛關(guān)注，售價(jià)近期一度被炒到46000美金。

H100是英偉達(dá)于去年推出的一款全新架構(gòu)的GPU芯片。

8塊H100，再加上4個(gè)NVLink可以組合一個(gè)DGX H100，AI算力高達(dá)32 PetaFlops。英偉達(dá)CEO黃仁勛稱(chēng)，20塊H100就可以承載全球互聯(lián)網(wǎng)的流量。

熱衷自動(dòng)駕駛的特斯拉CEO馬斯克，不久前購(gòu)買(mǎi)了數(shù)千塊H100，笑稱(chēng)“看起來(lái)每個(gè)人和他們的狗此時(shí)都在買(mǎi)GPU。”

H100大熱，體現(xiàn)了市場(chǎng)對(duì)于 芯片算力需求飆升，時(shí)代進(jìn)入了一個(gè)AI爆發(fā)的新階段。

不過(guò)，算力飆升后也讓大家看到了芯片面臨的瓶頸，即： 存儲(chǔ)墻和功耗墻。

目前市面上的大多數(shù)芯片，均基于1945年提出的馮·諾依曼計(jì)算系統(tǒng)進(jìn)行設(shè)計(jì)，計(jì)算和存儲(chǔ)功能分別由中央處理器和存儲(chǔ)器完成。

在這一架構(gòu)中，每次計(jì)算需要先讀取內(nèi)存的數(shù)據(jù)，計(jì)算后再存回內(nèi)存，大部分過(guò)程都在讀取和存儲(chǔ)數(shù)據(jù)。

處理器的性能跟隨摩爾定律逐年提升，存儲(chǔ)器發(fā)展滯后。

隨著數(shù)據(jù)處理量增大，存儲(chǔ)速度跟不上數(shù)據(jù)處理速度，形成了“存儲(chǔ)墻”。數(shù)據(jù)在處理器和存儲(chǔ)器之間來(lái)回搬運(yùn)，還造成了功耗損失，形成了“功耗墻”。

為了拆掉兩塊墻，芯片領(lǐng)域提出存算一體的新架構(gòu)，直接利用存儲(chǔ)器進(jìn)行數(shù)據(jù)處理，這種新架構(gòu)具備 大算力、低功耗、低延時(shí)等優(yōu)點(diǎn)。

后摩智能創(chuàng)始人兼CEO吳強(qiáng)的偶像是Jim Keller，后者是操刀過(guò)特斯拉FSD芯片的大神。Jim Keller曾說(shuō)過(guò)，“不滿(mǎn)于常規(guī)的改良，而是要做底層的重構(gòu)和創(chuàng)新。”

因此，兩年前創(chuàng)立后摩智能時(shí)，吳強(qiáng)選擇了一個(gè)不依賴(lài)先進(jìn)工藝，通過(guò)底層架構(gòu)創(chuàng)新來(lái)實(shí)現(xiàn)AI計(jì)算效率的新方向。

這就有了后來(lái)的基于存算一體架構(gòu)的鴻途?系列芯片。

二、面向智能駕駛，H30已支持點(diǎn)云、BEV網(wǎng)絡(luò)

“ 256TOPS是物理算力，不是市面上常說(shuō)的稀疏虛擬算力?！眳菑?qiáng)向大家介紹H30芯片時(shí)重點(diǎn)強(qiáng)調(diào)。

物理算力是指芯片的理論峰值算力。

有人將算法比作公式，將物理算力比作人的智商。從物理算力的維度，市面上已量產(chǎn)的國(guó)產(chǎn)智駕芯片，基本上都不如H30。

H30的能效比也非常高。

基于更為成熟的 SRAM 存儲(chǔ)介質(zhì)，采用數(shù)字存算一體架構(gòu)，H30在INT8 數(shù)據(jù)精度下AI 核心IPU 能效比高達(dá) 15 Tops/W，是傳統(tǒng)架構(gòu)芯片的7 倍以上。

根據(jù)后摩實(shí)驗(yàn)室及MLPerf公開(kāi)測(cè)試結(jié)果，以經(jīng)典的基礎(chǔ)網(wǎng)絡(luò)Resnet50為例，在 Batch Size 等于1 和 8 的條件下，分別達(dá)到了 8700 幀/秒和 10300 幀/秒的性能，是英偉達(dá)基于8nm芯片性能的5.7倍和2.3倍。

簡(jiǎn)單來(lái)說(shuō)， H30 在芯片性能提升2倍的同時(shí)，功耗減少了50%。

那么，這塊芯片能做什么？

后摩智能將第一款芯片產(chǎn)品的應(yīng)用場(chǎng)景選在了智能駕駛領(lǐng)域。

吳強(qiáng)認(rèn)為，智能駕駛芯片一定是要 無(wú)限接近于人腦的計(jì)算方式和效率，而存算一體的價(jià)值正在于此，與智能駕駛的終局需求天然吻合。

作為一款面向智能駕駛的芯片，H30對(duì)于當(dāng)下熱門(mén)的神經(jīng)網(wǎng)絡(luò)均可以支持。而且，H30的架構(gòu)專(zhuān)門(mén)針對(duì)智能駕駛場(chǎng)景，在低延時(shí)下性能可以更加充分地展現(xiàn)。

后摩智能表示，一些高階自動(dòng)駕駛領(lǐng)域常用的經(jīng)典CV網(wǎng)絡(luò)和自動(dòng)駕駛網(wǎng)絡(luò)等，目前已經(jīng)成功移植到H30上，比如點(diǎn)云網(wǎng)絡(luò)、BEV網(wǎng)絡(luò)等。

此外，基于H30的智駕方案已經(jīng)部署在后摩智能合作伙伴的無(wú)人小車(chē)上。比如，后摩智能與新石器無(wú)人車(chē)合作的無(wú)人駕駛解決方案，便是基于存算一體芯片。

基于H30，后摩智能還打造了力馭智能駕駛硬件平臺(tái)，作為主機(jī)廠(chǎng)面向智能駕駛的參考設(shè)計(jì)和評(píng)估平臺(tái)。

官方數(shù)據(jù)顯示，力馭的CPU算力為200Kdmips，AI算力達(dá)到256 TOPS（INT8物理算力）。

按照規(guī)劃，基于第一代產(chǎn)品H30的力馭計(jì)算平臺(tái)將在 今年6月向Alpha客戶(hù)送測(cè)。第二代產(chǎn)品H50將于明年一季度回片，支持主機(jī)廠(chǎng)客戶(hù)2025年的量產(chǎn)車(chē)型。

三、基于存算一體，變革底層架構(gòu)

讓H30擁有如此成績(jī)的，是一套全新的架構(gòu)。

主流芯片產(chǎn)品中，英偉達(dá)、高通、地平線(xiàn)等自動(dòng)駕駛的芯片，基于馮·諾依曼架構(gòu)，也就是存儲(chǔ)分離。

H30則基于存算一體，從架構(gòu)上進(jìn)行底層創(chuàng)新。

后摩智能聯(lián)合創(chuàng)始人兼研發(fā)副總裁陳亮總結(jié)，H30這款芯片實(shí)現(xiàn)了六項(xiàng)技術(shù)突破：

大算力、全精度、低功耗、車(chē)規(guī)級(jí)、可量產(chǎn)、通用性。

后摩智能自研了IPU處理器架構(gòu)，第一代IPU天樞架構(gòu)專(zhuān)為智能駕駛打造。

天樞架構(gòu)的設(shè)計(jì)思路是，采用多核、多硬件線(xiàn)程的方式來(lái)靈活擴(kuò)展算力，AI 計(jì)算可以在核內(nèi)完成端到端處理，保證通用性。

H30芯片里面有 4個(gè)IPU核，部署在系統(tǒng)總線(xiàn)NoC上。

每個(gè)IPU 核又由 4個(gè)Tile組成，每個(gè)Tile對(duì)應(yīng)一個(gè)硬件線(xiàn)程，既可以獨(dú)立進(jìn)行不同任務(wù)的計(jì)算，又可以聯(lián)合進(jìn)行同一個(gè)任務(wù)的計(jì)算。

每個(gè)Tile的內(nèi)部，包含CPU、Tensor Engine、CIM、Feature Buffer、Special Function Unit、Vector Processor、DMA、Shared Memory&Controller。

其中，CPU可以調(diào)度這些執(zhí)行單元，也可以做一些對(duì)算力要求不高的計(jì)算。

這些計(jì)算單元，還可以直接共享一個(gè)多Bank的共性存儲(chǔ)資源。

基于后摩的IPU架構(gòu)，AI計(jì)算不需要在CPU、GPU、DSP等不同的處理器之間分配任務(wù)，而是可以在核內(nèi)完成端到端的計(jì)算。

此外，后摩智能設(shè)計(jì)了專(zhuān)用的數(shù)據(jù)傳輸總線(xiàn)，搭配多通道，可以在4個(gè)Tile和各個(gè)IPU 核之間建立高速的數(shù)據(jù)傳輸通道。

為了發(fā)揮數(shù)據(jù)復(fù)用的特性，后摩智能還設(shè)計(jì)了多播的傳輸機(jī)制，一個(gè)Tile里數(shù)據(jù)，可以通過(guò)一次DMA傳輸，廣播給其他多個(gè)Tile，從而不需要多個(gè)Tile多次讀取數(shù)據(jù)。

存算一體的架構(gòu)，讓H30可以更好地計(jì)算與存儲(chǔ)， AI Core計(jì)算利用率達(dá)到80%以上。

最后，由于具備良好的擴(kuò)展性，讓這款芯片有了更多想象空間。

據(jù)了解，后摩智能的下一代芯片，將支持?jǐn)U展更多核，基于Mesh互聯(lián)結(jié)構(gòu)，可以將計(jì)算單元靈活配置，實(shí)現(xiàn)算力規(guī)模的可大可小。

可以合理推測(cè)，后摩智能的下一代架構(gòu)的芯片有望支持類(lèi)似GPT的大模型，甚至有可能應(yīng)用于更大算力的自動(dòng)駕駛場(chǎng)景。

實(shí)際上，存算一體領(lǐng)域，不止有后摩智能一家，其它還包括知存科技、億鑄科技等，不同的是，后摩智能選擇了智能駕駛賽道作為落地。

隨著算力需求的爆發(fā)和更多芯片產(chǎn)品落地，存算一體正在獲得越來(lái)越多的認(rèn)可。

總之，在降本增效的趨勢(shì)下，擁有成本優(yōu)勢(shì)的存算一體智駕芯片，也讓主機(jī)廠(chǎng)在英偉達(dá)、地平線(xiàn)等芯片外，有了更多新的選擇。

退一步說(shuō)，站在芯片安全的角度，存算一體智駕芯片可以與先進(jìn)制程工藝解綁，也讓智能汽車(chē)被“卡脖子”的隱患得到了一定緩解。

來(lái)源：第一電動(dòng)網(wǎng)

作者：HiEV

本文地址：http://www.vlxuusu.cn/kol/202289

返回第一電動(dòng)網(wǎng)首頁(yè) >

文中圖片源自互聯(lián)網(wǎng)，如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com（#替換成@）刪除。

贊23

分享到：

發(fā)表評(píng)論

新聞推薦

大牛作者

HiEV

HiEV大蒜粒車(chē)研所，定位于智能汽車(chē)時(shí)代的媒體與信息服務(wù)平臺(tái)。

356
文章
15020
獲贊

輔助駕駛新強(qiáng)標(biāo)進(jìn)入公示期，傳聞中「最嚴(yán)法規(guī)」將給行業(yè)帶來(lái)哪些沖擊？

從慕尼黑到新大陸：知行科技「智駕」與「機(jī)器人」的雙行線(xiàn)

從無(wú)圖到輕圖，大模型時(shí)代，圖商的新角逐

閱讀更多文章

大牛說(shuō) 我要投稿

熱文榜

日排行

2 雨霧天氣，輔助駕駛安全嗎？

1 EV晨報(bào) | 比亞迪Q3營(yíng)收近2000億，海外市場(chǎng)爆發(fā)直逼奇瑞；上汽集團(tuán)Q3凈利20.8億同比暴增644.9%；馬斯克稱(chēng)特斯拉自動(dòng)駕駛技術(shù)將普及最快

2 1-9月10萬(wàn)元內(nèi)爆款車(chē)TOP22

3 四維圖新AI轉(zhuǎn)型考：智駕訂單585萬(wàn)單，虧損7億，路能走通嗎？

4 EV晨報(bào) | 雷軍親自帶隊(duì)！小米汽車(chē)成立架構(gòu)部；華為余承東官宣鴻蒙智行僅用43個(gè)月累計(jì)交付破百萬(wàn)；OpenAI宣布完成資本重組

5 EV晨報(bào) | 廣汽旗下華望汽車(chē)增資至21億；史上首家！英偉達(dá)市值突破5萬(wàn)億美元；馬斯克稱(chēng)自動(dòng)駕駛達(dá)到“卓越”的水平相當(dāng)困難

6 三電系統(tǒng)持續(xù)升級(jí) 技術(shù)打磨精細(xì)化 ——記“中國(guó)心”2025年度十佳新能源汽車(chē)動(dòng)力系統(tǒng)實(shí)車(chē)測(cè)試

7 FX Super One中東率先上市！售價(jià)30.9萬(wàn)迪拉姆，伊涅斯塔是首位車(chē)主，創(chuàng)新加密資產(chǎn)購(gòu)車(chē)模式

8 市場(chǎng)細(xì)分技術(shù)尋優(yōu) ——記“中國(guó)心”2025年度十佳發(fā)動(dòng)機(jī)及混動(dòng)系統(tǒng)入圍實(shí)車(chē)測(cè)試

9 10月新勢(shì)力榜：零跑首破7萬(wàn)輛，蔚來(lái)小鵬再創(chuàng)新高

10 6.88萬(wàn)起，大爆款吉利銀河星耀6，月銷(xiāo)2萬(wàn)臺(tái)穩(wěn)了？

選擇車(chē)型
上牌城市	購(gòu)車(chē)城市
姓名
手機(jī)號(hào)
驗(yàn)證碼
	xxx

手机免费看av网站|婷婷丁香在线观看|日本另类在线观看|国产刺激高潮免|亚洲一区亚洲二区|激情视频在线播放视频一区|亚洲五月蜜臀aV|丝袜美腿亚洲av电影|欧美多人性爱成人综合在线|日韩黄色成人视频

電動(dòng)汽車(chē)

算力256TOPS，典型功耗35W，存算一體芯片殺入智能駕駛

一、飆升的算力需求，待打破的“存儲(chǔ)、功耗”墻

二、面向智能駕駛，H30已支持點(diǎn)云、BEV網(wǎng)絡(luò)

三、基于存算一體，變革底層架構(gòu)

汽車(chē)之心

阿喵汽車(chē)

NE時(shí)代

HiEV

電動(dòng)汽車(chē)用戶(hù)聯(lián)盟

手机免费看av网站|婷婷丁香在线观看|日本另类在线观看|国产刺激高潮免|亚洲一区亚洲二区|激情视频在线播放视频一区|亚洲五月蜜臀aV|丝袜美腿亚洲av电影|欧美多人性爱成人综合在线|日韩黄色成人视频

算力256TOPS，典型功耗35W，存算一體芯片殺入智能駕駛

一、飆升的算力需求，待打破的“存儲(chǔ)、功耗”墻

二、面向智能駕駛，H30已支持點(diǎn)云、BEV網(wǎng)絡(luò)

三、基于存算一體，變革底層架構(gòu)

汽車(chē)之心

阿喵汽車(chē)

NE時(shí)代

HiEV

電動(dòng)汽車(chē)用戶(hù)聯(lián)盟

算力256TOPS，典型功耗35W，存算一體芯片殺入智能駕駛

一、飆升的算力需求，待打破的“存儲(chǔ)、功耗”墻

二、面向智能駕駛，H30已支持點(diǎn)云、BEV網(wǎng)絡(luò)

三、基于存算一體，變革底層架構(gòu)