流量至上、追星現(xiàn)場(chǎng),這兩個(gè)詞應(yīng)該是大多數(shù)人在今年北京車展上的第一感受。
車企的宣發(fā)重點(diǎn),從技術(shù)分享和戰(zhàn)略展望轉(zhuǎn)向了車型介紹,甚至不少車企在車展現(xiàn)場(chǎng)直接安排上了帶貨主播。
媒體的關(guān)注重點(diǎn),也跟著車企的節(jié)奏轉(zhuǎn)移,來(lái)到了自帶流量的雷軍和周鴻祎身上。
然而這場(chǎng)「流量盛宴」的背后,暗藏了價(jià)格戰(zhàn)下車企對(duì)于銷量的焦慮——一邊是友商瘋狂降價(jià),一邊是智駕技術(shù)不斷迭代,降價(jià)提質(zhì)的雙重壓力之下,能帶動(dòng)銷量的流量成了車企的救命稻草。
如果走出會(huì)展中心的 8 個(gè)主要展館,來(lái)到周邊供應(yīng)商的展臺(tái),對(duì)這份焦慮的感知會(huì)更加明顯。
畢竟車企在智駕領(lǐng)域降價(jià)提質(zhì)的壓力,最終還是會(huì)傳導(dǎo)到供應(yīng)商身上。
車企忙著展示車、銷售車,智駕產(chǎn)業(yè)鏈上的供應(yīng)商則在技術(shù)上鉆起了牛角尖。
從英偉達(dá)、騰訊云、元戎啟行、安霸科技等多家供應(yīng)商的描繪中,逐漸拼湊出 2024 年智駕技術(shù)的發(fā)展藍(lán)圖——除了降本這個(gè)避不開的話題以外,各家談到最多的關(guān)鍵詞就是大模型和端到端,以及衍生出的算力不足恐懼癥、數(shù)據(jù)饑渴、無(wú)高精地圖、前融合與規(guī)則算法。
大模型標(biāo)志著 AI 定義汽車觀念的形成,給行業(yè)帶來(lái)了算力不足恐懼癥,以及數(shù)據(jù)饑渴。
端到端大模型則意味著行業(yè)進(jìn)入了 AI 定義汽車的 2.0 時(shí)代,無(wú)高精地圖、前融合與強(qiáng)大的規(guī)則算法能力是實(shí)現(xiàn)端到端的技術(shù)關(guān)鍵。
01、大模型時(shí)代:算力不足恐懼癥和數(shù)據(jù)饑渴
「好像現(xiàn)在不提大模型,大家都不知道怎么問(wèn)問(wèn)題了?!?/span>
在接連回答了十幾個(gè)問(wèn)題之后,騰訊智慧出行副總裁劉澍泉發(fā)出了如上的感慨,這也是大多數(shù)智駕產(chǎn)業(yè)鏈上的供應(yīng)商都會(huì)遇到的問(wèn)題——不管你是做芯片的,還是做智駕方案的。
大模型之所以成為關(guān)注重點(diǎn),在于其重塑了自動(dòng)駕駛的技術(shù)路線。
英偉達(dá)全球副總裁吳新宙認(rèn)為,自動(dòng)駕駛是三段式的發(fā)展:
第一階段的自動(dòng)駕駛系統(tǒng)完全基于規(guī)則,有著大量人工 Engineer Feature(工程師特征),目前已經(jīng)過(guò)時(shí)。
第二階段的自動(dòng)駕駛方案是規(guī)則算法與 AI(大模型)相結(jié)合,目前感知部分幾乎全部交給了模型,預(yù)測(cè)和規(guī)劃部分則是人工規(guī)則和 AI 模型結(jié)合,屬于目前的主流方案,也是 AI 定義汽車(智駕)的 1.0 時(shí)代。
第三階段的自動(dòng)駕駛方案就是端到端大模型的方式,目前特斯拉的 FSD 就是基于此方案打造的,屬于 AI 定義汽車(智駕)的 2.0 時(shí)代。
自從大模型被引入自動(dòng)駕駛之后,汽車自動(dòng)駕駛的開發(fā)流程也發(fā)生了變化。
在軟件定義汽車時(shí)代,工程師要先寫好智駕系統(tǒng)的規(guī)則代碼,隨后進(jìn)行大量路測(cè)收集問(wèn)題,再針對(duì)性的修改智駕代碼。
而到了 AI 定義汽車時(shí)代,智駕開發(fā)分成了云端和車端兩部分。云端負(fù)責(zé)模型訓(xùn)練和仿真驗(yàn)證,隨后將云端成熟的智駕模型通過(guò) OTA 部署到車端,再通過(guò)車端回傳的數(shù)據(jù)加強(qiáng)云端模型的訓(xùn)練。
大模型的出現(xiàn),無(wú)疑提升了智駕系統(tǒng)的能力上限,并加快了開發(fā)、迭代流程,但是也給車企帶來(lái)了新的問(wèn)題——算力不足恐懼癥和數(shù)據(jù)饑渴。
想在云端訓(xùn)練出優(yōu)秀的大模型,對(duì)算力的需求非常高。
早在去年,特斯拉便砸錢 3 億美元購(gòu)買了 1 萬(wàn)塊英偉達(dá) H100 芯片,將云端算力堆到了 10 EFLOPS,而在 4 月份的 Q1 財(cái)報(bào)上,特斯拉公布已投入使用了 3.5 萬(wàn)臺(tái)英偉達(dá) H100,并計(jì)劃在年底增加至 8.5 萬(wàn)臺(tái)。
國(guó)內(nèi)智駕第一梯隊(duì)的華為,云端算力也從去年 12 月的 2.8 EFLOPS 增加至 3 月的 3.3 EFLOPS,4 月份又更新至 3.5 EFLOPS。
在堆云端算力這件事上,車企只有三個(gè)選擇:
和特斯拉的 Dojo 一樣從零做起,自研高算力芯片。雖然成功后收益很高,但要面臨技術(shù)和資金雙重壓力,目前特斯拉 Dojo 超算中心的進(jìn)度同樣不明朗,屬于高風(fēng)險(xiǎn)高收益的方式。
購(gòu)買英偉達(dá)的芯片自建超算中心,雖然比第一種方式簡(jiǎn)單了不少,但是自建云端超算中心的難度依舊不亞于造車。
與國(guó)內(nèi)現(xiàn)有的云服務(wù)商合作,共建云端超算中心。
綜合來(lái)看,第三種方式是目前國(guó)內(nèi)車企的共同選擇。問(wèn)界、極越、蔚小理等分別選擇了華為云、百度云、阿里云、火山引擎和騰訊云等合作伙伴,云端算力正成為智駕開發(fā)的數(shù)字基建。
卷完了云端算力之后,車端算力成了第二戰(zhàn)場(chǎng)。
「做好自動(dòng)駕駛的第一步是重建事件,重建的事件越真實(shí)、越一對(duì)一、越穩(wěn)定、距離越遠(yuǎn),智駕的基本功也就越扎實(shí)」,元戎啟行 CEO 周光在采 訪中表示,「如果智駕連重建事件都做不好,又何談后面的理解、交互呢?」
而完美的重建事件,則非常考驗(yàn)傳感器、感知算法和車端算力之間的綜合能力。
傳感器越多、精度越高,收集的信息便越多,構(gòu)建事件也就越容易,但是相應(yīng)的對(duì)車端算力的要求也越高。
在目前智駕白熱化的競(jìng)爭(zhēng)階段,通過(guò)優(yōu)化算法減少對(duì)傳感器數(shù)量的依賴「太慢」,先加大算力跟上節(jié)奏顯然更「劃算」。
為了應(yīng)對(duì)車端算力日增的需求,芯片廠商紛紛推出了更高算力的車端芯片。
英偉達(dá)推出了單顆芯片算力超過(guò) 1000TOPS 的 Thor,安霸科技也推出了 750TOPS 算力的 CV3-AD685 芯片,為車企后續(xù)更高的算力需求提供保障。
不過(guò)在車端芯片上,算力高不是唯一標(biāo)準(zhǔn),還必須要考慮架構(gòu)。
安霸科技中國(guó)區(qū)總經(jīng)理馮羽濤告訴汽車之心,智駕芯片雖然是底層硬件,但是開發(fā)過(guò)程非常強(qiáng)調(diào)「算法優(yōu)先」——比如 Transformer 架構(gòu)出現(xiàn)后,很多芯片由于沒有提前適配所以沒辦法運(yùn)行,要想跟上需求的發(fā)展,就必須更加關(guān)注前沿算法。
安霸科技總裁兼首席執(zhí)行官王奉民補(bǔ)充了一個(gè)有趣的案例:
安霸科技在 2018 年時(shí),發(fā)現(xiàn)特斯拉的報(bào)告中提到了正在研究新一代的算法,雖然沒提到具體的架構(gòu),但是安霸科技從描述中推斷特斯拉要用到的算法應(yīng)該是 2017 年提出的 Transformer,便開始針對(duì)該算法進(jìn)行芯片開發(fā),最終在 2018 年推出了支持 transformer 的 CV2 系列芯片。
當(dāng)然,這次豪賭背后同樣存在風(fēng)險(xiǎn)——安霸的智駕芯片流片一次的成本大概在 2000 萬(wàn)美元,所以芯片廠商不僅要關(guān)注前沿算法,還要能判斷算法的發(fā)展趨勢(shì)。
供應(yīng)商們解決了車企的算力不足恐懼癥后,還要繼續(xù)滿足車企的數(shù)據(jù)饑渴。
元戎啟行 CEO 周光多次強(qiáng)調(diào),要想做好大模型、尤其是端到端大模型的自動(dòng)駕駛,就必須要有大量數(shù)據(jù),沒有量產(chǎn)數(shù)據(jù)支撐就是死路一條。
供應(yīng)商雖然無(wú)法為車企提供量產(chǎn)數(shù)據(jù),但是可以用大模型的方式,提供「平替」數(shù)據(jù)。
英偉達(dá)和騰訊均強(qiáng)調(diào)了基于生成式 AI 的「仿真」環(huán)節(jié)。通過(guò)生成式 AI,車企可以生成海量仿真數(shù)據(jù)用來(lái)訓(xùn)練云端大模型。
雖然和真實(shí)數(shù)據(jù)相比,AI 仿真訓(xùn)練還存在置信度和覆蓋度等方面的問(wèn)題,但是對(duì)于本就缺乏真實(shí)數(shù)據(jù)的車企而言,生成式 AI 不僅讓訓(xùn)練大模型成為可能,還能加快智駕系統(tǒng)的開發(fā)流程。
訓(xùn)練后的模型在 OTA 部署到車端之前,可以先在仿真環(huán)境中進(jìn)行測(cè)試和驗(yàn)證,更快更高效地排查問(wèn)題。
解決了算力和數(shù)據(jù)的問(wèn)題,車企才算邁入 AI 定義智駕的 1.0 時(shí)代。
02、端到端大模型:無(wú)圖、前融合、規(guī)則算法缺一不可
從 AI 定義智駕的 1.0 時(shí)代進(jìn)入 2.0 時(shí)代,核心是實(shí)現(xiàn)端到端的智駕大模型。
而要做到端到端,就面臨著三個(gè)門檻:
無(wú)高精地圖、前融合,以及強(qiáng)大的規(guī)則算法做支持。
首先是業(yè)內(nèi)喊了一年多的去高精地圖,關(guān)注重點(diǎn)普遍集中在覆蓋面積、采集成本和地圖鮮度上,但是即使解決了上述問(wèn)題,不去掉高精地圖依舊無(wú)法實(shí)現(xiàn)端到端。
在這一點(diǎn)上,英偉達(dá)和元戎啟行表達(dá)了相似的觀點(diǎn)——真正的端到端大模型是擬人的,擅長(zhǎng)邏輯推理而非計(jì)算。
目前的高精地圖,本質(zhì)上還是給機(jī)器看的地圖,用的是機(jī)器語(yǔ)言。而端到端大模型的思考方式更類似于人腦,在處理機(jī)器語(yǔ)言的能力上非常薄弱,看不懂高精地圖。
端到端智駕大模型需要的地圖,是人類也能看的懂的導(dǎo)航地圖。
元戎啟行推出的端到端智駕平臺(tái) IO,使用的就是騰訊提供的導(dǎo)航級(jí)地圖。最近傳聞即將在華落地的特斯拉 FSD,也被曝出將在百度提供的車道級(jí)導(dǎo)航地圖上進(jìn)行部署。
端到端落地的第二個(gè)前提,是多傳感器信息必須要做前融合。
在以往的智駕方案中,各個(gè)傳感器中收集到的信息會(huì)先用人工規(guī)則篩選一遍,再將人類認(rèn)為有用的信息進(jìn)行融合,最后交由智駕系統(tǒng)使用。
但是端到端大模型和大腦一樣,對(duì)于人類程序員來(lái)說(shuō)像一個(gè)「黑盒」,如果還是按照人工規(guī)則先篩一邊傳感器的信息,無(wú)疑會(huì)遺漏掉很多對(duì)于端到端大模型有用的信息。
而先融合的方式,能在成本不變甚至減少的情況下,大幅提升傳感器信息的準(zhǔn)確性。
基于該理念,安霸做了一款基于 CV3 中央域控的 4D 成像雷達(dá),在毫米波雷達(dá)上不放任何處理芯片,將雷達(dá)收集到的信息全部傳回中央域控,由高算力的中央域控融合處理多個(gè)傳感器的信息——通過(guò)這種方式,可以大幅提高毫米波雷達(dá)的感知能力。
想要做好端到端智駕方案的第三個(gè)條件,是車企具備強(qiáng)大的基于規(guī)則算法的智駕方案。
雖然端到端智駕大模型成功的標(biāo)志,就是盡量減少人工編寫的規(guī)則算法,但是對(duì)于端到端智駕系統(tǒng)而言,則離不開上一代基于人工規(guī)則的智駕算法。
元戎啟行和安霸都提到,目前特斯拉的智駕系統(tǒng)后臺(tái)同時(shí)運(yùn)行著 V11(規(guī)則算法)和 V12(端到端大模型)兩套方案,在不同的路況下會(huì)切換使用。
兩套方案并行的原因主要有二:
第一點(diǎn),是兩套方案的能力互補(bǔ)。
貼近人腦的端到端大模型,具備更強(qiáng)的推理能力和博弈能力——比如遇到突發(fā)情況時(shí),規(guī)則算法只會(huì)根據(jù)規(guī)則死板執(zhí)行命令,而端到端則可以根據(jù)理解靈活操作。
基于人工代碼的規(guī)則算法,在計(jì)算能力上更具優(yōu)勢(shì)——比如在泊車時(shí),規(guī)則算法可以通過(guò)精確的計(jì)算,選擇最完美的倒車入庫(kù)路徑,而端到端則會(huì)像人一樣邊開邊調(diào)整,不斷揉庫(kù)。
第二點(diǎn),是目前的端到端大模型才剛剛起步,需要不斷學(xué)習(xí)。
吳新宙用了一個(gè)很形象的比喻來(lái)描述端到端大模型和上一代規(guī)則算法的關(guān)系,端到端大模型天賦更高,未來(lái)可以成為博士,但是在成長(zhǎng)的過(guò)程中,也需要小學(xué)老師、初中老師去教導(dǎo),而這些老師,就是規(guī)則算法。
吳新宙和周光也給出了共同的預(yù)判:
目前的端到端大模型處于起步階段,還需要不斷成長(zhǎng)才能趨于完美,因此在未來(lái)幾年,端到端大模型和規(guī)則算法兩套方案相輔相成應(yīng)該是大勢(shì)所趨。
AI 定義智駕 1.0 時(shí)代對(duì)算力和數(shù)據(jù)等硬實(shí)力的需求,或許可以通過(guò)供應(yīng)商提供的數(shù)字基建來(lái)解決。
但是想邁入 AI 定義智駕 2.0 時(shí)代,如何去高精地圖、如何做好前融合,有沒有強(qiáng)大的規(guī)則算法能力,則是對(duì)車企和智駕供應(yīng)商軟實(shí)力的考驗(yàn)。
03、大模型不是終點(diǎn),只是 AI 時(shí)代的開端
在和多家智駕產(chǎn)業(yè)鏈供應(yīng)商交流之后,還有兩個(gè)不那么「技術(shù)」的感受。
第一個(gè)感受,是端到端大模型并不會(huì)是 AI 定義汽車的終點(diǎn),而只是個(gè)起點(diǎn)。
元戎啟行的分享中提到,端到端大模型雖然在推理能力上和人類非常類似,但是某些情況下的學(xué)習(xí)能力依舊不足。
比如在復(fù)雜的路口時(shí),人和端到端大模型都可能會(huì)走錯(cuò)路,但是人再一次繞回這個(gè)路口時(shí),能立即排除一個(gè)錯(cuò)誤選項(xiàng),而端到端大模型不行,大模型要學(xué)會(huì)一個(gè)東西,可能要在云端經(jīng)過(guò)成千上萬(wàn)次的訓(xùn)練。
要想提高端到端大模型的表現(xiàn),還有很長(zhǎng)的路要走。
第二個(gè)感受,是業(yè)內(nèi)也在探索大模型在汽車行業(yè)的更多應(yīng)用場(chǎng)景。
英偉達(dá)汽車行業(yè)數(shù)據(jù)中心業(yè)務(wù)副總裁 Norm Marks 分享了六大類英偉達(dá)正在應(yīng)用大語(yǔ)言模型的場(chǎng)景,涉及智駕、智艙、數(shù)字工廠、開發(fā)設(shè)計(jì)等多個(gè)領(lǐng)域。
除了英偉達(dá)以外,安霸也進(jìn)行了類似的探索,推出了生成式 AI 芯片 N1,算力水平達(dá)到了英偉達(dá) A100 的 70%,但功耗僅有 A100 的 10%,50 瓦的功耗讓車端運(yùn)行大模型成為了可能。
目前車端搭載的普遍為云端大模型,存在隱私和穩(wěn)定性兩方面的缺點(diǎn),因此只能用于娛樂(lè)、對(duì)話等功能。
而當(dāng)通用大模型部署到車端本地之后,就可以參與一些更重要的工作中去,比如幫助智駕大模型做一些判斷等。
這種在應(yīng)用場(chǎng)景上的探索與迷茫,一定程度上說(shuō)明目前 AI 的技術(shù)發(fā)展速度已經(jīng)超過(guò)了實(shí)際應(yīng)用場(chǎng)景,存在著一定的「泡沫」。
但是反過(guò)來(lái)看,當(dāng)技術(shù)超前到一定程度之后,必然會(huì)從底層重塑整個(gè)汽車行業(yè)。就像 2001 年互聯(lián)網(wǎng)泡沫破裂之后,互聯(lián)網(wǎng)反而重塑了整個(gè)人類社會(huì)的生產(chǎn)方式。
目前端到端大模型在汽車上的應(yīng)用,必然只是 AI 定義汽車時(shí)代的開始。
來(lái)源:第一電動(dòng)網(wǎng)
作者:汽車之心
本文地址:http://www.vlxuusu.cn/kol/229578
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。