ChatGPT 引發(fā)大語(yǔ)言模型爆發(fā)之后,自動(dòng)駕駛界打響了大模型之戰(zhàn)。
首當(dāng)其沖,有特斯拉提出的端到端方案、毫末智行首發(fā)自動(dòng)駕駛生成式大模型,華為盤古大模型 3.0 聚焦自動(dòng)駕駛場(chǎng)景提升數(shù)據(jù)閉環(huán)、商湯也提出自動(dòng)駕駛通用大模型 UniAD。
另一面,各家車企也爭(zhēng)相追逐大模型:長(zhǎng)城、奇瑞、吉利、長(zhǎng)安、廣汽、蔚來(lái)、小鵬、小鵬等陸續(xù)公布了大模型的相關(guān)進(jìn)展。
自動(dòng)駕駛大模型熱潮,要從自動(dòng)駕駛公司毫末智行在國(guó)內(nèi)率先帶節(jié)奏說(shuō)起。
今年 4 月份,毫末智行在第八屆 HAOMO AI DAY 上,發(fā)布了行業(yè)首個(gè)自動(dòng)駕駛生成式大模型 DriveGPT,解決自動(dòng)駕駛研發(fā)過(guò)程中困擾已久的認(rèn)知決策問(wèn)題,并通過(guò)能力迭代,最終試圖實(shí)現(xiàn)端到端自動(dòng)駕駛。
而毫末的更新迭代是以「天」為單位計(jì)算。
10 月 11 日,毫末在 200 天后舉辦第九屆 AI DAY,宣布 DriveGPT 新進(jìn)展——通用感知實(shí)現(xiàn)萬(wàn)物識(shí)別,通用認(rèn)知融入世界知識(shí)。
同時(shí)在產(chǎn)品端,毫末智行還發(fā)布了第二代三款千元級(jí)重磅 HPilot 產(chǎn)品。
毫末用技術(shù)和產(chǎn)品回答了大模型有多大才算大、智駕產(chǎn)品有多卷才算卷。
01 更新后的毫末大模型,有什么看頭?
地基已經(jīng)建成。
DriveGPT 作為自動(dòng)駕駛場(chǎng)景生成式大模型,輸入的是感知融合后的文本序列,輸出是自動(dòng)駕駛場(chǎng)景文本序列,是通向端到端自動(dòng)駕駛的大殺器。
但在自動(dòng)駕駛大模型熱中,擺在眼前的痛點(diǎn)問(wèn)題是:數(shù)據(jù)量大小,以及落地問(wèn)題。
本次 DriveGPT 的更新,不僅是自動(dòng)駕駛開(kāi)發(fā)模式的范式變革,也同時(shí)解決了數(shù)據(jù)量、落地的痛點(diǎn)問(wèn)題。
大模型多大才算大?
毫末智行數(shù)據(jù)智能科學(xué)家賀翔解答了汽車之心的疑問(wèn):「里程數(shù) 1 億只是開(kāi)始。」
截止目前,DriveGPT 學(xué)習(xí)時(shí)長(zhǎng)達(dá)到 103 萬(wàn)小時(shí),用戶使用輔助駕駛里程 8700 萬(wàn)公里,正加速朝 1 億公里數(shù)據(jù)規(guī)??癖?。
數(shù)據(jù)量膨脹、又如何在海量數(shù)據(jù)中挑出對(duì)大模型訓(xùn)練更有價(jià)值的數(shù)據(jù)?
讓 DriveGPT 擁有世界知識(shí),成了毫末智行大模型訓(xùn)練的解題思路。
賀翔舉了這樣一個(gè)例子:
以前智駕系統(tǒng)在泊車時(shí)如果感知到一堆雜草,可能會(huì)直接判別其為障礙物,繼而停止倒車。DriveGPT 更新后,不僅能識(shí)別出是雜草,還能挖出物體隱含信息。比如系統(tǒng)會(huì)深入學(xué)習(xí)草的特性——最終系統(tǒng)可以直接碾過(guò)雜草,繼續(xù)倒車。
要做到這一步并不容易,DriveGPT 能夠做到像人一樣決策、判斷,主要依靠?jī)蓚€(gè)重大更新:
第一,在感知大模型新增加圖文多模態(tài)大模型;
第二,在認(rèn)知大模型中增加大語(yǔ)言模型 LLM。
在自動(dòng)駕駛開(kāi)發(fā) 2.0 模式到 3.0 模式的過(guò)渡期,感知、認(rèn)知、執(zhí)行三大模塊分別對(duì)應(yīng)車端感知模型、車端及云端認(rèn)知模型、車端控制模型,并最終走向端到端自動(dòng)駕駛。
首先,在毫末視覺(jué)大模型架構(gòu)中,通過(guò)圖像編碼器,在訓(xùn)練過(guò)程采用自監(jiān)督預(yù)訓(xùn)練學(xué)習(xí)的方式,從而能高效地處理高達(dá)百億的圖片,而這種自監(jiān)督方式是通過(guò)圖像掩碼恢復(fù)建模來(lái)提高預(yù)訓(xùn)練模型的圖像表征能力,對(duì)優(yōu)化下游任務(wù)效果起到關(guān)鍵作用。
接著,DriveGPT 在感知大模型中引入 NeRF 技術(shù),將 Clips 序列的前 K 幀的部分輸入模型,用 NeRF(神經(jīng)輻射場(chǎng))渲染出后續(xù) H 幀,在這個(gè)過(guò)程中要經(jīng)過(guò) 4D 編碼器、多模態(tài)教師、NeRF 渲染器的加工,將物體視覺(jué)特征對(duì)齊文本語(yǔ)音特征,做到識(shí)別萬(wàn)物的能力。
這一步相當(dāng)于系統(tǒng)不僅可以識(shí)別一捧雜草、柱子等障礙物,甚至也能識(shí)別非洲大陸上的羚羊與大象。
第二步要讓系統(tǒng)知道「草可以碾過(guò)」這樣的物理特性。
毫末在認(rèn)知大模型中增加了一個(gè)壓縮了人類社會(huì)全部知識(shí)的大語(yǔ)言模型 LLM,相當(dāng)于在云端為汽車植入了最強(qiáng)大腦,要讓大模型看懂、理解駕駛行為。
車端的一顆芯片,自然無(wú)法裝得下如此規(guī)模參數(shù)的大模型。
云端的進(jìn)展變成車端優(yōu)秀的駕駛表現(xiàn),考驗(yàn)的不只是云端的底子,還有將云端大模型能力蒸餾至車端的能力。
蒸餾,原本指的是將混合物分離、純化。
在自動(dòng)駕駛領(lǐng)域,蒸餾指的是將云端積累的能力精煉到車端的能力。
毫末智行落地云端大模型的方法有兩種:
一種是車端模型與云端同步輸出偽標(biāo)簽,車端模型在逐漸擬合云端大模型的過(guò)程中得到進(jìn)化,相當(dāng)于云端刷題,給車端傳輸方法論。
另一種是直接讓車端小模型對(duì)齊云端 Feature Map,更加迅速提升車端小模型的能力,相當(dāng)于車端直接抄云端答案。
目前毫末智行通過(guò)蒸餾使得車端模型感知指標(biāo)提升 5%。
這種提升效果在一些實(shí)際測(cè)試中明顯體現(xiàn)出來(lái),在毫末內(nèi)部有一計(jì)劃被命名為小動(dòng)物保護(hù),目的是為了考察車端 NOH 系統(tǒng)對(duì)于小目標(biāo)的感知檢測(cè)能力。
在毫末 AI DAY 公開(kāi)的測(cè)試視頻中,毫末城市 NOH 在時(shí)速最高 70 公里的 50 米距離外,就能檢測(cè)到高度 35cm 的小目標(biāo)障礙物。也就是說(shuō)開(kāi)啟 NOH 后,即便城市道路上突然出現(xiàn)動(dòng)物出現(xiàn),也不用擔(dān)心剎停問(wèn)題。
此外,云端大模型還能形成閉環(huán),反哺數(shù)據(jù)量。
目前,毫末利用 DriveGPT 落地了場(chǎng)景理解、場(chǎng)景標(biāo)注、場(chǎng)景生成、場(chǎng)景遷移、行為解釋、環(huán)境預(yù)測(cè)、模型開(kāi)發(fā)等七大應(yīng)用實(shí)踐。
譬如,場(chǎng)景生成可以通過(guò)簡(jiǎn)單幾筆直線生成近乎真實(shí)的駕駛場(chǎng)景。場(chǎng)景遷移則利用單張圖片就可以改變黑夜、白天、雨雪天氣等環(huán)境特征。這些應(yīng)用不僅能夠節(jié)約數(shù)據(jù)訓(xùn)練成本,還提升了數(shù)據(jù)訓(xùn)練精度。
從發(fā)布 DriveGPT,再到為其融入世界知識(shí),毫末正在補(bǔ)齊自動(dòng)駕駛大數(shù)據(jù)、大模型、大算力的金字塔結(jié)構(gòu)。
02 猛打智駕性價(jià)比,3000 元實(shí)現(xiàn)智駕體驗(yàn)
毫末 DriveGPT 的外化是產(chǎn)品,這一次 AI DAY 毫末放出量產(chǎn)殺器,一口氣發(fā)布了三款 HPilot 產(chǎn)品。
HP170:針對(duì)高速場(chǎng)景,3000 元級(jí)的高速無(wú)圖 NOH,可以實(shí)現(xiàn)行泊一體。算力 5TOPS,傳感器方案標(biāo)配 1 個(gè)前視相機(jī)、4 個(gè)魚(yú)眼相機(jī)、2 個(gè)后角雷達(dá)、12 個(gè)超聲波雷達(dá)。目前,毫末 HP170 是業(yè)內(nèi)唯一一個(gè)將高速無(wú)圖 NOH 系統(tǒng)壓縮到一顆 MCU 上的智駕產(chǎn)品。
HP370:針對(duì)城市場(chǎng)景,5000 元級(jí)的 HP370 可以完成城市記憶行車與記憶泊車,是毫末城市 NOH 的最小集。算力 32TOPS,傳感器方案比 HP170 的相機(jī)攝像頭數(shù)量翻 2 倍,同時(shí)增加了側(cè)視相機(jī)、后視相機(jī)、前雷達(dá)及后角雷達(dá),可以實(shí)現(xiàn)學(xué)習(xí)用戶通勤、日常路線,做到像用戶開(kāi)車一樣老司機(jī)。
HP570:針對(duì)城市場(chǎng)景,8000 元級(jí)城市全場(chǎng)景無(wú)圖 NOH,算力可選 72TOPS 和 100TOPS 兩款芯片,傳感器還支持選配 1 顆激光雷達(dá),可以做到城區(qū)道路內(nèi)通行,全程無(wú)圖 NOH、全場(chǎng)景智能繞障等功能一應(yīng)俱全。
毫末智行董事長(zhǎng)張凱現(xiàn)場(chǎng)表示,HP570 比起上一代平臺(tái)成本下降三分之二,將會(huì)是行業(yè)內(nèi)最具性價(jià)比的全場(chǎng)景無(wú)圖 NOA 產(chǎn)品。
三款產(chǎn)品最大的特性就是定位都在千元級(jí),全部是行泊一體,包含高速無(wú)圖 NOH到城市全場(chǎng)景無(wú)圖 NOH,主打一個(gè)極致性價(jià)比。
汽車之心觀察到的情況是,智能汽車相關(guān)企業(yè)最近發(fā)布產(chǎn)品時(shí)有了直接以價(jià)格定性能、定區(qū)間的趨勢(shì)。
成本和產(chǎn)品力即將形成交叉時(shí),自動(dòng)駕駛棋局就開(kāi)始互相兌子——各方權(quán)衡利弊下,以高價(jià)值兌換低價(jià)值。
將毫末智行三款產(chǎn)品可實(shí)現(xiàn)的功能級(jí)別對(duì)應(yīng)到智能駕駛市場(chǎng)中,就會(huì)發(fā)現(xiàn)目前市場(chǎng)智駕產(chǎn)品的性價(jià)比還有進(jìn)一步提升的空間。
行泊一體功能上車車型主要有小鵬 P5、榮威 RX5、寶駿 KIWI 等,這些車型售價(jià)集中在 10-20 萬(wàn)。若要擁有記憶行車、記憶泊車類似功能,那么小鵬 G6、寶駿云朵靈犀版是代表,其售價(jià)集中在 15-25 萬(wàn)。
類似的,全場(chǎng)景城市 NOA 對(duì)系統(tǒng)軟硬件要求高,目前理想 L9 Max、小鵬 G6/G9 Max 版本、阿維塔 11/問(wèn)界 M5/M7 智駕版均可以實(shí)現(xiàn)城市 NOA,而這一列平均價(jià)格至少在 25 萬(wàn)元以上。
毫末三款 HPilot 產(chǎn)品以更高的性價(jià)比,實(shí)現(xiàn)了三檔不同水平智駕能力的下放,對(duì)于實(shí)現(xiàn)智駕技術(shù)平權(quán)、提升了用戶智駕體驗(yàn)大有裨益。
據(jù)汽車之心了解,目前使用毫末 HPilot 智能輔助駕駛產(chǎn)品的用戶月度活躍率達(dá)到 88%。
在 AI DAY 上,毫末智行 CEO 顧維灝提到的一個(gè)用戶案例尤為有趣:
在搭載 HPilot 產(chǎn)品的車輛中,一位摩卡用戶單輛最長(zhǎng)累計(jì)智駕里程是 82073 公里,智駕功能使用率 76.2%,相當(dāng)于使用輔助輔助駕駛繞著地球跑了快兩圈了。
更加平價(jià)的智駕系統(tǒng),扭轉(zhuǎn)了自動(dòng)駕駛命運(yùn)的齒輪。
乘用車聯(lián)合會(huì)數(shù)據(jù)顯示,2023 年乘用車智能駕駛滲透率與價(jià)格呈反向增長(zhǎng),乘用車市場(chǎng) L2 及以上智能駕駛滲透率達(dá) 42.4%,預(yù)計(jì) 2025 年將達(dá) 70%,并普及到 10-20 萬(wàn)的主流車型上。
目前,有不少車型的高階智駕系統(tǒng)選購(gòu)率突破了歷史值:
用戶選購(gòu)小鵬 G6/G9 Max 版本的占比分別到達(dá)了 60% 和 80%;
國(guó)慶假期訂單爆發(fā)的問(wèn)界,新款問(wèn)界 M7 超 5 萬(wàn)訂單里,智駕版超過(guò) 3.3 萬(wàn)臺(tái),占比近 66%;
寶駿推出的云朵靈犀版,用戶選購(gòu)智駕版本的占比達(dá)到了 80%。
智駕能夠在用戶端迅速鋪開(kāi)的一大原因就是「價(jià)格香,體驗(yàn)好」。
而以毫末為代表的玩家,將滿足高、中、低價(jià)位車型的量產(chǎn)需求,進(jìn)一步催化智能駕駛平權(quán),將智能駕駛的使用門檻再降一檔。
03 自動(dòng)駕駛還要打贏四場(chǎng)戰(zhàn)役
自動(dòng)駕駛是人工智能最大的問(wèn)題,在外界看來(lái)自動(dòng)駕駛突破節(jié)點(diǎn),像是呼嘯而過(guò)、一夜爆發(fā)的「技術(shù)奇點(diǎn)」。
實(shí)則不然,自動(dòng)駕駛爆發(fā)背后必然包含了技術(shù)升維、商業(yè)落地、場(chǎng)景開(kāi)拓、數(shù)據(jù)膨脹等艱難、恒久的歷程。
毫末將這些歷程稱為四場(chǎng)戰(zhàn)役:智能駕駛裝機(jī)量之戰(zhàn)、MANA 大模型之戰(zhàn)、城市 NOH 百城大戰(zhàn)、末端物流自動(dòng)配送車商業(yè)之戰(zhàn)。
量產(chǎn)之戰(zhàn)、大模型之戰(zhàn)不再贅述,考驗(yàn)的是性價(jià)比與技術(shù)的平衡。
而城市 NOH 百城大戰(zhàn)與末端物流自動(dòng)配送則是毫末堅(jiān)持以技術(shù)撬動(dòng)場(chǎng)景,兩條腿走路的戰(zhàn)略體現(xiàn)。
開(kāi)城之戰(zhàn)已經(jīng)打響,從小鵬、華為、長(zhǎng)城宣布開(kāi)拓百城,再到蔚來(lái)提出以路開(kāi)城,快節(jié)奏、多元化開(kāi)城使得城市 NOA 走向價(jià)值兌付。
在 AI DAY 上,毫末首次釋放了城市 NOH 路測(cè)表現(xiàn)。
顧維灝與張凱兩人搭檔測(cè)試了魏牌藍(lán)山的 NOH,從保定哈弗中心出發(fā)在保定鬧市區(qū)行駛 12 公里,僅手動(dòng)接管 3 次。
在視頻中,NOH 流暢完成了多車道匯入單一車道、無(wú)保護(hù)右轉(zhuǎn)等動(dòng)作,即便在復(fù)雜的電動(dòng)自行車無(wú)規(guī)則穿行路況下,依舊能夠及時(shí)響應(yīng),完成避讓。
在夜間場(chǎng)景下依舊表現(xiàn)出色,夜間識(shí)別橫穿行人、及時(shí)避讓行人,面對(duì)擁堵道路、紅綠燈交替以及機(jī)非混行等復(fù)雜場(chǎng)景穩(wěn)如老司機(jī)。
據(jù)汽車之心了解,具備城市 NOH 導(dǎo)航輔助駕駛功能的毫末 HP550,將搭載魏牌藍(lán)山在 2024 年第一季度正式量產(chǎn)上市。
進(jìn)一步地,毫末百城 NOH 目標(biāo)將會(huì)先后在北京、保定、上海等城市全面鋪開(kāi)。
另一個(gè)撬動(dòng)量產(chǎn)的杠桿是毫末在末端物流的進(jìn)展。
乘用車的智駕滲透率、商業(yè)落地是緩慢進(jìn)行的,但在自動(dòng)駕駛垂直場(chǎng)景,大規(guī)模盈利拐點(diǎn)將會(huì)更快到來(lái)。
此次,毫末第三代末端物流自動(dòng)配送車小魔駝 3.0 實(shí)車亮相 AI DAY,這是個(gè)能夠滿足商超、物流、零售多場(chǎng)景多需求的自動(dòng)駕駛「大塊頭」,也是全球首款 9 萬(wàn)元內(nèi)中型末端物流自動(dòng)配送車。
目前,小魔駝已完成 22 萬(wàn)個(gè)無(wú)人配送訂單,在北京順義、亦莊等地區(qū)已經(jīng)能看到小魔駝實(shí)車。
隨著毫末智行在第四季度與達(dá)達(dá)物流進(jìn)行合作加速落地更多地區(qū),毫末也將在第四季度商超履約配送場(chǎng)景率先實(shí)現(xiàn)盈利。
梳理自動(dòng)駕駛行業(yè)現(xiàn)狀就會(huì)發(fā)現(xiàn),2025 年到來(lái)之前,智駕鋪開(kāi)的速度與規(guī)模,成為自動(dòng)駕駛企業(yè)留在牌桌上的決賽項(xiàng)目。
背靠長(zhǎng)城的毫末已經(jīng)有了極為充沛的量產(chǎn)實(shí)踐。
中國(guó)工程院院士、清華大學(xué)教授張亞勤指出,毫末智行是推動(dòng)智能駕駛量產(chǎn)的重要角色。
他認(rèn)為自動(dòng)駕駛開(kāi)發(fā)模式可以分三個(gè)時(shí)代,而毫末是 2.0 時(shí)代過(guò)渡到 3.0 時(shí)代的代表企業(yè):
1.0 時(shí)代:硬件驅(qū)動(dòng),在這個(gè)階段算力僅為數(shù) T,數(shù)據(jù)規(guī)模停留在 100 萬(wàn)公里,感知和認(rèn)知主要依靠激光雷達(dá)和人工規(guī)則,智駕水平并不流暢。
2.0 時(shí)代:軟件驅(qū)動(dòng),硬件、軟件、數(shù)據(jù)三者支撐,數(shù)據(jù)規(guī)模達(dá)到 1 億公里,傳感器可以單獨(dú)輸出結(jié)果,但認(rèn)知仍為人工規(guī)則。
3.0 時(shí)代:數(shù)據(jù)驅(qū)動(dòng),數(shù)據(jù)量超過(guò) 1 億公里,感知依靠多傳感器融合輸出,認(rèn)知層可以輸出可解釋的、場(chǎng)景化駕駛常識(shí),大數(shù)據(jù)、大模型、大算力成為發(fā)展三要素。
永遠(yuǎn)追逐先進(jìn)技術(shù),保證智駕安全性是自動(dòng)駕駛不變的命題。
就連張亞勤也直言:
「技術(shù)要始終往前推進(jìn),不能保證未來(lái) 5 年一定是 Transformer 路線。即便是 Transformer 大模型,其運(yùn)行效率要比人腦也要低 1000 倍。」
自動(dòng)駕駛技術(shù)路漫漫,但在 AI DAY 最后的沙龍環(huán)節(jié),不少自動(dòng)駕駛行業(yè)從業(yè)者用黎明、實(shí)用性、風(fēng)起云涌來(lái)形容行業(yè)進(jìn)展。
曙光的本質(zhì)是——智能駕駛正逐漸被用戶需要。在這樣的趨勢(shì)下,一個(gè)具備技術(shù)競(jìng)爭(zhēng)力、高價(jià)值的毫末將會(huì)更加被需要。
來(lái)源:第一電動(dòng)網(wǎng)
作者:汽車之心
本文地址:http://www.vlxuusu.cn/kol/211350
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。