上周和從事AI研究的朋友聊到ChatGPT,對(duì)方的一句話,讓我至今心有戚戚。他提到,未來(lái)取代人類(lèi)的不是AI,而是另一個(gè)熟練駕馭AI的人類(lèi)。
這讓我想到自動(dòng)駕駛:未來(lái)真正取代人類(lèi)駕駛、或是真正操控人類(lèi)方向盤(pán)的絕不是自動(dòng)駕駛,而是熟悉駕馭大模型、大數(shù)據(jù)和大算力的另一群人類(lèi)。
一場(chǎng)發(fā)布會(huì),又給我了新的思考。
4月11日,毫末智行在其HAOMO AI DAY上,高調(diào)發(fā)布了行業(yè)首個(gè)自動(dòng)駕駛生成式大模型DriveGPT,中文取名為“雪湖·海若”。其底層模型,用的正是GPT(Generative Pre-trained Transformer)生成式預(yù)訓(xùn)練大模型,試圖解決自動(dòng)駕駛領(lǐng)域的認(rèn)知決策問(wèn)題。
毫末的速度,確實(shí)夠快。
兩年前,特斯拉將Transformer模型引入自動(dòng)駕駛,作為中國(guó)自動(dòng)駕駛新秀的毫末智行很快跟進(jìn),成為國(guó)內(nèi)第一家引入Transformer的出行科技公司。后來(lái),毫末又推出了國(guó)內(nèi)第一個(gè)重感知、不依賴高清地圖的城市駕駛輔助系統(tǒng),率先破題量產(chǎn)自動(dòng)駕駛。
有意思的是,即使是特斯拉這樣的頭部公司,往往也是一年才舉辦一次科技日或品牌日。毫末團(tuán)隊(duì)不一樣,他們把科技發(fā)布會(huì)的頻次提升到每季度一次,且似乎每次都能講出用高密度信息,吊足業(yè)界胃口,可見(jiàn)自我迭代的要求之高。
這場(chǎng)車(chē)展前夕的HAOMO AI DAY,讓我們?cè)俅慰吹搅撕聊┧俣龋约昂聊┧俣缺澈笤噲D改變?nèi)祟?lèi)駕駛的一群人??偨Y(jié)來(lái)說(shuō),這次發(fā)布會(huì)主要釋放了兩個(gè)消息——
一個(gè)是毫末智行的城市NOH即將量產(chǎn),將最先落地北京、上海、保定等城市;一個(gè)則是推出全球首個(gè)自動(dòng)駕駛生成式大模型DriveGPT 雪湖·海若,讓業(yè)界看到大模型落地應(yīng)用在車(chē)端的另一種可能,AI領(lǐng)域炙手可熱的GPT,終于可以用在自動(dòng)駕駛領(lǐng)域了。
|毫末,憑什么?|
目前,DriveGPT還處于云端模型階段,未來(lái)將最先落地應(yīng)用在新摩卡DHT-PHEV的城市NOH上。
回顧下毫末智行輔助駕駛產(chǎn)品HPilot的成長(zhǎng)歷程,三年多的時(shí)間已經(jīng)更新了三代,其中,Hpilot 1.0和Hpilot 2.0此前都已已經(jīng)量產(chǎn)上車(chē)。此前落地的最新一代的行泊一體產(chǎn)品HPilot 2.0,搭載于長(zhǎng)城旗下多款車(chē)型上,高速NOH是亮點(diǎn)。
伴隨著Hpilot 3.0(也就是城市NOH)即將在多個(gè)城市落地,DriveGPT即將迎來(lái)真正的用武之地。這也意味著,中國(guó)首個(gè)重感知、不依賴高精地圖的城市NOH即將量產(chǎn)上車(chē),最先落地北京、上海以及保定等城市,且2024年上半年落地將達(dá)到100城。
產(chǎn)品落地,一直是毫末的強(qiáng)項(xiàng)。
顧維灝曾在上個(gè)月的電動(dòng)汽車(chē)百人會(huì)論壇表示,出眾的量產(chǎn)落地能力,一方面要得益于重感知的技術(shù)路線,另一方面則是大模型技術(shù)應(yīng)用比較領(lǐng)先,當(dāng)然,還有該公司的用戶閉環(huán)的數(shù)據(jù)建設(shè),也是領(lǐng)先于業(yè)界很多同類(lèi)公司。因?yàn)檫@些優(yōu)勢(shì),毫末智行才能第一個(gè)把大規(guī)模落地的城市導(dǎo)航駕駛輔助產(chǎn)品交付到客戶手上。
有意思的是,商湯也在前兩天發(fā)布自研類(lèi)ChatGPT產(chǎn)品,就和毫末智行推出DriveGPT幾乎前后腳,試圖打入通用人工智能(AGI)賽道,背后依托的,其實(shí)和毫末智行一樣,手握大模型,大數(shù)據(jù)和大算力,走出霸王步也在預(yù)料之中。
在毫末智行看來(lái),自動(dòng)駕駛2.0時(shí)代和3.0時(shí)代最大的不同,前者是小規(guī)模數(shù)據(jù)和小模型的軟件驅(qū)動(dòng),后者則是大規(guī)模數(shù)據(jù)和大參數(shù)模型驅(qū)動(dòng)。這意味著,誰(shuí)能優(yōu)化訓(xùn)練效率,誰(shuí)能壓低云端數(shù)據(jù)訓(xùn)練成本,誰(shuí)能提升計(jì)算效能,誰(shuí)就能脫穎而出。
這正是毫末的發(fā)力方向。
戰(zhàn)略層面,毫末智行曾在2021年制定了數(shù)據(jù)智能的“思想鋼印”,即打通數(shù)據(jù)、算法和云端的閉環(huán),共同賦能給車(chē)端,用更低的成本和更快的迭代速度(AI訓(xùn)練,系統(tǒng)測(cè)試,數(shù)據(jù)處理和收集等)開(kāi)發(fā)出更好的車(chē)端產(chǎn)品。
武器庫(kù)層面,則是推出了數(shù)據(jù)智能體系產(chǎn)品MANA,這是毫末智行自動(dòng)駕駛產(chǎn)品進(jìn)化的核心驅(qū)動(dòng)力。
MANA體系由四個(gè)子系統(tǒng)組成:
位于上層的是TARS(數(shù)據(jù)原型系統(tǒng))、LUCAS(數(shù)據(jù)泛化系統(tǒng))和VENUS(數(shù)據(jù)可視化平臺(tái)),分別對(duì)應(yīng)核心算法原型實(shí)踐、算法應(yīng)用場(chǎng)景實(shí)踐和數(shù)據(jù)可視化系統(tǒng),最底層的BASE(底層系統(tǒng))則代表了數(shù)據(jù)通用能力,主要肩負(fù)著中間件、數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)計(jì)算相關(guān)的服務(wù)。
整個(gè)系統(tǒng)將數(shù)據(jù)感知、認(rèn)知、標(biāo)注、仿真、計(jì)算等多個(gè)環(huán)節(jié)融為一體,在數(shù)據(jù)高效利用的同時(shí)節(jié)省大量成本,從而提高產(chǎn)品迭代速度。
今年年初,毫末智行宣布成立了智算中心MANA OASIS,并宣稱(chēng)這是中國(guó)自動(dòng)駕駛行業(yè)目前規(guī)模最大的智算中心。
在國(guó)外,特斯拉率先為FSD準(zhǔn)備了屬于自己的AI計(jì)算中心DOJO,項(xiàng)目剛啟動(dòng),就使用了1.4萬(wàn)個(gè)英偉達(dá)的GPU來(lái)訓(xùn)練AI模型。反觀國(guó)內(nèi),毫末智行確實(shí)是第一批部署智算中心的自動(dòng)駕駛科技公司,不僅為算法模型的成熟提供了超強(qiáng)算力,也為自家的城市NOH提供了算力層面的保障。
|大考之年|
持續(xù)領(lǐng)先——
這是毫末的目標(biāo),也是動(dòng)力。毫末董事長(zhǎng)張凱在HAOMO AI DAY上表示,團(tuán)隊(duì)未來(lái)的目標(biāo)是讓重感知的城市NOH產(chǎn)品至少領(lǐng)先行業(yè)一年以上,并到2024年在全國(guó)100個(gè)城市實(shí)現(xiàn)落地。目前,他們已經(jīng)獲得3家主機(jī)廠定點(diǎn)合同。
”2023年是智駕產(chǎn)品的全線爆發(fā)期。”
對(duì)此,張凱提到了三點(diǎn):
-城市導(dǎo)航輔助駕駛產(chǎn)品將圍繞量產(chǎn)上車(chē)發(fā)力,主要玩家的城市導(dǎo)航輔助駕駛產(chǎn)品進(jìn)入到真實(shí)用戶覆蓋和多城市落地的比拼。
-行泊一體將成為自動(dòng)駕駛公司深耕的重點(diǎn),在乘用車(chē)領(lǐng)域,搭載行泊一體功能的智駕產(chǎn)品將迎來(lái)前裝量產(chǎn)潮。
-末端物流自動(dòng)配送車(chē)在商超、快遞等場(chǎng)景迎來(lái)爆發(fā),2023年將在這些場(chǎng)景實(shí)現(xiàn)可持續(xù)商業(yè)化閉環(huán)。
值得一提的是,全線爆發(fā)的特征之一,是大模型開(kāi)啟在車(chē)端的落地應(yīng)用,毫末智行看到了趨勢(shì),順勢(shì)推出DriveGPT,迎接智能駕駛行業(yè)的沖刺之年、大考之年。
競(jìng)爭(zhēng)只會(huì)越來(lái)越激烈。
下圖是過(guò)去五年世界范圍內(nèi)具備影響力的大模型,橫軸是發(fā)布或面世時(shí)間,縱軸是模型參數(shù),紅色部分是我國(guó)自己推出的大模型,黑色的則是國(guó)外玩家的成果。我們可以看到,參數(shù)規(guī)模幾乎是瘋狂增長(zhǎng),速度幾乎是每年增長(zhǎng)十倍。
一個(gè)問(wèn)題,是成本。
時(shí)間越是往后面走,大模型的成本將越來(lái)越高,其中就包括時(shí)間成本和經(jīng)濟(jì)成本。
之前看到一組數(shù)據(jù),ChatGPT在訪問(wèn)階段的初始投入就是十億美元級(jí)別,訓(xùn)練階段的單次訓(xùn)練也要花掉約百萬(wàn)至千萬(wàn)美元。對(duì)于毫末智行來(lái)說(shuō),項(xiàng)目推進(jìn)越快,面臨的現(xiàn)金流壓力也會(huì)越大,就要看投資人以及背后的金主爸爸長(zhǎng)城汽車(chē)未來(lái)如何“輸血”了。
在此次HAOMO AI DAY現(xiàn)場(chǎng),毫末智行也聊到DriveGPT現(xiàn)階段的降本策略:
智駕硬件——
DriveGPT視覺(jué)方案直接重新配置感知硬件,毫末在BEV框架中開(kāi)始驗(yàn)證使用魚(yú)眼相機(jī)代替超聲波雷達(dá)進(jìn)行測(cè)距,以滿足泊車(chē)要求。經(jīng)DriveGPT加持,毫末魚(yú)眼相機(jī)方案可達(dá)到15m范圍內(nèi)感知精度30cm,2米內(nèi)精度10cm,大幅降低智駕成本。
視覺(jué)標(biāo)注——
毫末在使用數(shù)據(jù)過(guò)程中,逐步建立起一套基于4D Clips駕駛場(chǎng)景識(shí)別方案,如果使用DriveGPT雪湖·海若的場(chǎng)景識(shí)別服務(wù),一張圖片的價(jià)格將下降到0.5元,單幀圖片整體標(biāo)注成本,僅相當(dāng)于行業(yè)的1/10。
另一個(gè)問(wèn)題,是計(jì)算能力。
大模型對(duì)計(jì)算能力的要求極高,毫末智行在HAOMO AI DAY上提出了底層算力的幾個(gè)解決方案——
首先,是與火山引擎簽署合作,搭建大模型訓(xùn)練保障框架,實(shí)現(xiàn)了異常任務(wù)分鐘級(jí)的補(bǔ)貨和恢復(fù)能力,可以保障千卡任務(wù)連續(xù)訓(xùn)練數(shù)月沒(méi)有任何非正常中斷,提升大模型訓(xùn)練的穩(wěn)定性。
其次,是充分利用量產(chǎn)車(chē)數(shù)據(jù)回傳優(yōu)勢(shì),并將其推廣到大模型訓(xùn)練,訓(xùn)練資源彈性調(diào)度,集群計(jì)算資源利用率達(dá)到95%。
最后,是底層算子優(yōu)化,MANA OASIS 通過(guò)提升數(shù)據(jù)吞吐量來(lái)降本增效,滿足Transformer大模型訓(xùn)練效率,再通過(guò)引入火山引擎提供的 Lego算子庫(kù)實(shí)現(xiàn)算子融合,端到端吞吐提升84%。
不過(guò),萬(wàn)里長(zhǎng)征才邁出第一步。
毫末智行董事長(zhǎng)張凱這次的演講題目,是《HAOMO SPEED, AI SPEED》,第一層意思,是追趕AI時(shí)代的進(jìn)化速度,另一層意思,則是保持毫末智行自己的領(lǐng)先,前半程領(lǐng)先易,后半程領(lǐng)先難,特別是往L4級(jí)別走。
今年,毫末智行要打贏智能駕駛裝機(jī)量、MANA大模型進(jìn)化、城市 NOH大規(guī)模落地和末端物流自動(dòng)配送商業(yè)四場(chǎng)戰(zhàn)役。這四場(chǎng)戰(zhàn)役具體怎么打,毫末并沒(méi)有對(duì)外透露太多,不過(guò),按照這家公司三個(gè)月一場(chǎng)AI發(fā)布會(huì)的節(jié)奏,很多信息,想必很快就能揭曉。
來(lái)源:第一電動(dòng)網(wǎng)
作者:NE時(shí)代
本文地址:http://www.vlxuusu.cn/kol/199941
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。