手机免费看av网站|婷婷丁香在线观看|日本另类在线观看|国产刺激高潮免|亚洲一区亚洲二区|激情视频在线播放视频一区|亚洲五月蜜臀aV|丝袜美腿亚洲av电影|欧美多人性爱成人综合在线|日韩黄色成人视频

  1. 首頁
  2. 資訊
  3. 企業(yè)
  4. 距離城市道路通關(guān),自動駕駛還差在哪?

距離城市道路通關(guān),自動駕駛還差在哪?

蓋世汽車 徐珊珊

“人們習(xí)慣將凡事分出黑與白,但很遺憾,現(xiàn)實全是灰色的?!眲⒋刃拦P下的這句話,恰恰也是自動駕駛行業(yè)的真實寫照。兩個流派,重感知和重地圖,華山論道,暗流擊水。只是眼下,尚沒有一個最優(yōu)解,讓汽車徹底擺脫人類干預(yù)。

因為無論什么樣的捷徑,打造智慧的車都是必由之路。尤其當(dāng)自動駕駛場景從高速延伸到城市道路,提高車端的感知與認知能力將變得愈發(fā)關(guān)鍵。 

一方面,高度信息缺乏之余,地圖始終在變化。舉例來說,北京半年內(nèi)道路拓撲變化約達到平均每百公里5.06處,廣州市內(nèi)改道施工平均一天能有兩起,只有采集車不停采不?;貍鲾?shù)據(jù),才能保證地圖的“鮮”度;另一方面,道路參與者無序且隨機。除了車輛,行人、非機動車等不確定因素也成為自動駕駛進階的一大考驗。

小鵬汽車自動駕駛副總裁吳新宙曾直言,“和高速NGP相比,如果要拿一個數(shù)字作說明,城市NGP可能是百倍以上的困難程度。”但要實現(xiàn)自動駕駛規(guī)模量產(chǎn),就必須通過城市道路這個關(guān)卡。

訓(xùn)練數(shù)據(jù)之“九九八十一難”

截止到目前,國內(nèi)已有北京、重慶、武漢、深圳、廣州、長沙等多個城市允許自動駕駛車輛在特定區(qū)域、特定時段進行商業(yè)化試運營。前不久,北京頒發(fā)了“無人化車外遠程階段”道路測試許可。

自動駕駛無人測試從“副駕有人”、“前排無人,后排有人”邁向第三階段——“車外遠程”。一個永恒主題是,利用源源不斷的數(shù)據(jù),打磨自動駕駛感知模型。模型決定了功能的上限,數(shù)據(jù)是源驅(qū)動力。而首要問題在于,如何以更低成本、更高效率獲取更多有價值的訓(xùn)練數(shù)據(jù)?

距離城市道路通關(guān),自動駕駛還差在哪?  

圖片來源:天風(fēng)證券

聽起來或許有些不可思議,僅以數(shù)據(jù)標注為例,過去業(yè)內(nèi)普遍做法是標注單幀2D圖像,也就是每秒標注一幀,但真實視頻每秒由10幀以上圖像構(gòu)成,換句話說,中間有很多空隙沒有被標注,這部分也成了“白白浪費”的資源。

不僅如此,隨著自動駕駛數(shù)據(jù)標注轉(zhuǎn)移到4D空間(3D空間+時間維度),數(shù)據(jù)以一個Clip相當(dāng)于包含了攝像頭、傳感器數(shù)據(jù)的短視頻為最小標注單位,使得人工標注難度增大。

天風(fēng)證券的研報顯示,L3級別以上自動駕駛需要大量的3D點云數(shù)據(jù)支撐,不僅要求對傳感器回傳的數(shù)據(jù)進行實時處理分析,大量的彎道車道線、日積月累的消耗和損壞等帶來的形狀和反射率失真問題,也給識別的準確率帶來極大挑戰(zhàn)。

因此如果將這些離散幀擴充成Clip的形式,采用人工標注和返工的成本勢必將墊高自動駕駛模型訓(xùn)練的開支。這也是,特斯拉從外包數(shù)據(jù)標注,到建立自己的人工標注團隊、再到推進自動化標注的關(guān)鍵原因。國內(nèi)車企如小鵬也打造了全自動標注系統(tǒng),效率方面提高近4.5萬倍,過去2000人一年的標注任務(wù),現(xiàn)在只需16.7天左右就能完成。

除了車企,自動駕駛公司也在積極嘗試,包括毫末智行在數(shù)據(jù)智能體系MANA的基礎(chǔ)上,推出了視頻自監(jiān)督大模型。簡單理解,利用圖像掩膜對視頻某些區(qū)域作屏蔽,給出上一幀,讓模型猜下一幀,自主學(xué)習(xí)進行特征提取。

距離城市道路通關(guān),自動駕駛還差在哪?

圖片來源:毫末智行

接著再將帶有完整標注的Clip給到該模型,進行微調(diào)。循環(huán)往復(fù),基于深度學(xué)習(xí)算法提高模型的準確率和精度。通過視頻自監(jiān)督大模型,毫末智行降低了98%的Clip標注成本。同時鑒于服務(wù)器端跑的大模型具有更高的泛化性,訓(xùn)練完成部署在車端自動駕駛平臺后,預(yù)測能力要更強一些。

不過僅有這些還不夠,現(xiàn)階段自動駕駛對于數(shù)據(jù)的渴望遠遠沒有達到盡頭,豐富的數(shù)據(jù)分布,是訓(xùn)練和優(yōu)化自動駕駛感知模型的前提,沒有之一。

對于打造自動駕駛系統(tǒng)來說,不論是采集車預(yù)先采集數(shù)據(jù),還是量產(chǎn)車回灌數(shù)據(jù),都存在較長的開發(fā)周期和不菲的成本問題。也因此,仿真技術(shù)被視為自動駕駛開發(fā)的加速器,受到業(yè)內(nèi)廣泛采用。通常自動駕駛系統(tǒng)在裝車量產(chǎn)前,都需要經(jīng)過大量的仿真測試。

然而毫末智行技術(shù)副總裁艾銳指出,從各傳感器不同的特性來看,當(dāng)前仿真技術(shù)還有很大的進步空間。比如,激光雷達底噪普遍低于毫末波雷達,二者對于雨雪霧等條件的要求也大不相同,導(dǎo)致同一場景下建模難度較高。

“好比看電影一樣,CG動畫即便做得再好,但和真實場景區(qū)分開來相比于過分依賴仿真技術(shù),毫米智行看中的是,用低成本的一般場景生成得到高成本的邊緣場景corner case優(yōu)勢。

這也是毫末智行在3D重建大模型中引入了NeRF(Neural Radiance Fields)技術(shù)的根本原因。NeRF是一種3D重構(gòu)技術(shù),起步于2020年,憑借幾張圖片就可以合成360度全包圍視角的特點,迅速風(fēng)靡電商領(lǐng)域。

距離城市道路通關(guān),自動駕駛還差在哪?  

放到自動駕駛領(lǐng)域,NeRF不僅有助于重構(gòu)場景數(shù)據(jù),還可以做相應(yīng)視角的調(diào)整。如此一來,便可以模擬極端路況的車輛行駛,實現(xiàn)對長尾場景的全面覆蓋。除此之外,還可以模擬光線調(diào)整、夜晚效果等生成所需數(shù)據(jù)。

在增加NeRF生成的數(shù)據(jù)后,毫末智行將感知錯誤率在原基礎(chǔ)上至少降低了30%。數(shù)據(jù)越多越好,關(guān)鍵不僅在縱向的“量”,更關(guān)乎橫向的“豐富度”。面對數(shù)據(jù)這座大山,積累是唯一的出路。

特斯拉有百萬車隊,小鵬有十萬車隊,而毫末智行依托長城汽車的品牌規(guī)模,截止2022年底累計行駛里程已經(jīng)突破2500萬公里。搭載毫末HPilot系統(tǒng)的車型將近二十款,月度搭載增速超過200%。預(yù)計到2024年上半年,毫末將完成HPilot落地中國100個城市的計劃。

自動駕駛“進城”  認知比感知難

從大數(shù)據(jù)里鍛煉感知能力是自動駕駛目標實現(xiàn)的第一步。不止如此,清華大學(xué)教授鄧志東在接受國內(nèi)媒體采訪時指出,自動駕駛核心技術(shù)難點之一是汽車如何理解復(fù)雜的動態(tài)駕駛場景(DDS),保證自動駕駛的安全性。

據(jù)其表示,人類駕駛是建立在認知理解基礎(chǔ)之上,依靠可理解的視覺感知和大腦實現(xiàn)決策。相比之下,自動駕駛車輛很難在復(fù)雜動態(tài)環(huán)境中獲得人類水平的駕駛知覺、預(yù)測與認知判決能力。

早些時候,毫末智行推出了基于transformer模型的環(huán)視感知算法(BEV),并逐漸應(yīng)用于實際道路。但CEO顧維灝也指出,BEV方案上車后,對車道線和常見障礙物的檢測效果相對不錯,各種復(fù)雜工況下的探測范圍和測量精度也有明顯提升。但仍然遺留了一些比較困難的挑戰(zhàn),特別是視覺方案對城市道路多種多樣異形障礙物的穩(wěn)定檢測問題。

一般有兩種解決思路擴大語義白名單。以識別輪胎為例,需要搜集大量的輪胎信息擴充標注樣本容量,這種方法往往要耗時費力相比之下更通用的方法或許可以事半功倍。即不需理解障礙物到底是什么,根據(jù)高度等信息判斷若對通行有影響,就避讓或者繞行。

毫末為此推出了多模態(tài)互監(jiān)督大模型和動態(tài)環(huán)境大模型。前者是利用攝像頭、激光雷達、毫米波雷達等傳感器的不同特性,互相監(jiān)督的方式進行通用障礙物或者通用結(jié)構(gòu)的識別,后者有點類似視頻自監(jiān)督大模型,其目的是讓系統(tǒng)增強感知能力。

距離城市道路通關(guān),自動駕駛還差在哪?  

利用自回歸編解碼網(wǎng)絡(luò)將BEV特征解碼為結(jié)構(gòu)化的拓撲點序列,實現(xiàn)車道拓撲預(yù)測?!白屪詣玉{駛系統(tǒng)像人類一樣,在標準地圖的導(dǎo)航提示下實現(xiàn)對道路拓撲結(jié)構(gòu)的實時推斷?!北M管這是一個理想狀態(tài),但根據(jù)艾銳的說法,毫末接下來將致力于解決“二選一”的難題。如果地圖導(dǎo)航的是明顯有錯誤的路線,模型可以通過事先輸入的地圖先驗信息,作出糾錯改道判斷。

不乏有觀點指出,自動駕駛的下一戰(zhàn)場將聚焦城市導(dǎo)航輔助駕駛功能。正如前文所述,城市道路的不斷變化和隨機的參與者構(gòu)成,都對感知提出了更高要求,尤其城市路口的通過率已經(jīng)成為城市導(dǎo)航輔助駕駛的最大難點。

在近日舉辦的 HAOMO AI DAY上,毫末智行也交出了首份成績單,在河北保定和北京85%的路口拓撲預(yù)測上,其算法準確率高達95%。盡管對于一些小路、支路的判斷還有待提升,但在城市NOH上,毫末算是首戰(zhàn)告捷。

除了以上四個大模型,毫末還發(fā)布了人駕自監(jiān)督認知大模型。自動駕駛感知相比,用顧維灝的話說“認知更是業(yè)界難題。”尤其自動駕駛朝更高級別升級的過程中,決策規(guī)劃將是核心能力,傳統(tǒng)基于規(guī)則的認知算法已經(jīng)進入瓶頸,已很難再取得突破。

一個突出問題是,由于相同場景不同司機的駕駛開法大不相同,完全基于大模型擬合海量的人駕數(shù)據(jù),最終結(jié)果往往會傾向于擬合均值而不是最優(yōu)值。也就是說,系統(tǒng)學(xué)到的并不是最佳開法,并且效果也不十分穩(wěn)定。

全自動駕駛大范圍落地的必要條件是具備足夠的安全性,1%的失誤都可能導(dǎo)致其無法落地應(yīng)用。如何讓機器更像人,確切地說是車技成熟且優(yōu)秀的司機,是擺在自動駕駛決策規(guī)劃面前的一個待解課題。

因而從ChatGPT的走紅,毫末發(fā)現(xiàn)自動駕駛也可以借鑒人類反饋強化學(xué)習(xí)RLHF的訓(xùn)練方式,先從模型入手得到一個獎勵模型(reward model),讓其知道什么是好的開法,什么是不好的,以及哪些行為需要改進。

通俗地講,績效越高工資就越高,要想工資更高,績效就得跟上。按照此方法,更容易培養(yǎng)出一個高質(zhì)量模型。諸如在掉頭、環(huán)島等場景下,毫末可以將通過率提升30%以上。

距離城市道路通關(guān),自動駕駛還差在哪?

人的認知能力并非一朝一夕練就的,機器也一樣,盡管有大量的科技手段可以加速迭代進程,但以卷積神經(jīng)網(wǎng)絡(luò)(CNN)、生成對抗網(wǎng)絡(luò)(GANs)、深度強化學(xué)習(xí)(RL)等為代表的深度學(xué)習(xí)算法都需要數(shù)據(jù)和時間的積累才能形成一個逐步穩(wěn)定的認知體系。

這也決定了,自動駕駛不僅是數(shù)據(jù)戰(zhàn),模型戰(zhàn),更是算力戰(zhàn)。

算力的比拼不僅僅是堆GPU卡

在車端,大算力智能駕駛SoC卷出新高度,英偉達的Thor和高通Snapdragon Ride Flex的目標都涵蓋了L5級市場。根據(jù)英特爾推算,全自動駕駛時代,單車每天可產(chǎn)生大約4000GB的數(shù)據(jù)量。

不僅如此,小鵬自動駕駛專家陳林在GTIC 2022全球自動駕駛峰會上也表示,相比高速NGP,城市NGP代碼量大約提升6倍,感知模型的數(shù)量增加4倍,決策控制相關(guān)的代碼量更是達到驚人的88倍。

如果采用單機訓(xùn)練AI算法模型,就需要276天才能完成,即使優(yōu)化后的單機訓(xùn)練也要耗時32天。車端需要大算力芯片,云端訓(xùn)練模型更需要算力的支撐。

NVIDIA汽車數(shù)據(jù)中心業(yè)務(wù)總監(jiān)陳曄之前就表示 ,如果這家車廠以自動駕駛或者科技為主打,那么超算中心將必不可少。在未來甚至?xí)蔀闇嗜腴T檻。因為如果沒有超算中心,就無法做軟件的持續(xù)開發(fā)與迭代。

小鵬率先發(fā)布了智算中心“扶搖”,而在本屆 HAOMO AI DAY上,毫末智行也聯(lián)手火山引擎發(fā)布了自己的智算中心“雪湖·綠洲”(MANA OAISIS)。MANA OASIS的算力高達67億億次/秒,存儲帶寬可以達到2T/秒,通信帶寬達到800G/秒。

距離城市道路通關(guān),自動駕駛還差在哪?  

搭建自動駕駛模型訓(xùn)練所需的智算中心,不僅僅是堆服務(wù)器和GPU卡就能成。主要需求體現(xiàn)在以下幾點:

  • 算力。算力一定程度上能代表可以做什么大模型,能做多少大模型,以及能支持多少個AI工程師在這個“練武場”中進行訓(xùn)練;

  • 存儲效率。自動駕駛的數(shù)據(jù)是片段式的,最大特點是小文件多,達到百億個。因此對這些小文件隨機存儲的效率,也代表著模型訓(xùn)練效率;

  • 存儲帶寬。自動駕駛的大模型訓(xùn)練需要交換的數(shù)據(jù)頗多,這就要求有高性能的存儲帶寬(指單位時間里存儲器所存取的信息量),這樣大量的數(shù)據(jù)才能在大模型中順暢流動;

  • 通訊帶寬。所有的這些計算能力不能在單臺服務(wù)器中完成,需要多臺服務(wù)器協(xié)同工作,這也就要求了集群的通訊帶寬;

  • 并行計算能力。自動駕駛所需要的模型,例如transformer,當(dāng)變得很大的時候,就會稀疏,也就不要求有更好的并行計算框架,在訓(xùn)練時將硬件資源都利用起來;

  • 創(chuàng)新能力。人工智能發(fā)展很快,新的算法層出不窮,這就要求車企和自動駕駛公司能夠盡快引入新的技術(shù)和新的模型。

自動駕駛數(shù)據(jù)量不斷累積,大模型復(fù)雜度不斷提高,新車交付和創(chuàng)新周期卻不斷收窄,都對智算中心這個承載平臺提出了更高要求。更為重要的是,自動駕駛未來的形態(tài)以及到底能達到怎樣的高度,沒有人知道。在真正的量產(chǎn)日前,唯有儲備糧草建設(shè)營地,才能巧借東風(fēng)。

結(jié)語

1886年,卡爾·本茨為他發(fā)明的三輪汽車“Motorwagen”申請了全球第一項汽車發(fā)明專利,之后汽車工業(yè)成為制造業(yè)的典范。不久的未來,電動化與智能化浪潮將顛覆整個汽車產(chǎn)業(yè),不僅是自動駕駛,科技的屬性將烙印在汽車行業(yè)滾滾向前的車輪上。而全無人駕駛時代,即將開啟。

來源:蓋世汽車

作者:徐珊珊

本文地址:http://www.vlxuusu.cn/news/qiye/193864

返回第一電動網(wǎng)首頁 >

收藏
32
  • 分享到:
發(fā)表評論
新聞推薦
第一電動網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢價信息
已經(jīng)成功提交我們稍后會聯(lián)系您進行報價!

第一電動網(wǎng)
Hello world!
-->