自動(dòng)駕駛技術(shù)感知路線之爭(zhēng)一直是行業(yè)關(guān)注的焦點(diǎn)。
雖然特斯拉純視覺(jué)方案在業(yè)內(nèi)獨(dú)領(lǐng)風(fēng)騷,但多傳感融合方案被業(yè)內(nèi)視為實(shí)現(xiàn)自動(dòng)駕駛安全冗余的關(guān)鍵手段。
自動(dòng)駕駛技術(shù)路線之爭(zhēng)的背后,除了對(duì)感知硬件能力的苛刻要求之外,其實(shí)考驗(yàn)的是算法——如何讓感知硬件發(fā)揮效能最大化。
純視覺(jué)玩家為了保障感知數(shù)據(jù)維度高,降低數(shù)據(jù)的丟失,采用「一遍過(guò)」的前融合算法。
多傳感器融合玩家將安全維度置于首位,在每個(gè)傳感器獨(dú)立地輸出感知數(shù)據(jù)信息、處理之后,再匯總處理得出結(jié)論,也就是后融合算法。
兩種算法的背后各存利弊,前者對(duì)于硬件算力要求更高,后者難以發(fā)揮單一傳感器的最大作用。
隨著自動(dòng)駕駛逐步更加貼近日常駕駛場(chǎng)景,對(duì)外部環(huán)境探測(cè)感知的要求只會(huì)越來(lái)越高。
01、什么是前融合與后融合算法?
自動(dòng)駕駛,是一項(xiàng)集感知、決策和控制反饋于一體的技術(shù)。
環(huán)境感知作為自動(dòng)駕駛的第一環(huán),是車輛和環(huán)境交互的紐帶。
自動(dòng)駕駛系統(tǒng)整體表現(xiàn)的好壞,很大程度上都取決于感知系統(tǒng)的好壞。
如今,基于多傳感器融合感知已經(jīng)成為業(yè)內(nèi)的主流方案,多層數(shù)據(jù)多來(lái)源讓最終的感知結(jié)果變得更加穩(wěn)定可靠,更能利用到每個(gè)傳感器的優(yōu)勢(shì):
攝像頭雖然能感知豐富的紋理以及顏色信息,但與障礙物之間的距離的感知能力較弱,同時(shí)容易受到光照條件影響;
毫米波雷達(dá)可以全天候工作,提供精確的距離和速度信息,探測(cè)距離也比較遠(yuǎn),但分辨率較低,無(wú)法提供物體高度信息。
激光雷達(dá)雖可以較為準(zhǔn)確地感知距離信息,但由于采集的點(diǎn)云稀疏,無(wú)法獲得豐富的紋理和顏色等信息。
而多傳感器的融合能夠揚(yáng)長(zhǎng)避短,提高整車安全系數(shù),比如毫米波雷達(dá)和攝像頭的融合思路可以迅速排除大量無(wú)效的目標(biāo)區(qū)域,極大地提高識(shí)別速度。
攝像頭和激光雷達(dá)兩者的融合,通過(guò)利用視覺(jué)圖像信息進(jìn)行目標(biāo)檢測(cè),進(jìn)而獲取障礙物的位置,同時(shí)還可以識(shí)別出障礙物類別信息。
自動(dòng)駕駛因其問(wèn)題復(fù)雜度高、安全第一等特性,需要依靠多種傳感器數(shù)據(jù)的相互融合來(lái)提高感知效果。
而將多傳感器信息融合在一起又有多種方式:比如前融合與后融合。
前融合,所有傳感器都運(yùn)行同一套算法,將來(lái)自激光雷達(dá)、攝像頭和毫米波雷達(dá)的不同原始數(shù)據(jù)統(tǒng)一處理,相當(dāng)于一雙超級(jí)眼睛通過(guò)一套超級(jí)算法輸出一個(gè)結(jié)果。
前融合的代表玩家是特斯拉。
特斯拉將毫米波雷達(dá)、攝像頭等傳感裝置的不同原始數(shù)據(jù)統(tǒng)一處理,整合成一套環(huán)繞全車 360°的超級(jí)傳感器,再通過(guò) AI 算法來(lái)完成整個(gè)感知過(guò)程。
在特斯拉的這套方案當(dāng)中,所有的傳感器裝置只負(fù)責(zé)提供原始數(shù)據(jù),而算法則負(fù)責(zé)對(duì)原始數(shù)據(jù)進(jìn)行整合。
馬斯克認(rèn)為,當(dāng)毫米波雷達(dá)和視覺(jué)不一致時(shí),視覺(jué)有更好的精度,所以純視覺(jué)比現(xiàn)有的傳感器融合方式更好。
這種做法優(yōu)點(diǎn)就在于不會(huì)被單一的傳感器信號(hào)所影響,所以特斯拉直接移除了毫米波雷達(dá),但這意味著系統(tǒng)對(duì)數(shù)據(jù)的時(shí)效性、硬件算力有著極高的要求,需要更高的安全冗余。
這是因?yàn)椋绻惴ǔ霈F(xiàn)誤判,最終控制層同樣會(huì)做出錯(cuò)誤的指令。
后融合,則通過(guò)不同傳感器各司其職——超聲波雷達(dá)、攝像頭、毫米波雷達(dá)分別通過(guò)不同的算法進(jìn)行獨(dú)立的感知。
當(dāng)所有傳感器完成目標(biāo)數(shù)據(jù)(如目標(biāo)檢測(cè)、目標(biāo)速度預(yù)測(cè))生成后,將這些信息和目標(biāo)列表經(jīng)過(guò)校驗(yàn)和比對(duì):
在這個(gè)過(guò)程中,傳感器會(huì)通過(guò)算法過(guò)濾低置信度或者無(wú)效的原始數(shù)據(jù),最后進(jìn)行識(shí)別物體的合并,完成整個(gè)感知過(guò)程。
這也是目前業(yè)內(nèi)主流的融合方案。
比如華為 ADS 智能駕駛方案,通過(guò)毫米波雷達(dá)、攝像頭等傳感器進(jìn)行不同算法的獨(dú)立感知,再分別生成獨(dú)立的信息。
舉個(gè)例子,激光雷達(dá)看到的是一條柯基,毫米波雷達(dá)看到的是一條狗,而攝像頭看到的是一只小動(dòng)物,再將這些信息匯總處理,系統(tǒng)做出綜合判斷。
當(dāng)然,后融合感知框架也存在先天的不足:
單一傳感器會(huì)有能力限制,在特定條件下可能發(fā)生誤檢和漏檢,比如攝像頭不擅長(zhǎng)判斷距離和位置,雷達(dá)不擅長(zhǎng)判斷顏色和紋理,系統(tǒng)需要對(duì)它們的信息進(jìn)行互相驗(yàn)證,才能達(dá)到更高的可信度。
元戎啟行 CEO 周光曾舉例指出前、后融合的感知能力:
「假設(shè)在你手上有個(gè)手機(jī),激光雷達(dá)只能看到手機(jī)一個(gè)角,攝像頭只能看到第二個(gè)角,毫米波雷達(dá)可以看到第三個(gè)角。
如果用后融合算法,由于每個(gè)傳感器只能看到一部分,因此物體非常有可能不被識(shí)別,最終被濾掉。
但在前融合中,由于它集合了所有數(shù)據(jù),相當(dāng)于可以看到這個(gè)手機(jī)的三個(gè)角,那對(duì)于前融合來(lái)說(shuō),是非常容易識(shí)別出這是一臺(tái)手機(jī)的?!?/span>
這種差異化現(xiàn)象自然也產(chǎn)生不同的結(jié)果,比如面對(duì)相同的復(fù)雜場(chǎng)景,后融合出現(xiàn)極端場(chǎng)景的概率為 1%,前融合則能夠?qū)⑦@個(gè)概率降低至 0.01%。
兩種技術(shù)路線各有優(yōu)劣,前融合勝于高精度,后融合勝于高效率,背后不同流派的玩家自然各持硬件論、算力論之爭(zhēng)。
02、全融合算法解決了什么問(wèn)題?
前段時(shí)間,知乎有一個(gè)關(guān)于「自動(dòng)駕駛的關(guān)鍵,是硬件還是軟件」的帖子引起了熱議。
大家爭(zhēng)議的焦點(diǎn)在于硬件上車之后,車企能否將其作用發(fā)揮最大化。
在話題的討論中,飛凡汽車智駕團(tuán)隊(duì)首席科學(xué)家金杰盂回應(yīng):
智能駕駛硬件決定了軟件的天花板,軟件決定了用戶體驗(yàn),只不過(guò)相對(duì)于硬件性能的突破性提升,軟件算法到了必須變革的時(shí)刻。
確實(shí),如果自動(dòng)駕駛能夠一直依靠堆砌硬件的方式解決問(wèn)題,看起來(lái)是一個(gè)一勞永逸的方案。
但實(shí)際情況是,如果算法能力不能有效跟上,硬件只能淪為擺設(shè)。
那么,飛凡汽車如何在智能化時(shí)代轉(zhuǎn)換思考方式,做到「硬件堆砌」不再是一時(shí)的商業(yè)噱頭,而是能夠讓硬件發(fā)揮更高的效率,從而達(dá)到同一個(gè)硬件在不同場(chǎng)景中發(fā)揮不同作用的目標(biāo)呢?
金杰盂認(rèn)為,通過(guò)軟件的控制,硬件可以在不同場(chǎng)景下呈現(xiàn)出不同的狀態(tài),解決不同的問(wèn)題,相當(dāng)于硬件隨時(shí)需要成為軟件可以調(diào)用的資源。
比如在硬件數(shù)量層面:飛凡 R7 共搭載了33 個(gè)感知硬件,包括國(guó)內(nèi)首發(fā)量產(chǎn)的 Premium 4D 成像雷達(dá)、增強(qiáng)版遠(yuǎn)距離點(diǎn)云角雷達(dá) 、厘米級(jí)高精定位系統(tǒng)。
而在硬件質(zhì)量層面:來(lái)自 Luminar 的激光雷達(dá),可以實(shí)現(xiàn)超 500 米的最遠(yuǎn)探測(cè)距離以及水平 120°與垂直 26°的探測(cè)視角。
兩顆來(lái)自德國(guó)采埃孚的第五代 Premium 最高性能毫米波雷達(dá),實(shí)現(xiàn)最遠(yuǎn)探測(cè)距離 350 米,高于常規(guī)雷達(dá)的 210 米,即便是面對(duì)惡劣的極端天氣、光照條件,也可以正常運(yùn)作。
Premium 4D 成像雷達(dá)能夠同時(shí)對(duì)距離、速度、水平方位角、垂直高度四個(gè)緯度的識(shí)別,包括路沿、道路分岔口等自由空間,以及施工圍欄、雪糕筒等靜止障礙物。
全車 12 個(gè) 800 萬(wàn)像素?cái)z像頭覆蓋車輛 360°的全范圍感知,對(duì)動(dòng)態(tài)人車交通參與者、地面標(biāo)識(shí)、紅綠燈、限速標(biāo)識(shí)等交通環(huán)境的感知信號(hào)更加精準(zhǔn)。
最后是軟件算法能力。
飛凡 R7 搭載英偉達(dá) Orin 芯片,單顆算力 254Tops,最高可擴(kuò)展到 500-1000+Tops,相較于上一代 Xavier 芯片,運(yùn)算性能提升了 7 倍,能夠快速將路況信息轉(zhuǎn)化為實(shí)際圖像,并快速處理路面突發(fā)情況。
這種做法看起來(lái)就是在堆砌硬件?但這背后實(shí)際的情況是怎么樣的?
金杰盂在知乎的回答中提到一個(gè)叫做「全融合」的概念。
「全融合」的工作流程是這樣的:
首先,將前融合的多任務(wù)、多特征網(wǎng)絡(luò)、深度神經(jīng)網(wǎng)絡(luò)輸出的感知結(jié)果,與后融合獨(dú)立輸出的感知結(jié)果進(jìn)行綜合比對(duì),實(shí)現(xiàn)混合融合;
其次,依靠高帶寬、超算力芯片平臺(tái)的安全冗余部署,通過(guò)三重融合(毫秒級(jí)內(nèi))完成感知、融合、預(yù)測(cè)、決策、執(zhí)行等一整套動(dòng)作。
簡(jiǎn)單理解,就是先用前融合的思路得出解法,再用后融合的思路得出另一種解法,最后系統(tǒng)再將兩種解法進(jìn)行融合比對(duì)、檢查,得出一個(gè)感知、效率雙贏的結(jié)果。
那么,飛凡汽車眼中具備軟件變革意義的「全融合算法」,表現(xiàn)如何?
從目前官方公布的視頻來(lái)看,飛凡汽車的RISING PILOT 系統(tǒng)主要表現(xiàn)在匝道全域增強(qiáng)識(shí)別、超靈敏靜態(tài)路障感知、雨雪霧天超視距識(shí)別等極端場(chǎng)景。
比如針對(duì)目前無(wú)法提前識(shí)別進(jìn)入多岔口匝道的三角區(qū)域,或者是在匝道口數(shù)量多、復(fù)雜的情況下,系統(tǒng)識(shí)別失敗直接錯(cuò)過(guò)匝道、自動(dòng)退出等情況。
RISING PILOT 可以通過(guò)更遠(yuǎn)距離的綜合感知,提前識(shí)別匝道三角區(qū)域,進(jìn)而擁有更充裕的時(shí)間,在安全的方位內(nèi)提前進(jìn)行變道、匯入匝道。
比如遇到施工區(qū)域類場(chǎng)景,出現(xiàn)因無(wú)法準(zhǔn)確識(shí)別靜態(tài)路障,或者是根本無(wú)法識(shí)別施工區(qū)域而出現(xiàn)碰撞事故的情況:
RISING PILOT 能夠精準(zhǔn)識(shí)別靜態(tài)障礙物的三維幾何位置、尺寸和類型,并快速做出提前避讓的反應(yīng)。
即便只有雪糕筒或施工提示牌也可提前精準(zhǔn)識(shí)別,并通過(guò)預(yù)測(cè)和決策模型,快速反應(yīng)實(shí)現(xiàn)提前避讓。
可以預(yù)見(jiàn)的是,當(dāng)智能駕駛經(jīng)歷了在車載傳感器種類、數(shù)量上的花式堆砌,以及在智能駕駛硬件上的算力內(nèi)卷,想要自家的智駛技術(shù)能夠脫穎而出,最終大概率還是要回到軟件算法上。
03、硬件,需要隨時(shí)成為軟件算法的調(diào)度資源
如果說(shuō)自動(dòng)駕駛發(fā)展是一個(gè)需要長(zhǎng)期錘煉的過(guò)程,那么「技術(shù)迭代」則是這個(gè)過(guò)程的試金石。
攝像頭從單目升級(jí)到多目,像素從 200 萬(wàn)到800 萬(wàn),毫米波雷達(dá)從低頻的 24GH 向 77GHz、79GHz 升級(jí),激光雷達(dá)翻越車規(guī)級(jí)量產(chǎn)和降成本兩座大山,從機(jī)械旋轉(zhuǎn)式向 MEMS 演進(jìn)。
在自動(dòng)駕駛硬件逐步邁向成熟之后,算法自然成為自動(dòng)駕駛系統(tǒng)好壞評(píng)判的重要依據(jù)。
前融合的優(yōu)勢(shì)毋庸置疑,但極少有車企能夠真正把前融合算法做好,幾乎 99% 車企都處于 Demo 階段。
這也就是為什么大多數(shù)車企選擇后融合的原因。
在技術(shù)尚未真正成熟的背景下,現(xiàn)階段的前融合、后融合在極端場(chǎng)景中逐步暴露出各自的不足,這些問(wèn)題僅依靠自身軟件算法的升級(jí)迭代和硬件的加強(qiáng),也很難達(dá)到 100% 的理想效果。
雖然全融合目前被視為能夠取長(zhǎng)補(bǔ)短、避其所短的算法,但對(duì)于軟硬件的基礎(chǔ)能力、兩者與整車之間如何達(dá)成默契配合仍是難點(diǎn)。
除此之外,不同細(xì)分領(lǐng)域的入局者同樣存在不同的觀點(diǎn),比如堅(jiān)持前融合才是符合第一性原理的周光就表示:
「算法方面的欠缺,無(wú)法靠堆硬件來(lái)彌補(bǔ),要想保障 L4 級(jí) Robotaxi 的安全性,絕不能采用后融合的形式,多傳感器前融合是必要路線?!?/span>
何小鵬的觀點(diǎn)是強(qiáng)視覺(jué)感知,激光雷達(dá)只是輔助作用,并且強(qiáng)調(diào)算法和數(shù)據(jù)的重要性。
「體驗(yàn)、成本、安全、綜合使用范圍」是何小鵬對(duì)于智能駕駛技術(shù)優(yōu)劣的評(píng)判,并且四個(gè)維度都需要保持一定平衡。
如果硬件堆砌只能帶來(lái)硬件水平上的高度,那么軟件才是對(duì)戰(zhàn)時(shí)最有力的武器。
摩根士丹利曾在報(bào)告中提到,傳統(tǒng)的汽車硬件占據(jù)了整車價(jià)值的 90%,軟件僅占據(jù) 10%,但未來(lái)軟件所占的價(jià)值比重將會(huì)提高到 40%,硬件則將下降到 40%。
德勤咨詢更是進(jìn)一步指出,決定未來(lái)汽車差異性的將是軟件及軟件更新迭代所帶來(lái)的性能和功能變化。
這也為什么如今全棧自研成為車企追逐的路線,在硬件普遍堆料的背景下,自動(dòng)駕駛軟件算法已經(jīng)成為車企打造差異化智能駕駛能力的關(guān)鍵。
軟件算法的能力,在硬件水平足夠的前提下,直接決定了自動(dòng)駕駛性能的實(shí)際表現(xiàn)。
來(lái)源:第一電動(dòng)網(wǎng)
作者:汽車之心
本文地址:http://www.vlxuusu.cn/kol/185461
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。