【TechWeb】3月20日消息,近日,在全球權(quán)威的自動駕駛nuScenes競賽的最新評測中,毫末智行斬獲純視覺3D目標(biāo)檢測任務(wù)(nuScenes Detection task)無外部數(shù)據(jù)榜單第一名,并將關(guān)鍵性指標(biāo)nuScenes Detection Score(NDS)提高到68.8%。
自動駕駛純視覺感知算法已經(jīng)成為行業(yè)的熱點,如何提高基于視覺的3D障礙物的精度和準(zhǔn)確度成為當(dāng)下核心的技術(shù)挑戰(zhàn)。
據(jù)介紹,毫末在此項檢測任務(wù)中主要使用了兩種方法,一種是基于NeRF的三維建模方法,并基于此方法設(shè)計了深度分支網(wǎng)絡(luò)模型來輸出深度偽標(biāo)簽,另一種是由SEEM監(jiān)督的語義分支網(wǎng)絡(luò)來輸出語義偽標(biāo)簽,最終結(jié)合深度偽標(biāo)簽、語義偽標(biāo)簽來提升檢測效果。
nuScenes數(shù)據(jù)集是目前自動駕駛領(lǐng)域中最流行的公開數(shù)據(jù)集之一,數(shù)據(jù)采集自波士頓和新加坡的實際自動駕駛場景,是第一個集成攝像頭、激光雷達(dá)和毫米波雷達(dá)等多種傳感器,實現(xiàn)360度全傳感器覆蓋的數(shù)據(jù)集。nuScenes數(shù)據(jù)集提供了二維、三維物體標(biāo)注、點云分割、高精地圖等豐富的標(biāo)注信息,包含1000個場景,擁有140萬幀圖像、39萬幀激光雷達(dá)點云數(shù)據(jù)、23個物體類別、140萬個三維標(biāo)注框,其數(shù)據(jù)標(biāo)注量比KITTI數(shù)據(jù)集高出7倍以上。
所謂純視覺3D目標(biāo)檢測任務(wù),就是在不使用激光雷達(dá)、毫米波雷達(dá)等額外的傳感器信息條件下,僅使用6個攝像頭完成車外360度環(huán)視視野的3D目標(biāo)檢測,不僅需要檢測周圍環(huán)境中所有的車、行人、障礙物、交通標(biāo)志、指示燈等若干類對象,還要精確感知到他們在真實物理世界中的位置、大小、方向、速度等信息。該項任務(wù)的主要難點是通過2D圖像難以準(zhǔn)確的獲取目標(biāo)的真實深度和速度,當(dāng)提取的深度信息不準(zhǔn)確時,一切的三維感知任務(wù)都會變得異常困難;而當(dāng)提取的速度信息不準(zhǔn)確時,則可能會對后續(xù)的決策規(guī)劃任務(wù)產(chǎn)生致命性的影響。(宜月)
來源:TechWeb.com.cn
作者:宜月
本文地址:http://www.vlxuusu.cn/news/qiye/223329
以上內(nèi)容轉(zhuǎn)載自TechWeb.com.cn,目的在于傳播更多信息,如有侵僅請聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動網(wǎng)(www.vlxuusu.cn)立場。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。