繼極越 01 的 1.3.1 版本官宣 OCC 占用網(wǎng)絡(luò)上車(chē)后,緊隨而至的 1.4.0 版本又更近一步地釋放了極越這套以視覺(jué)為主的智駕能力。廢話不多說(shuō),多說(shuō)不廢話,就讓我們一起快速以圖文形式體驗(yàn)下極越 1.4.0 版本更新了哪些內(nèi)容吧。
介紹這篇章節(jié)前,需要提出一個(gè)靈魂問(wèn)題:什么是占用網(wǎng)絡(luò)?
在智能化浪潮的洗禮下,我們對(duì)于 BEV 有著初步的理解,而在 BEV+transformer 為車(chē)輛還原現(xiàn)實(shí)世界的基礎(chǔ)上,特斯拉在 2022 年提出了有關(guān)自動(dòng)駕駛車(chē)輛的一種基于視覺(jué)能力的全新算法——Occupancy Networks,直譯為占用網(wǎng)絡(luò)。
這套算法的目的在于解決在 3D 空間網(wǎng)絡(luò)中所識(shí)別到的異型障礙物,原理則是通過(guò)“堆方盒子”的概念,也就是將現(xiàn)實(shí)世界中的物體用 3D 像素方塊堆疊還原,從而表達(dá)出檢測(cè)的物體。
占用網(wǎng)絡(luò)就像一個(gè)可以無(wú)限伸展的魔方,只需要知道前方是否有方塊堆疊阻擋智駕系統(tǒng)規(guī)劃的行車(chē)路線,不在乎它所檢測(cè)的對(duì)象是什么,也不需要像以往矩形框識(shí)別標(biāo)注般依賴訓(xùn)練,這意味著智駕研發(fā)團(tuán)隊(duì)能夠解放這部分?jǐn)?shù)據(jù)標(biāo)注的精力,去進(jìn)行更多的能力拓展。
而在 1.4.0 的極越 01 上,極越的智駕團(tuán)隊(duì)就為我們帶來(lái)了這么一個(gè)小彩蛋——呼喚 SIMO 開(kāi)啟 OCC ,中控屏幕上的 SR 畫(huà)面便會(huì)“咻”的一下進(jìn)入 OCC 3D 地圖網(wǎng)絡(luò)當(dāng)中,除了本車(chē)以外所有的地圖信息都會(huì)進(jìn)行方格化重繪,頗有種《我的世界》和樂(lè)高的結(jié)合感。
正在加載 視頻播放器。 播放視頻 播放 靜音 當(dāng)前時(shí)間 0:00 / 時(shí)長(zhǎng) 0:00 加載完成: 0% 0:00 媒體流類(lèi)型 直播 嘗試直播,當(dāng)前為延時(shí)播放 直播 剩余時(shí)間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開(kāi)對(duì)話窗口。Escape鍵將取消并關(guān)閉對(duì)話窗口
文字 Color 白黑紅綠藍(lán)黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍(lán)黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍(lán)黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無(wú)浮雕壓低均勻下陰影 字體庫(kù) 比例無(wú)細(xì)體單間隔無(wú)細(xì)體比例細(xì)體單間隔細(xì)體舒適手寫(xiě)體小型大寫(xiě)字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對(duì)話窗口
極越 01 實(shí)時(shí) OCC 3D 地圖網(wǎng)絡(luò)演示但畢竟是作為彩蛋項(xiàng)目存在,這些未做標(biāo)注的通用障礙物雖然會(huì)隨著硬件實(shí)時(shí)感知進(jìn)行實(shí)時(shí)刷新,但在刷新率上卻并不和底層的地圖道路模型同步,導(dǎo)致實(shí)際體驗(yàn)中畫(huà)面會(huì)有股割裂感。
不過(guò)這種類(lèi)似入侵后臺(tái)讀取數(shù)據(jù)的極客操作畫(huà)面,嗯……倒也符合極越“汽車(chē)機(jī)器人”的身份。
在 OCC 占用網(wǎng)絡(luò)全面上車(chē)的情況下,極越 01 的智能駕駛能力又會(huì)得到怎樣的提升呢?我們選取了深圳羅湖中心附近的道路進(jìn)行體驗(yàn),如果用一個(gè)詞涵蓋極越 01 在 OTA 之后的表現(xiàn),那我想穩(wěn)定二字是最合適不過(guò)的。
(P.S. 下文中有關(guān)智能駕駛的部分均為在深圳及周邊地區(qū)體驗(yàn),能力或與推送升級(jí)后的部分地區(qū)有所差異。)
在第一幕中,可以看到這個(gè) T 型路口由于右邊的施工圍欄,導(dǎo)致整個(gè)待行區(qū)域集體左移形成了異形路口,同時(shí)地面標(biāo)線也顯得較為無(wú)序,還有著對(duì)向右轉(zhuǎn)車(chē)輛的干擾。
而在其中的極越 01 得益于 OCC 能力上車(chē),SR 界面完整識(shí)別到了施工圍欄,車(chē)輛路線規(guī)劃也做出了相應(yīng)調(diào)整,從而順利完成這趟異形路口的無(wú)保護(hù)左轉(zhuǎn)操作。
正在加載 視頻播放器。 播放視頻 播放 靜音 當(dāng)前時(shí)間 0:00 / 時(shí)長(zhǎng) 0:00 加載完成: 0% 0:00 媒體流類(lèi)型 直播 嘗試直播,當(dāng)前為延時(shí)播放 直播 剩余時(shí)間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開(kāi)對(duì)話窗口。Escape鍵將取消并關(guān)閉對(duì)話窗口
文字 Color 白黑紅綠藍(lán)黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍(lán)黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍(lán)黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無(wú)浮雕壓低均勻下陰影 字體庫(kù) 比例無(wú)細(xì)體單間隔無(wú)細(xì)體比例細(xì)體單間隔細(xì)體舒適手寫(xiě)體小型大寫(xiě)字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對(duì)話窗口
而在第二幕場(chǎng)景中,極越 01 也是精準(zhǔn)地識(shí)別到路旁的障礙車(chē)輛,雖然后續(xù)識(shí)別模型有所誤差,但傳遞給決策層后依舊成功地做出了繞行動(dòng)作,繞開(kāi)路旁的清掃車(chē)輛。
正在加載 視頻播放器。 播放視頻 播放 靜音 當(dāng)前時(shí)間 0:00 / 時(shí)長(zhǎng) 0:00 加載完成: 0% 0:00 媒體流類(lèi)型 直播 嘗試直播,當(dāng)前為延時(shí)播放 直播 剩余時(shí)間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開(kāi)對(duì)話窗口。Escape鍵將取消并關(guān)閉對(duì)話窗口
文字 Color 白黑紅綠藍(lán)黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍(lán)黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍(lán)黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無(wú)浮雕壓低均勻下陰影 字體庫(kù) 比例無(wú)細(xì)體單間隔無(wú)細(xì)體比例細(xì)體單間隔細(xì)體舒適手寫(xiě)體小型大寫(xiě)字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對(duì)話窗口
我們都知道百度在 AI 領(lǐng)域的探索十分深入,那作為百度旗下能和 ChatGPT 所抗衡的文心一言,在極越 01 上則是和 SIMO 相互結(jié)合起來(lái)——當(dāng)一個(gè)車(chē)載語(yǔ)音助手擁有了生成式大模型能力后,能為我們帶來(lái)什么?
那當(dāng)然是能帶來(lái)眼前一黑的操作……即使是較為抽象沒(méi)有具體實(shí)例的問(wèn)題,在結(jié)合了文心一言后的 SIMO 也能盡可能為大家答疑解惑:
“《人在囧途》里王寶強(qiáng)喝的是什么飲料?”具體拆分這個(gè)問(wèn)題,首先由于提供的是演員真名,SIMO 需要在電影中找到演員對(duì)應(yīng)的角色。而后需要判斷語(yǔ)意表達(dá),SIMO 在這方面捕捉到發(fā)令者的語(yǔ)意,是想要知道演員在劇中的一項(xiàng)具體行為,并做出相應(yīng)解釋和動(dòng)作片段講解,隨后輸出內(nèi)容。
正在加載 視頻播放器。 播放視頻 播放 靜音 當(dāng)前時(shí)間 0:00 / 時(shí)長(zhǎng) 0:00 加載完成: 0% 0:00 媒體流類(lèi)型 直播 嘗試直播,當(dāng)前為延時(shí)播放 直播 剩余時(shí)間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開(kāi)對(duì)話窗口。Escape鍵將取消并關(guān)閉對(duì)話窗口
文字 Color 白黑紅綠藍(lán)黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍(lán)黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍(lán)黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無(wú)浮雕壓低均勻下陰影 字體庫(kù) 比例無(wú)細(xì)體單間隔無(wú)細(xì)體比例細(xì)體單間隔細(xì)體舒適手寫(xiě)體小型大寫(xiě)字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對(duì)話窗口
這也意味著車(chē)內(nèi)的語(yǔ)音助手?jǐn)[脫了其作為車(chē)控的單一身份,可以就某些有趣的問(wèn)題與車(chē)內(nèi)人員進(jìn)行一問(wèn)一答。當(dāng)然,面對(duì)有意思的問(wèn)答,你也可以選擇將 SIMO 的答案發(fā)送到極越 APP 上。
而在具象化的問(wèn)題上,SIMO 的車(chē)控身份又能與大模型的問(wèn)答打通——比如“如何打開(kāi)手套箱”,SIMO 在給出常規(guī)的解答后,還能記憶上下文,完整了解后續(xù)指令里缺失的主語(yǔ),是控制前面提出的內(nèi)容。
正在加載 視頻播放器。 播放視頻 播放 靜音 當(dāng)前時(shí)間 0:00 / 時(shí)長(zhǎng) 0:00 加載完成: 0% 0:00 媒體流類(lèi)型 直播 嘗試直播,當(dāng)前為延時(shí)播放 直播 剩余時(shí)間 - 0:00 1x 播放速度 節(jié)目段落 描述 字幕 音軌 Picture-in-Picture 全屏This is a modal window.
打開(kāi)對(duì)話窗口。Escape鍵將取消并關(guān)閉對(duì)話窗口
文字 Color 白黑紅綠藍(lán)黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍(lán)黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍(lán)黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無(wú)浮雕壓低均勻下陰影 字體庫(kù) 比例無(wú)細(xì)體單間隔無(wú)細(xì)體比例細(xì)體單間隔細(xì)體舒適手寫(xiě)體小型大寫(xiě)字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對(duì)話窗口
不過(guò)需要注意的是,現(xiàn)階段僅有主駕駛位可以觸發(fā)融入大模型后的 SIMO 語(yǔ)音助手,按照官方的說(shuō)法是為了避免車(chē)內(nèi)其他位置的指令對(duì)于生成回答的干擾。后續(xù)極越會(huì)在 2.0 版本中將會(huì)開(kāi)放全車(chē)位置的大模型問(wèn)答。
在關(guān)于 1.4.0 的更新說(shuō)明文檔中,“手機(jī)可投屏至車(chē)機(jī)屏幕”只占據(jù)了非常小的板塊。但在實(shí)際使用后,我頓悟了……
極越關(guān)于車(chē)手互聯(lián)的想法,在現(xiàn)階段顯得如此簡(jiǎn)單粗暴——把手機(jī)連上車(chē)載熱點(diǎn),啪的一下便能直接將手機(jī)畫(huà)面投上車(chē)機(jī)屏幕了,不限品牌,不限操作系統(tǒng),什么適配都不需要。
但這里有個(gè)非常匪夷所思的邏輯:車(chē)載熱點(diǎn)目前只能靠進(jìn)入車(chē)機(jī)投屏應(yīng)用才能打開(kāi),而不是直接下拉找到開(kāi)啟按鈕/右上角信號(hào)區(qū)域,開(kāi)啟入口藏得有點(diǎn)太深了。
雖然在這個(gè)版本極越只提供了投屏操作,并且投到車(chē)機(jī)屏幕后不能觸控/常規(guī)情況都是豎屏……但當(dāng)我隨手拿出一臺(tái)手機(jī),連上熱點(diǎn)就能投屏,這種返璞歸真的操作好像是有那么一點(diǎn)在嘲諷目前封閉的車(chē)手互聯(lián)生態(tài)。
而嘗試了幾番后,極越這套投屏其實(shí)更像是我們?cè)诩抑袑⑹謾C(jī)/平板等投屏到電視一樣的操作,投屏的應(yīng)用可以在手機(jī)后臺(tái)掛起,不影響手機(jī)的其他操作。
This is a modal window.
打開(kāi)對(duì)話窗口。Escape鍵將取消并關(guān)閉對(duì)話窗口
文字 Color 白黑紅綠藍(lán)黃紫紅青 Transparency不透明半透明 背景 Color 黑白紅綠藍(lán)黃紫紅青 Transparency不透明半透明透明 窗口 Color 黑白紅綠藍(lán)黃紫紅青 Transparency透明半透明不透明 字體尺寸 50%75%100%125%150%175%200%300%400% 字體邊緣樣式 無(wú)浮雕壓低均勻下陰影 字體庫(kù) 比例無(wú)細(xì)體單間隔無(wú)細(xì)體比例細(xì)體單間隔細(xì)體舒適手寫(xiě)體小型大寫(xiě)字體 重置 恢復(fù)全部設(shè)定至預(yù)設(shè)值 完成 關(guān)閉彈窗結(jié)束對(duì)話窗口
投屏視頻播放效果,此時(shí)手機(jī)可以掛起投屏應(yīng)用到后臺(tái)在我看來(lái),這套投屏還有非常大的空間可以挖掘——在保持多品牌多系統(tǒng)的適配下,如何對(duì)更多應(yīng)用和場(chǎng)景進(jìn)行適配,或許這對(duì)于無(wú)心插柳的極越來(lái)說(shuō),在日后也能成為車(chē)手互聯(lián)的強(qiáng)有力推動(dòng)者呢?
常用常新,這一次極越的 1.4.0 OTA 更新,無(wú)論是 OCC 占用網(wǎng)絡(luò)的具象化,亦或是融入大模型的語(yǔ)音助手,都給人一種眼前一亮的感覺(jué),“汽車(chē)機(jī)器人”,正在走上不斷自我優(yōu)化的正確道路上。
而受限于篇幅,部分細(xì)節(jié)上的優(yōu)化并未放進(jìn)文章,后續(xù)我們也希望極越官方能夠繼續(xù)為用戶帶來(lái)更好的用車(chē)體驗(yàn)。同時(shí),我們也歡迎大家在新出行極越 01 社區(qū)分享自己 OTA 后的體驗(yàn)的報(bào)告。
來(lái)源:第一電動(dòng)網(wǎng)
作者:新出行
本文地址:http://www.vlxuusu.cn/carnews/pingce/223119
以上內(nèi)容轉(zhuǎn)載自新出行,目的在于傳播更多信息,如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)(www.vlxuusu.cn)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。