大模型上車難在哪里？

第一電動大牛作者 NE時代 2023-10-23 11:28

大模型火了，智能汽車也火了，兩火相加，會不會更旺？

當(dāng)然會更旺，從OPEN AI火了之后，已經(jīng)有多家車企宣布要把大模型上車。

理想汽車的Mind GPT，華為的盤古汽車大模型，百度的文心大模型，廣汽的AI大模型平臺，小鵬汽車聯(lián)合阿里打造的自動駕駛AI智駕中心“扶搖”……

光是今年上半年，就有近十個大模型宣布上車。

不同于ChatGPT這種語言類大模型，現(xiàn)階段在智能駕駛領(lǐng)域應(yīng)用的主要還是判別類大模型，例如BEV和Transformer。

那么大模型上車，難點是什么？未來又有那些發(fā)展可能？這些問題，還是要業(yè)內(nèi)人士才能回答。

在近期的多個論壇上，來自車企和多家自動駕駛研發(fā)企業(yè)的負(fù)責(zé)人，就對上述問題進(jìn)行了討論。

數(shù)據(jù)、數(shù)據(jù)還是數(shù)據(jù)

打造大模型離不開三個核心關(guān)鍵點，數(shù)據(jù)、算力和算法。

大模型的訓(xùn)練需要大量數(shù)據(jù)，數(shù)據(jù)，高質(zhì)量數(shù)據(jù)才是核心。

科大訊飛股份有限公司的智能汽車副總經(jīng)理李衛(wèi)兵看來，目前判別式大模型的決策規(guī)劃無論是基于場景還是基于規(guī)劃，都是基于人類的先驗知識，很難具有類人的自主進(jìn)化，或者說自主性比較差。尤其智能駕駛應(yīng)用到城區(qū)以后，挑戰(zhàn)非常大。這里面或許需要新的方法把判別式模型和生成式模型結(jié)合起來。

在李衛(wèi)兵看來，目前智能駕駛使用的判別式大模型，最讓人頭疼的是長尾問題，也就是高質(zhì)量的數(shù)據(jù)還是不夠。

也就是說，算力并不是大模型上車的最大難點，反而是被人關(guān)注最少得的數(shù)據(jù)才是關(guān)鍵。

李衛(wèi)兵坦言，未來競爭在數(shù)據(jù)，在算力。算力還好搞，就是貴一點，高質(zhì)量的數(shù)據(jù)是核心競爭力。

毫末智行科技有限公司數(shù)據(jù)智能科學(xué)家賀翔同樣認(rèn)為數(shù)據(jù)是核心競爭力，同時他更加詳細(xì)的對數(shù)據(jù)競爭進(jìn)行了分析。

他認(rèn)為按照目前的技術(shù)手段，想要收集到高精度可用數(shù)據(jù)是比較難，其原因主要有兩個方面：

一是，實際情況與理論預(yù)研有區(qū)別。

賀翔認(rèn)為，自動駕駛所需數(shù)據(jù)來自兩個方面，一個是采集車，還有一個是量產(chǎn)車回傳的數(shù)據(jù)。按照設(shè)計原理，量產(chǎn)車回傳數(shù)據(jù)邏輯，主要目的不是為了讓我們的模型學(xué)會怎么開車，而是用來收集BadCase的。

所謂BadCase，就是客戶認(rèn)為汽車智駕系統(tǒng)開的不好情況，一旦用戶覺得智駕系統(tǒng)對特情處理有誤，客戶就踩一下剎車，打一下方向盤，這個時候就應(yīng)該上傳數(shù)據(jù)用于分析。

但隨著智駕系統(tǒng)的實際落地，就能發(fā)現(xiàn)傳回來的數(shù)據(jù)對我們訓(xùn)練大模型而言肯定是有幫助的，但還是不夠，而這又是為什么？

原因是智駕訓(xùn)練系統(tǒng)所需要的，是一個老司機(jī)的駕駛動作，更確切的說是老司機(jī)的預(yù)判，只有老司機(jī)的預(yù)判才是有價值的。但不是所有的BadCase都是老司機(jī)處理，也可能是新手司機(jī)導(dǎo)致的BadCase，這就導(dǎo)致所采集的數(shù)據(jù)和設(shè)計目標(biāo)不一致。

這就是目前數(shù)據(jù)采集端的問題，很難保證所采集到的數(shù)據(jù)質(zhì)量。但大模型上車的重要前提，就是有足多，足夠可靠的高質(zhì)量數(shù)據(jù)。

從賀翔的分析不難看出，大模型上車對于高質(zhì)量數(shù)據(jù)的需求，遠(yuǎn)勝高算力需求。目前算力遠(yuǎn)沒有進(jìn)入到瓶頸期，只要肯花錢，可以較為容易得獲得高算力，但高質(zhì)量數(shù)據(jù)并不是一蹴而就，需要時間與測試數(shù)據(jù)的積累，是一個相對慢的過程。

第二是數(shù)據(jù)多樣性問題。

在賀翔看來，現(xiàn)在國內(nèi)沒有哪家企業(yè)數(shù)據(jù)是足夠的，尤其是長尾數(shù)據(jù)更少。數(shù)據(jù)多樣性、分布不夠的時候，模型訓(xùn)練的時候，你想讓它在模型中學(xué)到社會常識，比如這個車往這邊靠的時候是為了加塞，你要學(xué)這些東西就要有大量的數(shù)據(jù)，你會發(fā)現(xiàn)有的數(shù)據(jù)不夠，怎么辦？

賀翔認(rèn)為，一方面可以借助外部大模型，通過接入外部的大語言模型，或者是多模態(tài)大模型，通過一些外部的海量知識，因為這種知識在大量互聯(lián)網(wǎng)領(lǐng)域里面就已經(jīng)存在了。通過借用外部大模型幫助智駕駛系了解人類社會的潛在常識，基于這些常識以及智駕駛系的特點，來做更好的預(yù)測，有了預(yù)測之后才能做到?jīng)]有地圖能夠像人一樣開車，只需要視覺就能夠把車開得很好。

另一方面還是要不斷積累數(shù)據(jù)，尤其是高質(zhì)量的數(shù)據(jù)。

在專家眼中，現(xiàn)階段的核心問題還是數(shù)據(jù)量不夠。

數(shù)據(jù)共享難度大

就數(shù)據(jù)方面來說，單純依靠車企采集的數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的。業(yè)內(nèi)想到最直接方法就是建立數(shù)據(jù)聯(lián)盟。

但是在李衛(wèi)兵看來，理想很豐滿，現(xiàn)實很骨感。企業(yè)未來競爭在數(shù)據(jù)，高質(zhì)量的數(shù)據(jù)是企業(yè)的核心競爭力。讓企業(yè)拿出這些數(shù)據(jù)難度其實很大。

賀翔想到的問題更為現(xiàn)實，技術(shù)上的難度。在賀翔看來，現(xiàn)實問題是數(shù)據(jù)通用程度不高。雖然每家車企對都在對車輛駕駛進(jìn)行數(shù)據(jù)收集，但不同車型的數(shù)據(jù)通用程度不太高。賀翔拿長城自己的情況舉例，長城有那種內(nèi)部有那種特別小的車歐拉，也有特別大的坦克500/800，他們之間的數(shù)據(jù)都很難通用，即使內(nèi)部格式是一樣的。

賀翔認(rèn)為，其他車企的情況應(yīng)該類似，車型之間、車企之間，不同數(shù)據(jù)的規(guī)格，不同傳感器的規(guī)格，不同傳感器的配置，數(shù)據(jù)即使湊到一起，如何統(tǒng)一接口，統(tǒng)一規(guī)范，統(tǒng)一標(biāo)準(zhǔn)等，這些都是要命的技術(shù)問題。統(tǒng)一后，拿到一份標(biāo)準(zhǔn)數(shù)據(jù)之后，我們能不能把這些數(shù)據(jù)有效的用起來，也是一個很要命的問題。

事實上，業(yè)內(nèi)由企業(yè)在做這樣的事情，例如中汽創(chuàng)智。中汽創(chuàng)智作為一家背靠中國一汽、東風(fēng)、長安、國資委和汽車工程協(xié)會的企業(yè)，正在推動數(shù)據(jù)聯(lián)盟的方式，來為數(shù)據(jù)建立統(tǒng)一的標(biāo)準(zhǔn)，實現(xiàn)這個聯(lián)采、聯(lián)標(biāo)。

中汽創(chuàng)智智能駕駛CTO張振林表示，他們正在盡可能統(tǒng)一標(biāo)注、采集的標(biāo)準(zhǔn)，包括統(tǒng)一采集車的配置，包括采集設(shè)備和傳感器的選擇，“我們已經(jīng)內(nèi)部實現(xiàn)了部分的數(shù)據(jù)的這個共享和交易?！?/span>

張振林也認(rèn)為統(tǒng)一數(shù)據(jù)這件事難度非常大。因為這里面每一家的這個算法，每一家的傳感器的這些配置，每一家的這個研發(fā)的階段不一樣，它可能會有存量數(shù)據(jù)的，還有接下來的這些量產(chǎn)數(shù)據(jù)都有不相同，這是一件非常非常難的事情，不過正因為難，才有意義。

開源有償和虛擬數(shù)據(jù)或是新路徑

北京汽車研究總院有限公司智能網(wǎng)聯(lián)中心副主任陳新也提出一個新的思路—開源有償。

陳新認(rèn)為，目前現(xiàn)在大家還處于百花爭艷時期，還沒到一枝獨秀的階段，還需要很長時間讓大家研究自己的標(biāo)準(zhǔn)。

而且每家車企都是一個競爭的關(guān)系，不可能把自己高質(zhì)量的數(shù)據(jù)，都是花錢得來的，采了數(shù)據(jù)還得制作，還得做成數(shù)據(jù)集，尤其是高質(zhì)量的是很難的。

陳新認(rèn)為可行的方式是，車企可以做自己的一些模型，可以做一些開源的但是有償?shù)?，找國?nèi)頂尖專家做有用數(shù)據(jù)的篩選，可以做一些比賽，包括做一些高質(zhì)量數(shù)據(jù)的獲取，同時做一些模型的研究。

吉利汽車研究院技術(shù)規(guī)劃中心主任陳勇則提出，可以嘗試用虛擬數(shù)據(jù)。在陳勇看來，不是所有的語言大模型都是人工標(biāo)注，或是人工生成的，很多虛擬數(shù)據(jù)。自動駕駛其實也可以。

陳勇認(rèn)為，單靠一個車企或車型去采集還是蠻難的。周邊的環(huán)境，包括道路也在不斷的更新，我們的數(shù)據(jù)庫在不斷更新，十年前采的數(shù)據(jù)，現(xiàn)在大部分是沒什么用的，再過5年，我們今天采的數(shù)據(jù)還有沒有用，不一定。模型也好，整個算法也好，環(huán)境也好，都在發(fā)生變化，這些數(shù)據(jù)如何能夠?；畋ｕr。

陳勇提出，通過虛擬場景，比如虛擬仿真、元宇宙建模，用數(shù)字孿生去做這個事情，模擬各種交通流，各種事故，各種天氣。一方面，靠真實道路去采集，另一些，通過虛擬場景做一些生成，用大模型做一些風(fēng)格遷移，這種場景相對可行，而且能保證數(shù)據(jù)量大的問題，做虛擬環(huán)境生成的數(shù)據(jù)量，生成效率還是蠻高的。建一個千公里一萬公里，目前3D虛擬資產(chǎn)做好的話，幾個小時就能夠生成，這可能是一條路徑。如果變成虛擬數(shù)據(jù)之后，就可以考慮哪些可以做共享。

在陳勇看來，數(shù)據(jù)目前是限制學(xué)術(shù)發(fā)展的關(guān)鍵因素之一，為了做學(xué)術(shù)，為了做更前瞻的研究，企業(yè)之間可以做一些嘗試，做更前瞻的技術(shù)研究，做一些共享。

未來真的能夠上車至少要做到4B以下。陳勇認(rèn)為，如果解決某個其中一個小的問題，可能連1B模型都不需要，模型參數(shù)量的大小還是要看我們在車?yán)锩娼鉀Q什么問題，場景決定了參數(shù)量的大小，而不是一味的將大模型搬上車，因為大模型成本也非常高，對用戶來講也不是最經(jīng)濟(jì)的。

陳勇還提出，未來對于汽車行業(yè)，智能網(wǎng)聯(lián)汽車來講，車云一體或者車云協(xié)同應(yīng)該是大的發(fā)展方向。

雖然生成式AI的出現(xiàn)，對智能網(wǎng)聯(lián)汽車的發(fā)展帶來了新的機(jī)遇。但通過上述專家的討論可以看出，大模型真正用在車上，需要跨越的障礙還有很多，語言類的大模型要完整地搬上車顯然不現(xiàn)實，其算力消耗太過驚人，成本難以負(fù)擔(dān)。在智能駕駛領(lǐng)域想要通過大模型進(jìn)行優(yōu)化，難度也很大。

因此，大模型對智能網(wǎng)聯(lián)汽車領(lǐng)域的優(yōu)化，也面臨數(shù)據(jù)難題。大模型上車任重道遠(yuǎn)。

來源：第一電動網(wǎng)

作者：NE時代

本文地址：http://www.vlxuusu.cn/kol/212150

返回第一電動網(wǎng)首頁 >

文中圖片源自互聯(lián)網(wǎng)，如有侵權(quán)請聯(lián)系admin#d1ev.com（#替換成@）刪除。