手机免费看av网站|婷婷丁香在线观看|日本另类在线观看|国产刺激高潮免|亚洲一区亚洲二区|激情视频在线播放视频一区|亚洲五月蜜臀aV|丝袜美腿亚洲av电影|欧美多人性爱成人综合在线|日韩黄色成人视频

  1. 首頁
  2. 大牛說
  3. 大模型上車難在哪里?

大模型上車難在哪里?

大模型火了,智能汽車也火了,兩火相加,會不會更旺?

當(dāng)然會更旺,從OPEN AI火了之后,已經(jīng)有多家車企宣布要把大模型上車。

理想汽車的Mind GPT,華為的盤古汽車大模型,百度的文心大模型,廣汽的AI大模型平臺,小鵬汽車聯(lián)合阿里打造的自動駕駛AI智駕中心“扶搖”……

光是今年上半年,就有近十個大模型宣布上車。

不同于ChatGPT這種語言類大模型,現(xiàn)階段在智能駕駛領(lǐng)域應(yīng)用的主要還是判別類大模型,例如BEV和Transformer。

那么大模型上車,難點是什么?未來又有那些發(fā)展可能?這些問題,還是要業(yè)內(nèi)人士才能回答。

在近期的多個論壇上,來自車企和多家自動駕駛研發(fā)企業(yè)的負(fù)責(zé)人,就對上述問題進(jìn)行了討論。

01

數(shù)據(jù)、數(shù)據(jù)還是數(shù)據(jù)

打造大模型離不開三個核心關(guān)鍵點,數(shù)據(jù)、算力和算法。

大模型的訓(xùn)練需要大量數(shù)據(jù),數(shù)據(jù),高質(zhì)量數(shù)據(jù)才是核心。

科大訊飛股份有限公司的智能汽車副總經(jīng)理李衛(wèi)兵看來,目前判別式大模型的決策規(guī)劃無論是基于場景還是基于規(guī)劃,都是基于人類的先驗知識,很難具有類人的自主進(jìn)化,或者說自主性比較差。尤其智能駕駛應(yīng)用到城區(qū)以后,挑戰(zhàn)非常大。這里面或許需要新的方法把判別式模型和生成式模型結(jié)合起來。

在李衛(wèi)兵看來,目前智能駕駛使用的判別式大模型,最讓人頭疼的是長尾問題,也就是高質(zhì)量的數(shù)據(jù)還是不夠。

也就是說,算力并不是大模型上車的最大難點,反而是被人關(guān)注最少得的數(shù)據(jù)才是關(guān)鍵。

李衛(wèi)兵坦言,未來競爭在數(shù)據(jù),在算力。算力還好搞,就是貴一點,高質(zhì)量的數(shù)據(jù)是核心競爭力。

毫末智行科技有限公司數(shù)據(jù)智能科學(xué)家賀翔同樣認(rèn)為數(shù)據(jù)是核心競爭力,同時他更加詳細(xì)的對數(shù)據(jù)競爭進(jìn)行了分析。

他認(rèn)為按照目前的技術(shù)手段,想要收集到高精度可用數(shù)據(jù)是比較難,其原因主要有兩個方面:

一是,實際情況與理論預(yù)研有區(qū)別。

賀翔認(rèn)為,自動駕駛所需數(shù)據(jù)來自兩個方面,一個是采集車,還有一個是量產(chǎn)車回傳的數(shù)據(jù)。按照設(shè)計原理,量產(chǎn)車回傳數(shù)據(jù)邏輯,主要目的不是為了讓我們的模型學(xué)會怎么開車,而是用來收集BadCase的。

所謂BadCase,就是客戶認(rèn)為汽車智駕系統(tǒng)開的不好情況,一旦用戶覺得智駕系統(tǒng)對特情處理有誤,客戶就踩一下剎車,打一下方向盤,這個時候就應(yīng)該上傳數(shù)據(jù)用于分析。

但隨著智駕系統(tǒng)的實際落地,就能發(fā)現(xiàn)傳回來的數(shù)據(jù)對我們訓(xùn)練大模型而言肯定是有幫助的,但還是不夠,而這又是為什么?

原因是智駕訓(xùn)練系統(tǒng)所需要的,是一個老司機(jī)的駕駛動作,更確切的說是老司機(jī)的預(yù)判,只有老司機(jī)的預(yù)判才是有價值的。但不是所有的BadCase都是老司機(jī)處理,也可能是新手司機(jī)導(dǎo)致的BadCase,這就導(dǎo)致所采集的數(shù)據(jù)和設(shè)計目標(biāo)不一致。

這就是目前數(shù)據(jù)采集端的問題,很難保證所采集到的數(shù)據(jù)質(zhì)量。但大模型上車的重要前提,就是有足多,足夠可靠的高質(zhì)量數(shù)據(jù)。

從賀翔的分析不難看出,大模型上車對于高質(zhì)量數(shù)據(jù)的需求,遠(yuǎn)勝高算力需求。目前算力遠(yuǎn)沒有進(jìn)入到瓶頸期,只要肯花錢,可以較為容易得獲得高算力,但高質(zhì)量數(shù)據(jù)并不是一蹴而就,需要時間與測試數(shù)據(jù)的積累,是一個相對慢的過程。

第二是數(shù)據(jù)多樣性問題。

在賀翔看來,現(xiàn)在國內(nèi)沒有哪家企業(yè)數(shù)據(jù)是足夠的,尤其是長尾數(shù)據(jù)更少。數(shù)據(jù)多樣性、分布不夠的時候,模型訓(xùn)練的時候,你想讓它在模型中學(xué)到社會常識,比如這個車往這邊靠的時候是為了加塞,你要學(xué)這些東西就要有大量的數(shù)據(jù),你會發(fā)現(xiàn)有的數(shù)據(jù)不夠,怎么辦?

賀翔認(rèn)為,一方面可以借助外部大模型,通過接入外部的大語言模型,或者是多模態(tài)大模型,通過一些外部的海量知識,因為這種知識在大量互聯(lián)網(wǎng)領(lǐng)域里面就已經(jīng)存在了。通過借用外部大模型幫助智駕駛系了解人類社會的潛在常識,基于這些常識以及智駕駛系的特點,來做更好的預(yù)測,有了預(yù)測之后才能做到?jīng)]有地圖能夠像人一樣開車,只需要視覺就能夠把車開得很好。

另一方面還是要不斷積累數(shù)據(jù),尤其是高質(zhì)量的數(shù)據(jù)。

在專家眼中,現(xiàn)階段的核心問題還是數(shù)據(jù)量不夠。

02

數(shù)據(jù)共享難度大

就數(shù)據(jù)方面來說,單純依靠車企采集的數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的。業(yè)內(nèi)想到最直接方法就是建立數(shù)據(jù)聯(lián)盟。

但是在李衛(wèi)兵看來,理想很豐滿,現(xiàn)實很骨感。企業(yè)未來競爭在數(shù)據(jù),高質(zhì)量的數(shù)據(jù)是企業(yè)的核心競爭力。讓企業(yè)拿出這些數(shù)據(jù)難度其實很大。

賀翔想到的問題更為現(xiàn)實,技術(shù)上的難度。在賀翔看來,現(xiàn)實問題是數(shù)據(jù)通用程度不高。雖然每家車企對都在對車輛駕駛進(jìn)行數(shù)據(jù)收集,但不同車型的數(shù)據(jù)通用程度不太高。賀翔拿長城自己的情況舉例,長城有那種內(nèi)部有那種特別小的車歐拉,也有特別大的坦克500/800,他們之間的數(shù)據(jù)都很難通用,即使內(nèi)部格式是一樣的。

賀翔認(rèn)為,其他車企的情況應(yīng)該類似,車型之間、車企之間,不同數(shù)據(jù)的規(guī)格,不同傳感器的規(guī)格,不同傳感器的配置,數(shù)據(jù)即使湊到一起,如何統(tǒng)一接口,統(tǒng)一規(guī)范,統(tǒng)一標(biāo)準(zhǔn)等,這些都是要命的技術(shù)問題。統(tǒng)一后,拿到一份標(biāo)準(zhǔn)數(shù)據(jù)之后,我們能不能把這些數(shù)據(jù)有效的用起來,也是一個很要命的問題。

事實上,業(yè)內(nèi)由企業(yè)在做這樣的事情,例如中汽創(chuàng)智。中汽創(chuàng)智作為一家背靠中國一汽、東風(fēng)長安、國資委和汽車工程協(xié)會的企業(yè),正在推動數(shù)據(jù)聯(lián)盟的方式,來為數(shù)據(jù)建立統(tǒng)一的標(biāo)準(zhǔn),實現(xiàn)這個聯(lián)采、聯(lián)標(biāo)。

中汽創(chuàng)智智能駕駛CTO張振林表示,他們正在盡可能統(tǒng)一標(biāo)注、采集的標(biāo)準(zhǔn),包括統(tǒng)一采集車的配置,包括采集設(shè)備和傳感器的選擇,“我們已經(jīng)內(nèi)部實現(xiàn)了部分的數(shù)據(jù)的這個共享和交易?!?/span>

張振林也認(rèn)為統(tǒng)一數(shù)據(jù)這件事難度非常大。因為這里面每一家的這個算法,每一家的傳感器的這些配置,每一家的這個研發(fā)的階段不一樣,它可能會有存量數(shù)據(jù)的,還有接下來的這些量產(chǎn)數(shù)據(jù)都有不相同,這是一件非常非常難的事情,不過正因為難,才有意義。

03

開源有償和虛擬數(shù)據(jù)或是新路徑

北京汽車研究總院有限公司智能網(wǎng)聯(lián)中心副主任陳新也提出一個新的思路—開源有償。

陳新認(rèn)為,目前現(xiàn)在大家還處于百花爭艷時期,還沒到一枝獨秀的階段,還需要很長時間讓大家研究自己的標(biāo)準(zhǔn)。

而且每家車企都是一個競爭的關(guān)系,不可能把自己高質(zhì)量的數(shù)據(jù),都是花錢得來的,采了數(shù)據(jù)還得制作,還得做成數(shù)據(jù)集,尤其是高質(zhì)量的是很難的。

陳新認(rèn)為可行的方式是,車企可以做自己的一些模型,可以做一些開源的但是有償?shù)?,找國?nèi)頂尖專家做有用數(shù)據(jù)的篩選,可以做一些比賽,包括做一些高質(zhì)量數(shù)據(jù)的獲取,同時做一些模型的研究。

吉利汽車研究院技術(shù)規(guī)劃中心主任陳勇則提出,可以嘗試用虛擬數(shù)據(jù)。在陳勇看來,不是所有的語言大模型都是人工標(biāo)注,或是人工生成的,很多虛擬數(shù)據(jù)。自動駕駛其實也可以。

陳勇認(rèn)為,單靠一個車企或車型去采集還是蠻難的。周邊的環(huán)境,包括道路也在不斷的更新,我們的數(shù)據(jù)庫在不斷更新,十年前采的數(shù)據(jù),現(xiàn)在大部分是沒什么用的,再過5年,我們今天采的數(shù)據(jù)還有沒有用,不一定。模型也好,整個算法也好,環(huán)境也好,都在發(fā)生變化,這些數(shù)據(jù)如何能夠?;畋ur。

陳勇提出,通過虛擬場景,比如虛擬仿真、元宇宙建模,用數(shù)字孿生去做這個事情,模擬各種交通流,各種事故,各種天氣。一方面,靠真實道路去采集,另一些,通過虛擬場景做一些生成,用大模型做一些風(fēng)格遷移,這種場景相對可行,而且能保證數(shù)據(jù)量大的問題,做虛擬環(huán)境生成的數(shù)據(jù)量,生成效率還是蠻高的。建一個千公里一萬公里,目前3D虛擬資產(chǎn)做好的話,幾個小時就能夠生成,這可能是一條路徑。如果變成虛擬數(shù)據(jù)之后,就可以考慮哪些可以做共享。

在陳勇看來,數(shù)據(jù)目前是限制學(xué)術(shù)發(fā)展的關(guān)鍵因素之一,為了做學(xué)術(shù),為了做更前瞻的研究,企業(yè)之間可以做一些嘗試,做更前瞻的技術(shù)研究,做一些共享。

未來真的能夠上車至少要做到4B以下。陳勇認(rèn)為,如果解決某個其中一個小的問題,可能連1B模型都不需要,模型參數(shù)量的大小還是要看我們在車?yán)锩娼鉀Q什么問題,場景決定了參數(shù)量的大小,而不是一味的將大模型搬上車,因為大模型成本也非常高,對用戶來講也不是最經(jīng)濟(jì)的。

陳勇還提出,未來對于汽車行業(yè),智能網(wǎng)聯(lián)汽車來講,車云一體或者車云協(xié)同應(yīng)該是大的發(fā)展方向。

雖然生成式AI的出現(xiàn),對智能網(wǎng)聯(lián)汽車的發(fā)展帶來了新的機(jī)遇。但通過上述專家的討論可以看出,大模型真正用在車上,需要跨越的障礙還有很多,語言類的大模型要完整地搬上車顯然不現(xiàn)實,其算力消耗太過驚人,成本難以負(fù)擔(dān)。在智能駕駛領(lǐng)域想要通過大模型進(jìn)行優(yōu)化,難度也很大。

因此,大模型對智能網(wǎng)聯(lián)汽車領(lǐng)域的優(yōu)化,也面臨數(shù)據(jù)難題。大模型上車任重道遠(yuǎn)。

來源:第一電動網(wǎng)

作者:NE時代

本文地址:http://www.vlxuusu.cn/kol/212150

返回第一電動網(wǎng)首頁 >

收藏
23
  • 分享到:
發(fā)表評論
新聞推薦
大牛作者

NE時代

為新能源時代而生的汽車產(chǎn)業(yè)服務(wù)平臺,致力于為新能源汽車企業(yè)發(fā)展提供一站式服務(wù) 旗下微信公眾號:NE時代新能源

  • 717
    文章
  • 29855
    獲贊
閱讀更多文章
熱文榜
日排行
周排行
第一電動網(wǎng)官方微信

反饋和建議 在線回復(fù)

您的詢價信息
已經(jīng)成功提交我們稍后會聯(lián)系您進(jìn)行報價!

第一電動網(wǎng)
Hello world!
-->