蓋世汽車訊 可與物理世界互動(dòng)的具身AI(人工智能)代理在各種應(yīng)用中都具有巨大潛力,但缺乏訓(xùn)練數(shù)據(jù)仍是其面臨的主要障礙之一。據(jù)外媒報(bào)道,為解決該挑戰(zhàn),英國(guó)倫敦帝國(guó)理工學(xué)院(Imperial College London)和谷歌DeepMind的研究人員推出了一種名為擴(kuò)散增強(qiáng)型代理(Diffusion Augmented Agent,DAAG)的新型框架,利用了大型語(yǔ)言模型(LLM)、視覺(jué)語(yǔ)言模型(VLM)以及擴(kuò)散模型的力量,以提升具身代理的學(xué)習(xí)效率和遷移學(xué)習(xí)能力。
DAAG模型(圖片來(lái)源:arXiv)
為何數(shù)據(jù)效率對(duì)具身代理很重要?
近年來(lái),LLM和VLM取得了令人驚嘆的進(jìn)展,為其應(yīng)用于機(jī)器人和嵌入式AI領(lǐng)域帶來(lái)了希望。但是,雖然LLM和VLM可以在從互聯(lián)網(wǎng)上抓取來(lái)的大量文本及圖像數(shù)據(jù)集上進(jìn)行訓(xùn)練,但是具身AI系統(tǒng)需要通過(guò)與物理世界的交互來(lái)學(xué)習(xí)。
現(xiàn)實(shí)世界對(duì)具身AI系統(tǒng)的數(shù)據(jù)收集提出了幾個(gè)挑戰(zhàn)。首先,物理環(huán)境比數(shù)字世界更加復(fù)雜和不可預(yù)測(cè)。其次,機(jī)器人和其他具身AI系統(tǒng)依賴于物理傳感器和執(zhí)行器,而此類傳感器和執(zhí)行器可能會(huì)有速度慢、有噪聲、易故障等問(wèn)題。研究人員們認(rèn)為,克服這一障礙的關(guān)鍵在于更有效地利用該代理現(xiàn)有的數(shù)據(jù)和經(jīng)驗(yàn)。
DAAG是什么?
來(lái)源:第一電動(dòng)網(wǎng)
作者:蓋世汽車
本文地址:http://www.vlxuusu.cn/news/shichang/241598
以上內(nèi)容轉(zhuǎn)載自蓋世汽車,目的在于傳播更多信息,如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)(www.vlxuusu.cn)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。