蓋世汽車訊 近年來,機(jī)器人專家開發(fā)了各種各樣的系統(tǒng),旨在解決不同的現(xiàn)實(shí)世界任務(wù),如完成家務(wù)、遞送包裹,或在指定環(huán)境中尋找目標(biāo)物體。該領(lǐng)域的一個(gè)關(guān)鍵目標(biāo)是,開發(fā)算法以支持在具有不同體型和特征的機(jī)器人之間可靠地轉(zhuǎn)移特定技能。這將有助于快速訓(xùn)練機(jī)器人完成新任務(wù),從而拓展其能力。
據(jù)外媒報(bào)道,加州大學(xué)伯克利分校(UC Berkeley)的研究人員開發(fā)出RoVi-Aug。這是一種新的計(jì)算框架,旨在增強(qiáng)機(jī)器人數(shù)據(jù)并促進(jìn)不同機(jī)器人之間實(shí)現(xiàn)技能轉(zhuǎn)移。該研究發(fā)表在預(yù)印本服務(wù)器arXiv上。該方法利用先進(jìn)的生成模型來增強(qiáng)圖像數(shù)據(jù),并為不同的機(jī)器人創(chuàng)建具有不同攝像視圖的合成視覺任務(wù)演示。
研究人員表示,“當(dāng)代機(jī)器學(xué)習(xí)系統(tǒng)成果表現(xiàn)出卓越的泛化能力,特別是生成模型,并激勵(lì)研究人員探索如何在機(jī)器人技術(shù)中實(shí)現(xiàn)類似的泛化能力。自今年年初以來,我們一直在研究跨視點(diǎn)和跨機(jī)器人泛化的問題?!?/p>
在之前進(jìn)行研究時(shí),研究人員發(fā)現(xiàn)了在不同機(jī)器人之間進(jìn)行學(xué)習(xí)泛化的一些挑戰(zhàn)。具體來說,他們發(fā)現(xiàn)當(dāng)機(jī)器人數(shù)據(jù)集中包含的場景分布不均勻時(shí),例如其中特定機(jī)器人視覺效果和攝像角度占主導(dǎo)地位,這使得它們在向不同機(jī)器人教授相同技能時(shí)效果較差。
有趣的是,研究人員發(fā)現(xiàn),許多現(xiàn)有機(jī)器人訓(xùn)練數(shù)據(jù)集具有不平衡性,包括一些最完善的數(shù)據(jù)集。例如,即使是Open-X Embodiment數(shù)據(jù)集(OXE,一個(gè)廣泛用于訓(xùn)練機(jī)器人算法的數(shù)據(jù)集,其中包含不同機(jī)器人完成不同任務(wù)的演示),其中一些機(jī)器人的數(shù)據(jù)也更多,例如Franka和xArm機(jī)械手。
數(shù)據(jù)集的這種偏差,使機(jī)器人策略模型傾向于過度擬合特定的機(jī)器人類型和視點(diǎn)。研究人員表示:“為了緩解這一問題,2024年2月,我們提出了一種測試時(shí)間適應(yīng)算法Mirage。該算法通過交叉繪制(cross-painting),在訓(xùn)練期間將看不見的目標(biāo)機(jī)器人轉(zhuǎn)化為能看見的源機(jī)器人,從而創(chuàng)建源機(jī)器人在測試時(shí)執(zhí)行任務(wù)的假象?!?/p>
來源:第一電動網(wǎng)
作者:蓋世汽車
本文地址:http://www.vlxuusu.cn/news/shichang/250492
以上內(nèi)容轉(zhuǎn)載自蓋世汽車,目的在于傳播更多信息,如有侵僅請聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動網(wǎng)(www.vlxuusu.cn)立場。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請聯(lián)系admin#d1ev.com(#替換成@)刪除。