桌面級(jí)AI機(jī)器人平臺(tái)設(shè)計(jì)與多智能體算法開發(fā)
機(jī)械工程資助企業(yè): 上海光塑機(jī)械科技有限公司
資助年份: 2025
企業(yè)導(dǎo)師: 梁帥
指導(dǎo)教師: 張執(zhí)南
項(xiàng)目成員: 李嘉新,鮑陳昕宇
項(xiàng)目簡(jiǎn)介
項(xiàng)目概述
隨著移動(dòng)機(jī)器人技術(shù)的蓬勃發(fā)展,具身智能與群體智能逐漸成為學(xué)術(shù)界和工業(yè)界的研究熱點(diǎn)。機(jī)器人足球作為一種典型的多智能體協(xié)同動(dòng)態(tài)任務(wù),環(huán)境變化迅速、反饋稀疏且具有延遲性,因而蘊(yùn)含豐富的理論價(jià)值與廣闊的應(yīng)用前景。本項(xiàng)目以機(jī)器人踢足球任務(wù)為研究對(duì)象,旨在提升機(jī)器人在動(dòng)態(tài)場(chǎng)景下的自主決策與團(tuán)隊(duì)協(xié)作能力。研究?jī)?nèi)容包括基于相關(guān)機(jī)器人平臺(tái)的硬件與外部模塊設(shè)計(jì)、面向 ODE 引擎的高效仿真環(huán)境構(gòu)建,以及強(qiáng)化學(xué)習(xí)多智能體控制策略的訓(xùn)練與真機(jī)部署。
項(xiàng)目目標(biāo)
完善硬件生態(tài)
構(gòu)建并集成支持完成桌面機(jī)器人踢足球任務(wù)的關(guān)鍵硬件模塊,確保系統(tǒng)穩(wěn)定可靠。構(gòu)建仿真平臺(tái)
搭建高效、可擴(kuò)展的機(jī)器人足球仿真環(huán)境,用于多智能體踢足球算法訓(xùn)練和測(cè)試。設(shè)計(jì)控制框架
基于強(qiáng)化學(xué)習(xí)算法,開發(fā)多智能體踢足球任務(wù)的訓(xùn)練框架,并最終得到有效的多智能體控制策略。真機(jī)驗(yàn)證
在桌面真實(shí)機(jī)器人平臺(tái)上部署并評(píng)估控制框架,驗(yàn)證系統(tǒng)的可行性和穩(wěn)定性。應(yīng)用系統(tǒng)開發(fā)
打通云端與移動(dòng)端接口,實(shí)現(xiàn)對(duì)機(jī)器人任務(wù)的遠(yuǎn)程監(jiān)控與管理,提升用戶使用體驗(yàn)。
項(xiàng)目成果
硬件設(shè)計(jì)與測(cè)試
完成發(fā)射夾爪和定位足球硬件的設(shè)計(jì)與測(cè)試,實(shí)現(xiàn)了真機(jī)環(huán)境下穩(wěn)定可靠的發(fā)射與識(shí)別功能。仿真平臺(tái)搭建
基于 ODE 引擎搭建兼容 gymnasium 與 AEC 接口的仿真平臺(tái),實(shí)現(xiàn)高效多智能體物理模擬與訓(xùn)練。策略訓(xùn)練成果
采用自對(duì)弈、課程學(xué)習(xí)及獎(jiǎng)勵(lì)塑形技術(shù),成功訓(xùn)練出高效多智能體協(xié)作踢球策略,在仿真環(huán)境中表現(xiàn)優(yōu)異。





