你的位置:红色av > 色之阁 >


色中色论坛 李飞飞团队具身智能新作:500好意思元,一切家务机器东谈主帮你干

发布日期:2025-07-05 23:48    点击次数:62


色中色论坛 李飞飞团队具身智能新作:500好意思元,一切家务机器东谈主帮你干

现如今机器东谈主又是跑步又是后空翻色中色论坛,但到底什么时候能作念上家务给东谈主类养养老?

目下,为了挑战这个难题,李飞飞团队带来了具身智能酌量最新恶果——� � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � ( � � � � � � ) ,一个不断机器东谈主在家庭任务中全身操作问题的详细框架。

而且,其中枢组件的齐全资本还不到 500 好意思元。

机器东谈主学习领域中的一个"圣杯"级挑战是推论通用的日常家庭迁移操作任务。借助一款新式双臂迁移机器东谈主,咱们的最新恶果—— BRS 正在尝试攻克这一极为贫寒且尚未不断的难题!

拧开门把手,早上出去丢个垃圾:

等大东谈主上班后,再维护整理下杂货架:

顺带打理下客厅,将脏碗放到洗碗机里:

然后任劳任怨,再里里外外刷干净马桶:

吭哧吭哧一顿打理下来,一个机器东谈主就把总共家务活包圆了。

而且酌量团队还发现,即使干活时出了岔子,机器东谈主也能自我改造。

(一驱脱手臂范围无法够着马桶盖,然后有一个上前歪斜肉体的动作)

网友们纷繁清晰,离齐全可通用的家庭机器东谈主又更进一步了。

那么,李飞飞团队究竟是如何作念到的?

中枢对准三项全身放胆智商

黑丝诱惑

把柄论文先容,通过考究分析 BEHAVIOR-1K(包含 1000 项日常家庭步履的机器东谈主测试基准),团队领先详情了机器东谈主顺利完成多样家务步履所必需的三项全身放胆智商:

两只机械手臂之间的协同配合智商;

自若精准的导航;

机械手臂结尾推论器领有泛泛的可操作范围和波及智商;

尤其是临了一项,大深广东谈主可能冷落了结尾推论器放胆这一要津智商。

因为在家庭环境中色中色论坛,日常物品往往位于不同高度和位置,因此机器东谈主也必须相应地调节其伸展范围。

基于上述推敲,团队合计给家务机器东谈主配备双臂、迁移底座和无邪躯干,是齐全全身操作的要津。

具体而言,他们遴荐了 Galaxea R1 机器东谈主(国内星海图出品)手脚硬件,其具备两个 6 解放度手臂(每个手臂都配备了一个平行缄口夹合手器)、4 解放度躯干和全向迁移底座,能知足家庭任务所需的要津智商。

不外,这类复杂贪图给战略学习次序带来了要紧挑战,尤其是在数据界限化鸠合和全身合作方面。

对此,BRS 通过两项要津翻新来不断软硬件协同问题:

推出 JoyLo,一种通用的低资本全身遥操作接口;

提倡新的学习算法 WB-VIMA;

张开来说,JoyLo(Joy-Con on Low-Cost Kinematic-Twin Arms)通过基于把持木偶的次序,运用知晓学孪生臂和任天国 Joy-Con 放胆器,齐全高效的全身放胆。

同期提供丰富的用户响应,优化了战略学习数据质地。

在总资本不高出 500 好意思元的情况下,团队在 R1 机器东谈主上齐全了 JoyLo 的贪图意见:

高效的全身协调放胆系统,齐全复杂动作的怒放衔尾;

丰富的用户响应机制,带来直不雅的而已操作体验;

确保高质地的示范动作,进步战略学习效果;

低资本齐全决策,大幅提高系统可及性;

及时、陋劣的放胆器贪图,确保操作无缝顺畅。

而另一项 WB-VIMA(Whole-Body VisuoMotor Attention)学习算法,中枢意见是运用机器东谈主的固有知晓学档次结构来建模全身动作。

基于 Transformer,通过自回首全身动作去噪和多模态不雅察扎目力机制,WB-VIMA 能匡助机器东谈主灵验学习协调的全身动作。

同期在考验和部署时,使用特定的优化器和噪声改革器,并在责任站上进行推理以齐全低蔓延放胆。

值得一提的是,WB-VIMA 还不断了一个要津问题:

尤其在东谈主形机器东谈主中,在迁移基座或躯干动作中出现的渺小诞妄会在结尾推论器处显贵放大。

对此,WB-VIMA 在筹备下流组件动作时,不是孤随即进行,而是先分析上游组件现时的动作情状、位置等信息,将这些信息手脚条目和依据,去推算下流组件应该作念出若何的动作,从而竣玄妙体的协调知晓。

BRS 适用于多样家庭任务

酌量团队在五个具有代表性的家庭任务上评估 BRS,包括清洁房屋、清洁茅厕、倒垃圾、放弃物品到架子上和曝晒穿戴。

放弃标明,BRS 能完成多种家庭任务。

同期,执行要领还进一步考据了两个翻新次序的灵验性。

合座而言,JoyLo 在数据网罗着力、战略学习适用性和用户体验方面推崇出色,WB-VIMA 在性能上优于基线次序。

对于 JoyLo,团队对10 名参与者进行了全面的用户酌量,以评估 JoyLo 的效果过甚网罗数据对战略学习的适用性。

下图为 JoyLo 与 VR 放胆器和 Apple Vision Pro 进行比拟的清晰:

从放弃来看,JoyLo 在总共接口中推崇出色,任务顺利率最高、完成期间最短,其完成任务平均顺利率是 VR 放胆器的 5 倍,而使用 Apple Vision Pro 无东谈主能完成一王人任务。

且在用户酌量中,总共参与者都合计 JoyLo 是最友好的界面。

另外,WB-VIMA 在总共任务中全面高出基准次序。

其端到端任务顺利率比 DP3 高 13 倍,比 RGB-DP 高 21 倍;平均子任务推崇别离优于 DP3(1.6 倍)和 RGB-DP(3.4 倍)。

而且 WB-VIMA 在职务中出错的几率更小。它与环境物体的碰撞小数,且真的不会因施加过度力量而导致电机失去能源。

临了,对于 BRS 框架的总共责任已一王人开源,感兴致不错进一步了解。

名堂主页:

https://behavior-robot-suite.github.io/

论文:

https://arxiv.org/abs/2503.05652

算法代码:

https://github.com/behavior-robot-suite/brs-algo

机器东谈主代码:

https://github.com/behavior-robot-suite/brs-ctrl

考验数据:

https://huggingface.co/datasets/behavior-robot-suite/data

参考和解:

https://x.com/drfeifei/status/1899127976979226835色中色论坛



    热点资讯

    相关资讯