您的位置:首页 >资讯 >

RoboChallenge测评:π0、π0.5领先,自变量WALL-OSS-Flow零成功率引关注

2025-12-03 21:34:47    来源:今日热点网

在具身智能竞速加速升温的当下,真实场景的客观评测成为检验机器人模型能力最关键的一环。

近日,“具身进化论”在查询最新发布的RoboChallenge测试结果时注意到,π0、π0.5 在成功率上遥遥领先其他开源模型。自变量机器人(X Square Robot)的大模型wall-oss-flow虽然在多次企业自我宣传中提到,“基本上和PI、和google在同一个水平线上”,但是在多个任务上成功率偏低。根据公开的测评记录,其在31次测试中大部分成功率为零,这一表现引发业内对其大模型真实能力的讨论。

RoboChallenge是全球首个具身智能的大规模真机评测台,也是目前行业内最受关注的真实物理机器人评测台,由Dexmal原力灵机联合Hugging Face发布,被视作“机器人界的硬核基准”。其最大特点是真机真测:评测同时接入UR5、Franka、Aloha 双臂系统以及国产ARX-5 四类主流机器人,统一软件栈并配备多台RGB-D深度相机,以确保任务在高度一致的物理条件下进行。

台的任务覆盖柔性物体处理、双臂协作、多阶段顺序动作等真实世界的关键难点。其中Table30场景包含30个具有代表性的日常任务,包括叠抹布、整理果篮、插花、开关水龙头等,难度从基础操作递进到长链条组合动作。

据了解,RoboChallenge 之所以被认为更加客观,是因为其采用了 “任务成功率 + 进度评分”的双指标体系。前者统计任务是否完整成功,后者将任务拆解为多个关键阶段并按推进程度累计分值,即便任务未完成也能反映模型做到哪一步,为能力评估提供更细粒度的信息。

在该评测体系中,多款主流开源模型已完成测试。“具身进化论”对比发现,基于Physical Intelligence (Pi)系列构建的π0和π0.5是官方重点基线,它们在成功率与进度得分上整体领先其他开源模型,特别是π0.5,显示出更成熟的任务执行能力。

21.jpg

π0测试结果

22.jpg

π0.5测试结果

相比之下,自变量的wall-oss-flow 在相同条件下的表现明显偏弱。测评结果显示:wall-oss-flow共测试31次,其中2次成功率为60%,1次成功率为50%,1次成功率为20%,其余所有任务成功率均为0。

23.jpg

wall-oss-flow测试结果

“具身进化论”从进度分情况看到,模型虽然在部分任务中能完成初段动作,但多数情况下未能完成关键步骤,执行链条往往在中段被迫中断。这与台强调的“多阶段连续操作能力”形成明显差距。

公开信息显示,自变量2023年成立,创始人兼CEO为王潜。今年9月,自变量发布其开源大模型WALL-OSS,自变量在官方宣传稿中强调该模型“具备强大的泛化性和推理能力,在长程操作任务方面表现优于其他基础模型”。

王潜甚至曾表示:“我们(自变量)的模型水平基本上和PI、和google在同一个水平线上。”

但此次RoboChallenge 的评测结果显示,自变量模型的水平、能力在真实机器人执行任务时未能体现,与PI的模型(π0 和 π0.5)也存在明显差距。

一位具身智能从业者对“具身进化论”分析,RoboChallenge的独特价值正是在于提供透明、可复现的真机评估环境,避免主观展示带来的偏差。随着越来越多模型加入测评,业内对“模型真实能力差异”有了更清晰的认知。

对具身智能行业而言,此次结果再次提醒:真正的竞争不在PR宣传中,而在三方认可的评测,学术基准线,以及机器人能否稳定完成任务的那一刻。

真实世界,正在成为检验大模型能力的最终标准。而认识到差距,正是追赶的开始。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

标签:

精彩阅读

精彩看点:央视直播 今晚曼城追分之战!专虐升班马 哈兰德剑指100球

第12万列鸣笛发车!中欧班列书写亚欧互联互通新篇章

每日速看!德国整体CPI基本与上月持平 料不会改变欧洲央行立场

内蒙古单体容量最大的独立新型储能电站建成投运

中国卫生集团(00673.HK)中期净亏损为1040万港元 同比减少约40.23%

2025年低碳环保企业值得研究!(11月28日)

天府文旅:莱茵达控股集团有限公司及其一致行动人高靖娜持股比例已降至5.00%

速递!大悦城控股下调"23大悦01"债券利率至2.21%并启动回售机制

焦点热文:包头市两家参评主体获第二届“内蒙古慈善奖”

家电消费避坑指南:问题预警与红黑榜护体策略|即时看

草酸钴商品报价动态(2025-11-28)

紧跟养老金融浪潮 民生银行广州分行全方位推进个人养老金业务开展

PriceSeek提醒:山东汇丰石化液化气报价上调20元 今日观点

热点聚焦:淘气天尊:市场跌不下去,就应该大胆看涨!

瑞丽市丰黛珠宝店(个体工商户)成立 注册资本5万人民币_今日热文

舟山渔民画三度亮相中国美术馆-每日热议

社会广角“班超”,不仅仅是一项赛事 滚动

吉峰科技成立低空科技公司 含无人飞行器业务

热点评!中国水务(00855.HK):截至二零二五年九月三十日止六个月中期业绩公布内容摘要

如何看待基金投资的短期波动?

【快播报】银行理财组合该如何搭配更稳妥?

热议:蜜雪集团(02097.HK)盘中涨超3%

我国推动“两重”建设取得阶段性进展

哲科:我们确实踢得很烂,但我们需要球迷支持而不是嘘声 快资讯

我国将建立健全具身智能行业准入退出机制

中信银行60亿元“三农”专项金融债券发行完毕-焦点观察

高铁排名前十的公司(第三季度每股收益排行榜)

助贷“加减法”:息费亮底,合作瘦身

成长型基金适合风险承受力高的人吗?

我国电源规模最大“沙戈荒”大基地项目开工-焦点消息

今日报丨罗马2025年第20次以1球优势赢球,同期五大联赛球队仅次于皇马

【ETF动向】11月27日招商上证科创板综合ETF基金涨0.4%,份额减少500万份 热点

当前热议!航天软件大宗交易成交11.50万股 成交额200.45万元

余热发电龙头,共一家上市公司(2025/11/27)

江苏博云(301003.SZ):蓝叁创投拟减持不超过1%股份|今日要闻

新疆4处公路收费站终止收费!-微速讯

今日热文:山梨糖醇液商品报价动态(2025-11-27)

雅化集团:预计将于2026年开展硫化锂中试线建设 资讯

沪港联合(01001)将于2026年1月8日派发中期股息每股0.02港元 最新消息

焦点快看:一图了然 | “电子咖啡手环”是真提神还是智商税?

跃岭股份主力资金持续净流入,3日共净流入2025.85万元

性能旗舰新选择 一加 Ace 6T定档12月3日发布

国电电力在威海乳山市成立新公司,含海水淡化处理业务|每日资讯

今头条!【盘中播报】沪指涨0.65% 基础化工行业涨幅最大

每日短讯:2025年定制家居龙头股名单来啦,股民必看!

今日热议:银行中间业务收费标准有哪些?

播报:ST华西:目前正在开展前期准备工作,尚未正式进入施工阶段

视讯!济南海尔第九届感恩月重磅启幕 以真心回馈亿万用户信赖

大和:料周大福(01929)下半年业绩指引保守 升目标价至18港元 重申“买入”评级 每日视讯

观焦点:银行理财产品的流动性该如何权衡?

市域(郊)铁路成都至德阳线启动预制梁架设

纽维将出任阿斯顿·马丁车队领队

球队是否有姆巴佩依赖症?姆巴佩:问题不合适,进球是我职责|观热点

当前聚焦:财华社集团发盈喜 预期中期股东应占盈利不超过200万港元同比扭亏为盈

华海清科:11月26日持仓该股ETF资金净流出9523.40万元,3日累计净流出1.39亿元

工业富联回购价上限从每股19.36元提高至75元_最新

中金公司:公司2025年前三季投资收益及公允价值变动损益增加主因以公允价值计量的金融工...

精选!五年期定期存款,“已下架”

当前热议!立讯精密:有充分理由做光模块的业务

山西运城一幼儿园私自抽血体检,未提前告知家长引热议,教育局回应

中国银河证券吴砚靖:2026年模型平权将推动人工智能应用从AI赋能走向AI原生 今日热闻

当代旗舰第五代骁龙8正式发布,一加 Ace 6T全球首发搭载

阿里千问进入电脑桌面,与夸克AI浏览器深度融合-最新资讯

飞乐音响(600651):飞乐音响关于持股5%以上股东减持股份计划期限届满暨减持结果

阿拉丁拟收购佑科35%股权 丰富产品线-速读

观焦点:蚂蚁保车险接入“安心赔”,近3年在保车辆数年均增长超30%

生意社:11月26日上海地区钴粉报价暂稳

每日精选:收官采收!罗甸最后一批火龙果清甜下线,全年产业丰收圆满落幕​

银行服务收费标准如何了解? 热门

每日快播:九寨沟·冬

今日要闻!贝达药业:盐酸恩沙替尼胶囊术后辅助治疗适应症药品注册申请获受理

PriceSeek提醒:铁矿石螺纹钢需求下滑分析-每日视点

时讯:券商相关公司十强_三季度概念股营收增幅榜单出炉!

2025西安国际创业大赛晋级赛火热开赛 129个项目竞争40个总决赛名额

快播:汽车发动机常见故障有哪些?

2025世界慢阻肺日|中国红十字基金会携手赛诺菲在多地开展专题疾病教育会

小咖秀丨高鸣让:从传统龙韵到赛博新生

当代置业达成复牌指引 11月26日上午起复牌|每日消息

国家能源局发布2025年10月全国可再生能源绿色电力证书核发及交易数据

每日视讯:爱吃三文鱼的有福了!我国深远海养殖事业有好消息

聚碳酸酯板块龙头2025年,看下有没有你关注的?(2025/11/25)_当前聚焦

提上首发状态一般?火箭小将仅得7分 几场过后或能完成蜕变 当前热点

阳光纸业(02002.HK):持续关连交易前框架协议的补充协议内容摘要

思瑞浦:筹划购买奥拉股份股权 明起停牌

河南鲁山8岁智力障碍女童走失五日 家属:孩子在化粪池中找到,已无生命体征

华纬科技:公司第四季度产能利用率较高 每日讯息

播报:宝尊电商-W(09991.HK)第三季度净亏损为1.07亿元

通江县唱歌镇王爱马家庭农场(个体工商户)成立 注册资本3万人民币_每日报道

速读:主力资金动向 50.00亿元潜入电子业

2025年老年人打车概念股票,这份名单值得研究(11/25)

石四药集团(02005.HK)11月25日回购200.00万股,耗资596.56万港元_今日热文

当前信息:德科立(688205)龙虎榜数据(11-25)

独家视频丨首次应急发射!神舟二十二号飞船发射圆满成功

陕西华达:目前收购华经微电子相关工作在有序推进中|焦点讯息

Allegro与英诺赛科联合推出全GaN参考设计, 赋能AI数据中心电源

【异动提醒】众生药业(002317)11月25日13点57分触及涨停板|焦点精选

当前看点!【异动提醒】华瓷股份(001216)11月25日13点40分触及跌停板

网络游戏股异动拉升 富春股份直线涨停

航行警告!渤海部分海域进行军事演习,禁止驶入

今热点:新疆温宿:冬日限定!天山脚下邂逅“冰河世纪”

出发!周深带你回乡见证美的进化论_播资讯

每日精选:河北清大环保成功签约VOCs废气治理项目

生意社:11月24日MTBE外盘市场收盘价波动 热点评

每日热闻!11月25日生意社涤纶短纤基准价为6299.97元/吨

中国核电:融资净偿还517.83万元,融资余额21.96亿元(11-24)

中源协和:连续7日融资净偿还累计7489.54万元(11-24)|播资讯

5年前的今天,“长五”送“嫦五” 登月去取土!

美股异动 | Q3每股盈利大幅增长 趣店(QD.US)盘初涨超6% 快资讯