国产免费踩踏调教视频-美女黄网站人色视频免费国产-亚洲 欧美 变态 另类 综合-国产精品久久久久久久久鸭-gv天堂gv无码男同在线观看

RoboChallenge測評:π0、π0.5領先,自變量WALL-OSS-Flow零成功率引關注

來源:今日熱點網

在具身智能競速加速升溫的當下,真實場景的客觀評測成為檢驗機器人模型能力最關鍵的一環。

近日,“具身進化論”在查詢最新發布的RoboChallenge測試結果時注意到,π0、π0.5 在成功率上遙遙領先其他開源模型。自變量機器人(X Square Robot)的大模型wall-oss-flow雖然在多次企業自我宣傳中提到,“基本上和PI、和google在同一個水平線上”,但是在多個任務上成功率偏低。根據公開的測評記錄,其在31次測試中大部分成功率為零,這一表現引發業內對其大模型真實能力的討論。

RoboChallenge是全球首個具身智能的大規模真機評測平臺,也是目前行業內最受關注的真實物理機器人評測平臺,由Dexmal原力靈機聯合Hugging Face發布,被視作“機器人界的硬核基準”。其最大特點是真機真測:評測同時接入UR5、Franka、Aloha 雙臂系統以及國產ARX-5 四類主流機器人,統一軟件棧并配備多臺RGB-D深度相機,以確保任務在高度一致的物理條件下進行。

平臺的任務覆蓋柔性物體處理、雙臂協作、多階段順序動作等真實世界的關鍵難點。其中Table30場景包含30個具有代表性的日常任務,包括疊抹布、整理果籃、插花、開關水龍頭等,難度從基礎操作遞進到長鏈條組合動作。

據了解,RoboChallenge 之所以被認為更加客觀,是因為其采用了 “任務成功率 + 進度評分”的雙指標體系。前者統計任務是否完整成功,后者將任務拆解為多個關鍵階段并按推進程度累計分值,即便任務未完成也能反映模型做到哪一步,為能力評估提供更細粒度的信息。

在該評測體系中,多款主流開源模型已完成測試。“具身進化論”對比發現,基于Physical Intelligence (Pi)系列構建的π0和π0.5是官方重點基線,它們在成功率與進度得分上整體領先其他開源模型,特別是π0.5,顯示出更成熟的任務執行能力。

圖片

π0測試結果

圖片

π0.5測試結果

相比之下,自變量的wall-oss-flow 在相同條件下的表現明顯偏弱。測評結果顯示:wall-oss-flow共測試31次,其中2次成功率為60%,1次成功率為50%,1次成功率為20%,其余所有任務成功率均為0。

圖片

wall-oss-flow測試結果

“具身進化論”從進度分情況看到,模型雖然在部分任務中能完成初段動作,但多數情況下未能完成關鍵步驟,執行鏈條往往在中段被迫中斷。這與平臺強調的“多階段連續操作能力”形成明顯差距。

公開信息顯示,自變量2023年成立,創始人兼CEO為王潛。今年9月,自變量發布其開源大模型WALL-OSS,自變量在官方宣傳稿中強調該模型“具備強大的泛化性和推理能力,在長程操作任務方面表現優于其他基礎模型”。

王潛甚至曾在接受媒體采訪時表示:“我們(自變量)的模型水平基本上和PI、和google在同一個水平線上。”

但此次RoboChallenge 的評測結果顯示,自變量模型的水平、能力在真實機器人執行任務時未能體現,與PI的模型(π0 和 π0.5)也存在明顯差距。

一位具身智能從業者對“具身進化論”分析,RoboChallenge的獨特價值正是在于提供透明、可復現的真機評估環境,避免主觀展示帶來的偏差。隨著越來越多模型加入測評,業內對“模型真實能力差異”有了更清晰的認知。

對具身智能行業而言,此次結果再次提醒:真正的競爭不在PR宣傳中,而在三方認可的評測,學術基準線,以及機器人能否穩定完成任務的那一刻。

真實世界,正在成為檢驗大模型能力的最終標準。而認識到差距,正是追趕的開始。

免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。

標簽:

推薦

財富更多》

動態更多》

熱點

主站蜘蛛池模板: 日本精彩视频一区二区| 波多野结衣中文字幕一区二区三区 | 黑人30厘米少妇高潮全部进入| 影音先锋男人av鲁色资源网| 欧美国产日韩 一区| 又粗又大又硬毛片免费看| 日本强伦姧人妻一区二区| 人妻插b视频一区二区三区| 国产美女自拍一区| 国产亚洲视频免费播放| 色综合久久久久综合99| 丰满熟妇亚洲一区| 国产成人综合一区人人| 欧美肥胖老太vidio在线视频| 美女黄网站18禁免费看| 亚洲中文字幕乱码av波多ji| 国产碰在79香蕉人人澡人人看喊| 亚洲乱码中文论理电影| 自拍网站一区二区三区| 欧美人妻少妇精品久久黑人| 99久久人妻无码精品系列| 欧美激情在线播放一区二区| 人人澡超碰碰97碰碰碰| 国产精品视频超级碰| 极品欧美一区二区| 18禁裸男晨勃露j毛网站| 免费看性视频xnxxcom| 国产一区二区三区不卡免费观看在线 | 久久国产精品久久精| 亚洲欧美精品午睡沙发| 亚洲一区二区二区国产精品激情| 免费女人高潮流视频在线观看| 最新的国产成人精品2021| 久久精品一区二区三区动漫| 成在人线av无码免费高潮求绕| 无码人妻视频一区二区三区| 亚洲一区在线精品| 免费观看又色又爽又湿的视频| 亚洲最大成人网站| 国产精品视频一区二区噜噜| 成年黄页网站大全免费无码|