综合久久久久久综合久 ,国第一产在线无码精品区,粗大进入日本高h视频,91尤物国产尤物福利在线,亚洲精品无码久久毛片波多野吉,五月婷婷丁香综合,二级特黄绝大片免费视频大片,国产欧美在线观看精品一区污

RoboChallenge測評:π0、π0.5領(lǐng)先,自變量WALL-OSS-Flow零成功率引關(guān)注

來源:今日熱點(diǎn)網(wǎng)

在具身智能競速加速升溫的當(dāng)下,真實(shí)場景的客觀評測成為檢驗(yàn)機(jī)器人模型能力最關(guān)鍵的一環(huán)。

近日,“具身進(jìn)化論”在查詢最新發(fā)布的RoboChallenge測試結(jié)果時(shí)注意到,π0、π0.5 在成功率上遙遙領(lǐng)先其他開源模型。自變量機(jī)器人(X Square Robot)的大模型wall-oss-flow雖然在多次企業(yè)自我宣傳中提到,“基本上和PI、和google在同一個(gè)水平線上”,但是在多個(gè)任務(wù)上成功率偏低。根據(jù)公開的測評記錄,其在31次測試中大部分成功率為零,這一表現(xiàn)引發(fā)業(yè)內(nèi)對其大模型真實(shí)能力的討論。

RoboChallenge是全球首個(gè)具身智能的大規(guī)模真機(jī)評測平臺,也是目前行業(yè)內(nèi)最受關(guān)注的真實(shí)物理機(jī)器人評測平臺,由Dexmal原力靈機(jī)聯(lián)合Hugging Face發(fā)布,被視作“機(jī)器人界的硬核基準(zhǔn)”。其最大特點(diǎn)是真機(jī)真測:評測同時(shí)接入U(xiǎn)R5、Franka、Aloha 雙臂系統(tǒng)以及國產(chǎn)ARX-5 四類主流機(jī)器人,統(tǒng)一軟件棧并配備多臺RGB-D深度相機(jī),以確保任務(wù)在高度一致的物理?xiàng)l件下進(jìn)行。

平臺的任務(wù)覆蓋柔性物體處理、雙臂協(xié)作、多階段順序動作等真實(shí)世界的關(guān)鍵難點(diǎn)。其中Table30場景包含30個(gè)具有代表性的日常任務(wù),包括疊抹布、整理果籃、插花、開關(guān)水龍頭等,難度從基礎(chǔ)操作遞進(jìn)到長鏈條組合動作。

據(jù)了解,RoboChallenge 之所以被認(rèn)為更加客觀,是因?yàn)槠洳捎昧?“任務(wù)成功率 + 進(jìn)度評分”的雙指標(biāo)體系。前者統(tǒng)計(jì)任務(wù)是否完整成功,后者將任務(wù)拆解為多個(gè)關(guān)鍵階段并按推進(jìn)程度累計(jì)分值,即便任務(wù)未完成也能反映模型做到哪一步,為能力評估提供更細(xì)粒度的信息。

在該評測體系中,多款主流開源模型已完成測試。“具身進(jìn)化論”對比發(fā)現(xiàn),基于Physical Intelligence (Pi)系列構(gòu)建的π0和π0.5是官方重點(diǎn)基線,它們在成功率與進(jìn)度得分上整體領(lǐng)先其他開源模型,特別是π0.5,顯示出更成熟的任務(wù)執(zhí)行能力。

圖片

π0測試結(jié)果

圖片

π0.5測試結(jié)果

相比之下,自變量的wall-oss-flow 在相同條件下的表現(xiàn)明顯偏弱。測評結(jié)果顯示:wall-oss-flow共測試31次,其中2次成功率為60%,1次成功率為50%,1次成功率為20%,其余所有任務(wù)成功率均為0。

圖片

wall-oss-flow測試結(jié)果

“具身進(jìn)化論”從進(jìn)度分情況看到,模型雖然在部分任務(wù)中能完成初段動作,但多數(shù)情況下未能完成關(guān)鍵步驟,執(zhí)行鏈條往往在中段被迫中斷。這與平臺強(qiáng)調(diào)的“多階段連續(xù)操作能力”形成明顯差距。

公開信息顯示,自變量2023年成立,創(chuàng)始人兼CEO為王潛。今年9月,自變量發(fā)布其開源大模型WALL-OSS,自變量在官方宣傳稿中強(qiáng)調(diào)該模型“具備強(qiáng)大的泛化性和推理能力,在長程操作任務(wù)方面表現(xiàn)優(yōu)于其他基礎(chǔ)模型”。

王潛甚至曾在接受媒體采訪時(shí)表示:“我們(自變量)的模型水平基本上和PI、和google在同一個(gè)水平線上。”

但此次RoboChallenge 的評測結(jié)果顯示,自變量模型的水平、能力在真實(shí)機(jī)器人執(zhí)行任務(wù)時(shí)未能體現(xiàn),與PI的模型(π0 和 π0.5)也存在明顯差距。

一位具身智能從業(yè)者對“具身進(jìn)化論”分析,RoboChallenge的獨(dú)特價(jià)值正是在于提供透明、可復(fù)現(xiàn)的真機(jī)評估環(huán)境,避免主觀展示帶來的偏差。隨著越來越多模型加入測評,業(yè)內(nèi)對“模型真實(shí)能力差異”有了更清晰的認(rèn)知。

對具身智能行業(yè)而言,此次結(jié)果再次提醒:真正的競爭不在PR宣傳中,而在三方認(rèn)可的評測,學(xué)術(shù)基準(zhǔn)線,以及機(jī)器人能否穩(wěn)定完成任務(wù)的那一刻。

真實(shí)世界,正在成為檢驗(yàn)大模型能力的最終標(biāo)準(zhǔn)。而認(rèn)識到差距,正是追趕的開始。

免責(zé)聲明:市場有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。

標(biāo)簽:

推薦

財(cái)富更多》

動態(tài)更多》

熱點(diǎn)

主站蜘蛛池模板: 热久久这里是精品6免费观看| 久草中文网| 狠狠色噜噜狠狠狠狠奇米777 | 九九热视频精品在线| 无码电影在线观看| 日韩国产综合精选| 国产拍揄自揄精品视频网站| 日韩欧美中文字幕在线韩免费| 狠狠亚洲婷婷综合色香| 婷婷综合亚洲| 爆乳熟妇一区二区三区| 婷婷六月综合| 久久semm亚洲国产| 亚洲国产精品久久久久秋霞影院| 久久频这里精品99香蕉久网址| 国产成人免费视频精品一区二区| 制服丝袜 91视频| 制服无码网站| 欧美一区二区啪啪| 毛片在线区| 蜜臀AV在线播放| 狠狠色噜噜狠狠狠狠色综合久| 一级片一区| 国产精品成人不卡在线观看| 伊人查蕉在线观看国产精品| 亚洲热线99精品视频| 国产在线拍偷自揄拍精品| 97在线公开视频| 国产成人精品综合| 久青草免费在线视频| 亚洲国产欧美国产综合久久| 午夜国产在线观看| 99久视频| 国产成人午夜福利免费无码r| 日本免费a视频| 国产一区二区网站| 久草中文网| 日韩AV无码免费一二三区| 亚洲无线一二三四区男男| 影音先锋丝袜制服| 美女潮喷出白浆在线观看视频| 99久久精品久久久久久婷婷| 国产亚卅精品无码| 国产三级视频网站| 香蕉视频在线观看www| 欧美曰批视频免费播放免费| 日韩a在线观看免费观看| 国产全黄a一级毛片| 激情国产精品一区| 午夜无码一区二区三区在线app| 国产精品亚洲片在线va| 理论片一区| 国产成人精品无码一区二| 免费在线a视频| 亚洲欧美在线综合图区| 国产十八禁在线观看免费| 色综合天天综合| 在线观看国产一区二区三区99| 亚洲中文字幕在线观看| 婷婷色狠狠干| 久久这里只有精品国产99| 色婷婷亚洲十月十月色天| 国产欧美精品一区二区| 国产一区在线观看无码| 一级毛片不卡片免费观看| 久久情精品国产品免费| 欧美亚洲国产精品第一页| 综合成人国产| 亚洲人成网站在线观看播放不卡| www.91中文字幕| a在线亚洲男人的天堂试看| 91久久偷偷做嫩草影院免费看| 毛片基地美国正在播放亚洲| 中文字幕欧美日韩高清| 福利在线不卡一区| 色久综合在线| 麻豆精品在线| 欧美视频在线第一页| 国精品91人妻无码一区二区三区| 国产丝袜啪啪| 色135综合网| 蜜臀av性久久久久蜜臀aⅴ麻豆|