999国内精品永久免费视频,色偷偷9999www,亚洲国产成人爱av在线播放,6080亚洲人久久精品,欧美超高清xxxhd

中國自動化學(xué)會專家咨詢工作委員會指定宣傳媒體
新聞詳情

斬獲全球四項第一!優(yōu)必選自研人形機器人最強大腦Thinker登頂全球

http://www.bfqmb.cn 2025-09-09 10:16 來源:優(yōu)必選

近日,優(yōu)必選自主研發(fā)的人形機器人Walker最強大腦——百億參數(shù)基座的多模態(tài)大模型:優(yōu)必選Thinker,在機器人感知與規(guī)劃領(lǐng)域三大國際權(quán)威基準測試——分別由微軟、谷歌等發(fā)起與提出的MS COCO Detection Challenge、RoboVQA與Egoplan-bench2中,針對二十一個場景、四大類型的任務(wù)規(guī)劃等命題,優(yōu)必選一舉斬獲四項全球榜單第一。榜單吸引了來自英偉達、北京智源研究院、上海AI Lab等全球頂尖團隊,角逐激烈。優(yōu)必選這次取得的成績不僅體現(xiàn)了其機器人在復(fù)雜環(huán)境感知、語義理解與長程任務(wù)規(guī)劃方面的全方位技術(shù)領(lǐng)先性,也標(biāo)志著人形機器人Walker S系列的“最強大腦”實現(xiàn)關(guān)鍵進化。

多模態(tài)感知+強推理規(guī)劃賦能工業(yè)場景規(guī)模化應(yīng)用

在智能化浪潮席卷全球的當(dāng)下,人形機器人的規(guī)劃能力已成為關(guān)鍵競爭維度之一。傳統(tǒng)機器人系統(tǒng)依賴預(yù)設(shè)指令執(zhí)行任務(wù),難以應(yīng)對高度動態(tài)、多變的現(xiàn)實場景。而本次三大基準測試的核心,正是針對人形機器人在復(fù)雜環(huán)境中的多模態(tài)感知和推理規(guī)劃能力進行系統(tǒng)化驗證。

MS COCO detection challenge由微軟發(fā)起,是計算機視覺領(lǐng)域的權(quán)威評測基準之一,在全球?qū)W術(shù)界與工業(yè)界享有極高認可度,常年被眾多頂尖論文與技術(shù)報告用作感知算法性能的衡量標(biāo)準。

RoboVQA和Egoplan-bench2則分別由谷歌DeepMind和香港大學(xué)提出,致力于構(gòu)建機器人第一視角推理與任務(wù)規(guī)劃的公開標(biāo)準基準測試,重點關(guān)注多模態(tài)、長周期任務(wù)規(guī)劃能力。參與排名的模型包括北京智源、英偉達ThinkAct、Cosmos-reason1、GPT-4V、Qwen2.5-vl等。

優(yōu)必選Thinker在MS COCO detection challenge - Segmentation Mask中排名第一

優(yōu)必選Thinker在MS COCO detection challenge - Bounding Box排名中并列第一

優(yōu)必選Thinker在RoboVQA與Egoplan-bench2中排名第一

這一成績的背后,是優(yōu)必選自主研發(fā)的Thinker架構(gòu)與訓(xùn)練框架所提供的技術(shù)支撐,通過多項關(guān)鍵技術(shù)創(chuàng)新性整合,系統(tǒng)化提升了人形機器人的感知與推理規(guī)劃能力,為工業(yè)場景的規(guī)?;瘧?yīng)用奠定基礎(chǔ)。

Prompt:"Move the material box to the conveyor belt."Thinker:"First locate the conveyor belt, then place the material box."Walker S2在工業(yè)場景中自主完成上料

第一,自研視覺編碼器基座,構(gòu)建精準環(huán)境感知。優(yōu)必選以ViT作為視覺編碼器原型,結(jié)合Co-DETR檢測頭,依托Object 365等開源數(shù)據(jù)在通用視覺任務(wù)上進行預(yù)訓(xùn)練,并通過多階段模態(tài)對齊機制實現(xiàn)了視覺-語言模態(tài)的高效融合。最終,在優(yōu)必選機器人數(shù)據(jù)集上進行微調(diào),顯著提升機器人在工業(yè)場景中對物體、障礙和操作上下文的識別能力,為復(fù)雜環(huán)境下穩(wěn)定可靠的多模態(tài)環(huán)境感知奠定了堅實基礎(chǔ)。

第二,超大規(guī)模參數(shù)架構(gòu),提供強大語義理解基礎(chǔ)。優(yōu)必選自研了具有百億參數(shù)的多模態(tài)大模型Thinker基座,實現(xiàn)視覺-語言-時間的跨域統(tǒng)一表征,使機器人能夠在多場景中準確捕捉環(huán)境細節(jié)、理解任務(wù)指令并做出推理,為自動化操作提供可靠的認知基礎(chǔ)。

第三,時序增強算法與強化學(xué)習(xí)方法,增強長程任務(wù)規(guī)劃連貫可靠。通過大模型蒸餾技術(shù),將百億參數(shù)模型效果濃縮至7B參數(shù)模型中,在保持高性能的同時增強多步驟任務(wù)分解與連續(xù)決策能力。該優(yōu)化使模型可以在端側(cè)部署,用機器人自身搭載的算力就可實時自主拆解復(fù)雜流程,避免規(guī)劃中斷或邏輯混亂,在流程嚴格、環(huán)環(huán)相扣的工業(yè)場景中展現(xiàn)出關(guān)鍵價值,將有力保障生產(chǎn)連貫性和操作安全性。

通用基礎(chǔ)能力打造+工業(yè)場景精調(diào)共創(chuàng)工業(yè)人形機器人應(yīng)用生態(tài)

工業(yè)場景的精調(diào)策略正成為推動多模態(tài)大模型邁向?qū)嶋H應(yīng)用的關(guān)鍵力量,為人形機器人在生產(chǎn)線上的穩(wěn)定、高效部署奠定了技術(shù)基礎(chǔ),加速其從技術(shù)驗證走向規(guī)?;瘜崙?zhàn)應(yīng)用的進程。

優(yōu)必選創(chuàng)新性地采用“通用基礎(chǔ)能力打造+工業(yè)場景精調(diào)”的微調(diào)策略,基于超200萬條視頻數(shù)據(jù)構(gòu)成的大規(guī)模訓(xùn)練集進行預(yù)訓(xùn)練,隨后引入優(yōu)必選在工廠實訓(xùn)中積累的億級工業(yè)數(shù)據(jù)集進行微調(diào),并對工業(yè)場景任務(wù)規(guī)劃數(shù)據(jù)加以清洗與整合,構(gòu)建高效多模態(tài)大模型學(xué)習(xí)閉環(huán)。通過這一流程,模型能夠快速學(xué)習(xí)工業(yè)場景的視覺特征、任務(wù)規(guī)則與操作偏好,最終顯著提升人形機器人在工業(yè)場景中的理解準確率、規(guī)劃適配性與決策可靠性,實現(xiàn)在多種復(fù)雜場景中的泛化性與穩(wěn)定性。

Prompt:"Move the material box onto the pile of boxes next to it."Thinker:"The middle slot is the best one for the material box."Walker S2在工業(yè)場景中自主規(guī)劃任務(wù)

在Thinker大模型技術(shù)體系的全方位賦能下,優(yōu)必選新一代工業(yè)人形機器人Walker S2 實現(xiàn)“最強大腦”再進化,不僅具備高精準環(huán)境感知能力,更能夠在動態(tài)場景中高效完成任務(wù)分解、實時調(diào)整與穩(wěn)定規(guī)劃。借助Thinker,Walker S2可精準識別設(shè)備、物料與障礙物,深度理解場景語義及操作前后邏輯關(guān)聯(lián),顯著提升長周期任務(wù)的執(zhí)行穩(wěn)定性。在復(fù)雜流水線環(huán)境中,機器人展現(xiàn)出持續(xù)連貫的規(guī)劃能力,大幅降低對人工干預(yù)的依賴。

實際應(yīng)用數(shù)據(jù)顯示,相比僅基于通用數(shù)據(jù)微調(diào)的模型,采用工業(yè)數(shù)據(jù)集進行二次微調(diào)后,Walker S2在拆碼垛規(guī)劃等典型任務(wù)的中的規(guī)劃精度提升超過 20%,有力驗證了該技術(shù)方案的產(chǎn)業(yè)化價值,相關(guān)技術(shù)報告將在arxiv上發(fā)布。

Prompt:"Move the material box onto the roller rack."Thinker:"First locate the roller rack and then place material box."Walker S2在工業(yè)場景中自主規(guī)劃任務(wù)

當(dāng)前,人形機器人正在進入大規(guī)模應(yīng)用的關(guān)鍵階段,其發(fā)展亟需與開發(fā)者共同構(gòu)建開放、協(xié)同的應(yīng)用生態(tài)。為此,優(yōu)必選將逐步開源一系列業(yè)界稀缺的工業(yè)場景數(shù)據(jù)集與通用基礎(chǔ)大模型,為全行業(yè)提供源自實際應(yīng)用一線的高質(zhì)量合規(guī)數(shù)據(jù)資源。開發(fā)者可基于優(yōu)必選多模態(tài)大模型Thinker,面向各類新場景開展精調(diào)與二次開發(fā),助力提升開發(fā)效率。我們期待與全球開發(fā)者攜手,共創(chuàng)工業(yè)人形機器人的應(yīng)用生態(tài),為具身智能行業(yè)的加速發(fā)展注入持續(xù)動能。

版權(quán)所有 工控網(wǎng) Copyright?2025 Gkong.com, All Rights Reserved