在剛剛過去的2024年,具身智能無疑是科技領(lǐng)域最受矚目的焦點。全球科技巨頭紛紛布局,從OpenAI對Figure AI的戰(zhàn)略投資,到特斯拉Optimus的持續(xù)迭代升級,再到英偉達積極構(gòu)建具身智能與人形機器人生態(tài),種種跡象表明,具身智能正處于快速發(fā)展的風(fēng)口。
這一年,具身智能相關(guān)技術(shù)突破不斷涌現(xiàn)。特斯拉Optimus在運動控制和任務(wù)執(zhí)行方面取得了顯著進展,展現(xiàn)出強大的迭代速度;Google DeepMind的RT系列模型,基于視覺-語言-動作(VLA)模型的端到端機器人控制學(xué)習(xí),大幅提升了機器人的泛化能力,為復(fù)雜任務(wù)的執(zhí)行奠定了基礎(chǔ);Figure AI的人形機器人在寶馬工廠的成功應(yīng)用,預(yù)示著具身智能商業(yè)化落地的可行性正在逐步提升。與此同時,國內(nèi)的智元機器人、宇樹科技、優(yōu)必選等企業(yè)也在積極探索技術(shù)創(chuàng)新和商業(yè)化路徑,并取得了階段性成果,例如,宇樹科技在四足、人形機器人領(lǐng)域持續(xù)深耕,推出了面向工業(yè)巡檢等場景的解決方案;優(yōu)必選則在人形機器人領(lǐng)域不斷探索,其Walker系列機器人在運動控制和人機交互方面取得了顯著進展。
從技術(shù)層面來看,多模態(tài)大模型的興起為具身智能的發(fā)展注入強勁動力。通過融合視覺、語言、觸覺、力覺等多模態(tài)信息,機器人能夠更全面地感知和理解環(huán)境,進而做出更精準的決策。同時,世界模型(WFMs)的出現(xiàn)為具身智能的訓(xùn)練和測試提供了新的范式,通過在虛擬環(huán)境中進行模擬訓(xùn)練,有效降低了數(shù)據(jù)采集成本,并有望加快算法迭代速度,部分解決數(shù)據(jù)稀缺的瓶頸問題。此外,強化學(xué)習(xí)、模仿學(xué)習(xí)等算法的進步也為具身智能的發(fā)展提供了重要的技術(shù)支撐。
具身智能的應(yīng)用前景廣闊,涵蓋工業(yè)、服務(wù)、特種、醫(yī)療等多個領(lǐng)域。目前,工業(yè)制造場景成為具身智能率先落地的主要領(lǐng)域,在自動化裝配、焊接、噴涂、搬運等方面取得了良好的應(yīng)用效果,如微億智造等企業(yè)已推出面向工業(yè)場景的具身智能解決方案。在物流領(lǐng)域,AMR等機器人已廣泛應(yīng)用于倉儲物流場景,結(jié)合其他上層模塊,實現(xiàn)自動化分揀、搬運、配送,顯著提高了物流效率。未來,隨著技術(shù)的不斷成熟,具身智能在服務(wù)場景,尤其人形機器人在家政服務(wù)、陪伴老人、照顧兒童等領(lǐng)域的應(yīng)用潛力將得到充分釋放,有望極大地解放人類勞動力,讓人類聚焦更有價值的創(chuàng)造性事務(wù)。
在此背景下,甲子光年智庫撰寫了《2025具身智能行業(yè)發(fā)展研究報告:具身智能技術(shù)發(fā)展與行業(yè)應(yīng)用簡析》,旨在深入分析具身智能相關(guān)技術(shù)與應(yīng)用情況,為智能機器人領(lǐng)域的研究者、決策者、觀察者及廣大愛好者提供一份全面深入的參考資料。
-

