小米開源跨域具身大模型MiMo-Embodied,打通自動駕駛與家居智能
**小米開源跨域具身大模型MiMo-Embodied,打通自動駕駛與家居智能**
11月21日,小米集團正式開源其自主研發的跨域具身大模型MiMo-Embodied,標志著人工智能技術在自動駕駛與家居智能領域的深度融合邁入新階段。作為業界首個統一兩大領域核心任務的基座模型,MiMo-Embodied通過創新的架構設計和訓練策略,實現了從家庭場景到道路環境的全鏈路智能協同,為未來通用具身智能的發展提供了重要范式。
**跨域能力重構:打破場景邊界**
MiMo-Embodied的核心突破在于其跨域能力覆蓋。傳統具身智能模型通常局限于單一場景,而該模型通過同步支持具身智能三大任務(可供性推理、任務規劃、空間理解)與自動駕駛三大關鍵模塊(環境感知、狀態預測、駕駛規劃),構建了全場景智能支撐體系。例如,模型在家庭環境中對物體功能(如“杯子可用于倒水”)的推理能力,可遷移至自動駕駛中對道路標識(如“紅燈需停車”)的語義理解,顯著提升了復雜場景下的決策效率。
**雙向知識遷移:從家居到道路的智能閉環**
小米在技術驗證中首次揭示了室內交互與道路決策能力的協同效應。模型通過共享底層視覺語言表征,實現了兩大領域知識的雙向遷移:家居場景中積累的空間布局理解能力可優化自動駕駛的路徑規劃,而車輛對動態障礙物的預測經驗則能提升家庭服務機器人的避障效率。這種跨域協同效應為智能終端的泛化部署提供了新思路,未來或可應用于智能工廠、醫療護理等更多場景。
**全鏈優化保障落地可靠性**
為確保模型在真實環境中的穩定性,MiMo-Embodied采用多階段訓練策略:先通過具身與自動駕駛專用任務學習基礎能力,再引入思維鏈(CoT)推理增強復雜任務分解能力,最終結合強化學習(RL)進行精細調優。在29項國際基準測試中,模型全面超越現有開源與閉源方案——具身智能領域刷新17項SOTA記錄,自動駕駛領域突破12項性能瓶頸,其通用視覺語言能力也在多項跨模態任務中展現顯著優勢。
**開源生態助推行業創新**
小米同步開放了MiMo-Embodied的完整代碼與部分預訓練權重,開發者可基于該模型快速構建跨場景智能應用。業內分析指出,此舉將加速自動駕駛與智能家居的技術融合,推動服務機器人、無人配送等產業的標準化進程。隨著小米AIoT生態與造車業務的深度協同,MiMo-Embodied或成為連接“人-車-家”智能網絡的核心技術樞紐。
最新問答





