物理智能的涌现:从无脑机器人同步行为探索“去中心化”的具身智能新范式
摘要
本综述旨在挑战人工智能领域将智能等同于复杂计算的传统范式,提出并探索一种“去中心化”的具身智能新范式。该范式强调智能并非必然依赖集中式大脑,而是作为一种“物理涌现”现象,通过物理实体、环境及其动态耦合的简单规则自发产生。本文首先审视了传统人工智能在物理世界具身交互中的固有局限性,进而阐明了具身智能的理论基石,包括形态计算、感知-行动一体化及物理储备池计算。随后,通过深入分析群体智能的自组织原理和分布式控制机制,揭示了简单局部交互如何促成复杂集体行为。本文进一步通过无脑机器人同步行为、软体机器人、群体协作以及弹性主动结构等具身案例,具体展示了物理智能如何实现自适应运动、损伤韧性与高效协作。展望未来,该去中心化范式在鲁棒性、可扩展性和能源效率方面展现显著优势,为与大型语言模型融合、重新构想通用人工智能与意识,以及实现更直观的人机协作提供了新路径。尽管面临模拟-现实鸿沟和伦理考量等挑战,物理智能的承诺在于超越传统计算,开启一个更具韧性与适应性的智能新时代。
1. 引言:挑战传统智能范式,开启物理智能新篇章
本引言章节旨在挑战当前人工智能领域普遍存在的“智能依赖复杂计算和集中式大脑”的传统观念,并为探索“去中心化”的具身智能新范式奠定基础。首先,本章将深入审视传统人工智能的“大脑中心”范式及其在处理物理世界具身交互中的固有局限性。随后,我们将引入具身智能这一关键概念,阐明智能如何从物理实体、环境及其动态耦合中涌现,而非仅仅是抽象的计算过程。最终,本章将清晰阐述本综述的核心观点,即智能可以作为一种“物理涌现”现象,通过简单物理规则自发产生,从而形成去中心化的具身智能新范式,并概述后续章节如何围绕这一核心论点展开深入论证。
1.1 传统人工智能的“大脑中心”范式及其局限
在传统人工智能领域,智能的核心被普遍视为算法、数据处理能力以及复杂的软件逻辑,其运作模式深受计算主义范式的影响,将智能主要归结为中央处理单元(如“大脑”)的运算过程 。这种范式将智能的涌现视为一套复杂的计算规则在数字环境中被高效执行的结果。近年来,大型语言模型(LLMs)的飞速发展显著推动了这一范式在自然语言理解和生成方面的进步,展现出前所未有的强大能力,甚至在一定程度上实现了与人类在认知层面的交互 。例如,某些多模态大型语言模型(MLLMs)通过整合视觉和语言输入,显著提升了跨模态的理解能力,RynnEC模型便在对象属性理解、分割和空间推理方面表现出色,为具身智能体提供了区域中心的视频感知能力 。
然而,尽管传统AI和LLMs在数字智能方面取得了显著成就,但其在物理世界的具身交互中却暴露出固有局限性。
| 维度 | 传统AI(大脑中心范式) | 去中心化具身智能(物理涌现范式) |
|---|---|---|
| 智能载体 | 集中式计算单元(“大脑”/CPU/模型参数) | 身体-环境耦合的分布式系统(材料、形态、接触动力学) |
| 核心机制 | 抽象计算与符号推理;数据驱动学习 | 形态计算与物理交互;局部规则自组织 |
| 与环境交互 | 多在数字/模拟环境中,弱物理耦合 | 强物理耦合,实时传感-动作闭环 |
| 优势 | 语言/符号任务强,跨模态集成(LLMs/MLLMs) | 在非结构化物理任务中具适应性与鲁棒性 |
| 主要局限 | 物理概念理解不足(质量、约束等);过度依赖记忆与公式 | 设计/测量复杂;需考虑材料、形态与环境的共同作用 |
| 物理推理表现 | 在开放物理场景与具身概念上明显低于人类专家 | 可通过形态与局部交互涌现出有效物理推理与控制 |
这种“大脑中心”的范式过度强调抽象计算和符号推理,往往忽视了智能与物理环境及其自身身体的紧密耦合。研究表明,当前的大型语言模型在理解人类世界的物理概念方面仍存在显著挑战 。例如,它们在某些视觉概念(如形状)上表现良好,但在更深层次的具身概念(如物体质量)上则表现出随机猜测的水平,表明单纯的规模扩大并不总能带来物理理解能力的涌现。此外,现有的基准测试也未能充分捕捉到智能的关键方面——物理推理能力,即整合领域知识、符号推理和现实世界约束的综合能力 。即使是先进的模型如GPT-4o,在这些物理推理任务上的准确率也远低于人类专家,暴露出它们过度依赖记忆知识、数学公式和表面视觉匹配,而非真正的物理理解。
这种局限性在多模态大型语言模型(MLLMs)中尤为突出,它们在桥接文本和视觉输入方面虽有卓越进展,但在富感知、多模态的真实世界场景中进行情境化的物理和社会交互时仍面临严峻挑战 。有研究指出,当前模型主要在脱离物理环境的数字世界中运行,缺乏与物理世界的互动,导致其在非结构化真实环境中处理复杂任务时,语义智能(对任务的理解和推理能力)不足 。为了弥补这一鸿沟,未来的MLLM发展需要整合内部和外部具身性,不仅要模拟与世界的外部交互,还要建模内部状态和驱动力。这也促使研究者重新审视计算效率与生物合理性之间的“联姻”问题,以及如何将类脑神经网络(如脉冲神经网络SNNs)有效具身化到机器人智能体中,以实现更自主和智能的行为 。因此,传统“大脑中心”的计算范式在处理物理世界的复杂、动态和具身性任务时,其内在的局限性日益凸显,为探索一种全新的、去中心化的具身智能范式提供了强有力的动机。
1.2 具身智能:物理交互与身体-环境耦合的新视角
具身智能(Embodied Intelligence)作为一种新兴的智能研究范式,将物理实体置于智能研究的核心,强调智能并非仅仅是抽象的计算过程,而是与身体、环境及其相互作用紧密相连 ,。这种观点深刻挑战了传统人工智能将智能视为纯粹符号操作或计算的“去身体化”倾向,提出智能涌现于代理者与真实世界的物理交互之中 ,。它从根本上重塑了我们对智能本质的理解,将其从一个纯粹的软件或算法问题,转变为一个涉及物理构造、材料特性和环境动态的跨学科问题 。因此,具身智能研究旨在通过利用代理者身体的物理特性来简化问题并减少计算需求,为传统AI面临的挑战提供潜在解决方案,尤其是在处理不确定、非结构化任务时,传统AI对大量数据和可靠输出的依赖性成为瓶颈 ,。这意味着智能的载体——身体——本身就承载着重要的“形态计算”能力,能够通过其结构和物理属性,在无需复杂神经处理的情况下促进适应性行为 。这一概念的提出,标志着智能研究领域从“以大脑为中心”转向“以身体为中心”的范式转变 。它甚至可以为传统人工智能(如大型语言模型)在脱离物理世界的数字环境中操作的局限性提供解决方案,通过结合感知和交互能力,增强智能体对复杂任务的理解和推理能力 。此外,具身智能的测量也提出了新的挑战,其智能程度可能无法简单通过传统的智商(IQ)类指标来衡量,而更应关注智能体在特定环境中展现出的高效物理交互能力 。值得注意的是,学习与进化之间的紧密联系也印证了身体形态在动物智能中扮演的深层角色,环境的复杂性会促进形态智能的进化,从而提高新任务的可学习性 。在这种演进过程中,形态学甚至能够加速学习过程,使得早期祖先在生命后期习得的行为能够在其后代生命早期便得以表达,这被称为形态上的鲍德温效应 。生物学中的章鱼就是具身智能的典型例子,其独特柔韧的身体和异常形态使其具备了复杂的行为能力,这些智能行为正是从其具身组织中涌现出来的 。章鱼在协调其八条柔韧手臂的运动和处理感官信息时面临巨大挑战,但这些形态上的困难反而促使其进化出独特的脑/身体/行为关系,展现了智能如何从代理者的材料、形态和环境的动态物理和感官交互中涌现 。然而,在将机器人视为具身且具有意向性的智能体时,也面临着挑战。尽管具身自主代理系统因其具备物理和感觉运动基础,在克服传统计算主义AI的许多哲学问题(如符号落地问题)方面被寄予厚望 ,但机器人与人类共享物理环境,并不必然意味着它们处于与人类相同的感知和社会世界中。因此,如何准确归因人工身体的意向性,并理解其与生物身体的根本差异,是具身AI和社交机器人研究需要深入探讨的问题 。此外,尽管贝叶斯统计为不确定性下的持续推理提供了原则性概率框架,其核心计算过程可以有效建模具身智能,但在当前的具身智能系统中,贝叶斯原理并未被广泛或明确地应用,这凸显了现有系统主要局限于封闭物理环境的局限性,并暗示了贝叶斯方法在将这些系统推向真正开放物理世界具身智能方面的巨大潜力 。可以说,具身智能不仅强调智能的物理基础,更是一种“自下而上”理解认知的途径,主张智能的涌现与身体的物理构造及其与环境的交互不可分割 。它促使我们从身体、情感、行动、语言和社会层面,甚至物理不变量的角度,重新审视和构建对概念表征的理解,挑战了传统上将理解视为纯粹智力认知操作的观念 ,。具身智能的最终目标是构建能够与人类自然交互和交流的自主机器人,这不仅需要整合数字信息,还可能需要模拟信息和量子信息,甚至可能推动新型混合计算框架的出现 。
1.3 核心观点与论文结构概述
本综述的核心观点在于挑战传统智能范式,即智能行为并非必然依赖于集中的、复杂的计算单元。相反,我们提出智能可以作为一种“物理涌现”现象,通过系统物理结构与环境相互作用的简单规则自发产生,从而形成一种“去中心化”的具身智能新范式。
这种范式颠覆了将智能局限于大脑或中央处理器的传统认知,转而关注物理载体、材料特性以及与环境的动态交互在智能行为生成中的核心作用。去中心化的具身智能强调智能的分布性与互动性,认为智能并非预设的程序执行,而是系统与环境持续耦合过程中,从物理层面涌现出的适应性行为。本研究将通过对无脑机器人同步行为等具体案例的深入分析,揭示简单物理系统如何通过自组织过程实现复杂的智能功能,从而为理解智能的本质提供一个全新的视角。后续章节将围绕这一核心观点展开论证。首先,我们将探讨具身性在物理智能中的关键作用,阐明身体形态、材料属性如何直接编码并影响智能行为。其次,本文将深入分析自组织现象,揭示简单局部规则如何通过物理相互作用导致宏观层面的复杂有序模式和智能功能。最后,我们将具体阐述物理涌现的机制,讨论无脑系统如何通过与环境的动态交互实现信息处理、决策制定乃至学习等功能。通过系统性地阐释这些论点,本综述旨在为读者提供一个全面的框架,以理解并探索“去中心化”具身智能的巨大潜力及其对未来机器人学和人工智能研究的深远影响。
2. 具身智能的理论基石:身体、环境与智能的耦合
本章旨在深入剖析具身智能的理论基石,着重阐明智能并非仅局限于集中式大脑,而是源于身体、环境与智能之间深刻的耦合关系。
我们将首先探讨“形态计算”这一核心概念,揭示物理身体的形态、材料属性及其与环境的动态交互如何直接参与并执行部分计算任务,从而为智能行为的涌现提供物质载体。在此基础上,本章将进一步阐释物理交互中感知与行动的紧密一体化,强调身体在认知过程中所扮演的不可或缺的角色。最后,我们将介绍“物理储备池计算”这一前沿范式,展示如何利用物理系统自身的非线性动力学实现高效计算,从而将智能能力直接融入物理实体。通过对这些理论框架的探讨,本章旨在为理解物理智能的“去中心化”新范式奠定坚实的基础。
2.1 形态计算与材料智能:智能蕴含于形式与材料之中
本节将深入探讨“形态计算”(Morphological Computation)这一核心概念,其精髓在于智能行为的某些方面不再仅依赖于复杂的集中式计算,而是直接由物理系统的形态、材料属性及其与环境的交互来承担,从而显著减少了对“大脑”或复杂控制算法的需求。这种将计算任务“卸载”到机器人身体物理设计中的理念,是具身智能(Embodied Intelligence)的关键组成部分,强调智能的涌现是身体与环境协同作用的结果,而非纯粹的认知过程 ,,。通过具身化,物理动力学和被动物理特性被有效利用,以实现复杂的计算和适应性行为 ,。
软体机器人是形态计算理念的典型实践平台。
| 案例 | 致动/材料 | 核心动力学特征 | 涌现行为/适应性 | 形态计算角色 |
|---|---|---|---|---|
| 软体连续机器人(欠驱动多腔气动) | 阻尼设计、气动多腔 | 调整动态行为、降低控制复杂度 | 欠驱动控制、稳健运动 | 通过阻尼与结构实现动态形态计算 |
| 弯曲驱动弹性活性结构(两“无脑”智能体) | 弹性形变与环境交互 | 形变-环境耦合计算 | 迷宫求解、涌现协调 | 弹性增强智能体能力、隐式计算 |
| SMA软体促动器(仿魟鱼软鳍) | 形状记忆合金(SMA) | 自发形变驱动波动推进 | 高效推进与操控 | 材料自发形变生成运动模式 |
| 磁性软体机器人(蜈蚣启发) | 磁致动与材料集成 | 精确磁场下的多模态响应 | 环境适应、多模态运动 | 身体物理响应替代中央控制 |
| 可充气剪纸爬行器 | 热封纺织品+kirigami几何 | 各向异性摩擦 | 跨不同粗糙度表面运动 | 几何结构决定功能与方向性 |
| 软体爬行机器人(窄/带刺管道) | 长度方向不对称机械特性 | 摩擦力分布与被动适应 | 狭小/带刺管道稳健推进 | 身体柔顺性承担感知-适应功能 |
| 深海微型变形机器人 | 双稳态手性超材料+SMA | 模量随水压增加提升性能 | 高压环境下保持多模态运动 | 材料特性提高环境适应性 |
| 层间干涉变刚度软体管道机器人 | 可控气压与腔室充气 | 变刚度、弯曲特性可调 | 复杂小直径管道灵活导航 | 身体设计承担复杂适应功能 |
这类机器人利用其固有的柔顺性、可变形结构以及与环境的物理交互,能够生成复杂的运动和适应性行为,从而突破了传统刚性机器人在复杂、不确定环境中的局限 ,。例如,通过精确设计阻尼特性,软体连续机器人能够改变其动态行为,从而实现欠驱动多腔气动系统的控制,有效减少了对多条馈线的依赖,这正是通过物理特性实现动态形态计算的有力证明 。此外,研究发现,即使是弯曲驱动的弹性活性结构,仅由一对“无脑”智能体组成,也能通过形变与环境互动,展现出复杂的涌现行为,甚至能解决迷宫问题,这生动地诠释了形态计算如何利用弹性增强智能体的能力 。
软体机器人的材料和结构设计在实现智能行为方面扮演着核心角色。例如,基于形状记忆合金(SMA)的软体促动器能够模仿魟鱼的波动式运动,通过控制软鳍膜的形变实现高效的推进和操控,其运动模式直接来源于材料的自发形变特性 。磁驱动软体机器人,如受蜈蚣启发的磁性软体机器人,通过精密的磁场控制和材料集成,实现了多模态运动和环境适应性,其复杂行为源于身体本身的物理响应,而非复杂的中央控制器 ,。更有甚者,通过将剪纸(kirigami)图案引入热封纺织品,可充气剪纸爬行器在循环气动驱动下展现出方向性各向异性摩擦特性,从而在不同粗糙度表面上实现运动,这进一步突显了结构几何形状对运动功能乃至智能行为的影响 。
形态计算的显著优势在于它能够大幅简化传统机器人系统所需的复杂控制算法和感知计算。软体机器人通过其身体的柔顺性适应不确定环境,例如,某些软体爬行机器人能够穿越比其横截面更窄的管道,甚至在带刺的管道中稳健推进,这得益于沿机器人长度方向不对称的机械特性所产生的摩擦力 。深海微型变形机器人通过结合双稳态手性超材料和管密封形状记忆合金,在深海高压环境下依然能保持性能,实现多模态运动,其对环境的适应性部分归因于材料在水压下模量的增加所带来的性能提升 。此外,采用层间干涉变刚度技术的软体管道机器人,能够通过控制气压和腔室充气状态来调整其弯曲变形特性和刚度,从而在复杂小直径管道中灵活导航,这充分展示了身体设计如何承担复杂的环境适应性功能 。这些案例共同表明,智能行为不再仅仅是“大脑”的产物,而是“身体”与环境物理协同作用的结果。
然而,形态计算并非没有挑战。精确建模和控制软体机器人的固有动力学,尤其是在惯性非线性状态下,仍是重要的研究方向 ,。将计算能力和智能元素直接嵌入机械领域,即实现多功能机械智能(mechano-intelligence),是未来的一个重要趋势,例如利用物理储层计算(Physical Reservoir Computing, PRC)框架在机械系统中同时实现感知、决策和指令功能 ,。PRC已被证明能够利用软体机器人的非线性身体-环境动力学来处理信息并生成行为,甚至能够嵌入多种行为 。这进一步强调了物理具身(physical embodiment)作为一种计算资源的重要性,甚至能使活性粒子在没有明确传感机制的情况下,仅通过物理动力学适应未观察到的流场,展现出超越传统感知的“隐式感知”能力 。
此外,具身智能的概念也延伸到主动触觉感知领域,即通过身体形态的调整来过滤和获取环境信息 。例如,可折叠软腿辅助的轮式机器人能够通过腿的伸缩实现姿态调整,从而在各种复杂地形中移动,这体现了身体设计对机器人功能扩展的重要性 。这些案例共同描绘了一个新兴的范式:智能并非局限于集中的“大脑”,而是分布于整个物理系统中,通过形态、材料和与环境的交互共同涌现,为实现“去中心化”的具身智能提供了坚实的基础。
2.2 物理交互中的感知与行动一体化
与传统人工智能将感知(sensing)与行动(action)视为独立处理模块的范式截然不同,具身智能的核心在于强调这两者在物理交互中的不可分割性。在这种一体化视角下,身体不再仅仅是搭载计算单元的载体,而是认知过程本身不可或缺的一部分 ,。感知被重新定义为一种主动行为,旨在促进对环境的学习以及实时行为交互的控制,其能力是与特定生物体及其生态位紧密适应并共同演化的 。例如,人眼在认知控制下的快速扫视(saccades)并非仅仅是信息接收,而是通过物理交互增强对视觉刺激的短时记忆和变化检测,体现了“感知即行动”的本质 。
具身认知理论进一步将这种一体化拓展至更广阔的认知框架中。系统0/1/2/3四过程理论便将前认知(pre-cognitive)的具身过程定义为“系统0”,强调了形态计算和被动动力学在无需显式神经处理的情况下如何实现自适应行为,为更复杂的认知(如系统1的直觉和系统2的审慎)奠定了物理基础 。这意味着智能的涌现并非完全依赖于自上而下的中央控制,而是通过身体的材料特性、形态以及与环境的动态物理交互在底层自发生成 ,。更重要的是,物理环境中固有的不变性特征(如重力、动量、摩擦力)被视为与感官运动、情感、语言等同等重要的具身认知基础,并在概念表征中扮演着核心角色,而非仅仅是外部约束 。
章鱼神经生物学的独特案例为此提供了有力的生物学证据。章鱼拥有高度灵活的身体和不同寻常的形态,其八条长而柔韧的腕足带来了无限自由度控制和体坐标系难以映射感官信息的巨大挑战。然而,它们却展现出丰富的行为 repertoire,足以与脊椎动物竞争 。研究表明,章鱼的智能行为并非完全由中央大脑统筹,而是从其具身的组织中涌现出来的。这种“智能具身性”强调行为来源于智能体材料、形态及其与环境的动态物理和感官交互,而非仅是高级计算的结果 。章鱼的例子突出说明了物理约束和独特的身体形态如何在智能行为的形成中发挥决定性作用,支持了智能去中心化的具身新范式。
在机器人和具身人工智能领域,构建物理真实且具备精确物理属性的3D模拟世界对于训练和评估具身智能至关重要 。RoboScape等物理感知世界模型通过结合RGB视频生成和物理知识,学习3D几何一致性与关键点动力学,以生成更具物理合理性的机器人视频,并应用于机器人策略训练和评估 。此外,GraphSlot等基于图神经网络的物体中心学习框架也利用图网络建模物体之间的物理交互,在物理理解方面展现出潜力 。DVS等动态虚实同步平台进一步旨在解决现有平台在动态行人建模、场景可编辑性和虚实资产同步方面的局限性,以促进机器人研究向更复杂的任务和真实世界部署迈进 。然而,尽管模拟环境中取得了显著进展,但当前AI模型在理解复杂物理概念和进行物理推理方面仍面临显著挑战。例如,现有语言模型在理解某些视觉概念上有所进步,但在“质量”等基本物理概念上表现仍接近随机猜测 。PhyX基准测试也揭示了包括GPT-4o在内的先进模型在物理推理任务中与人类专家存在巨大的性能差距,普遍存在过度依赖记忆知识和表面视觉模式匹配而非深层物理理解的局限 。这些研究共同表明,仅仅在模拟环境中训练或依靠传统数据驱动的AI方法,仍难以完全捕获和复现智能在物理交互中涌现的机制,凸显了具身性、物理约束和物理定律在智能行为形成中的核心作用。
2.3 物理储备池计算:材料动力学中的计算能力
物理储备池计算(Physical Reservoir Computing, PRC)代表了一种新兴的计算范式,其核心在于利用物理系统固有的非线性动力学作为计算资源,从而在无需传统意义上的集中式处理器进行复杂计算的情况下展现出智能行为。这种方法将计算能力和智能要素(如感知、决策、控制)直接嵌入到物理系统中,而非依赖附加的计算机和大量电子设备 。例如,通过利用材料或结构的自由度非线性动力学,PRC能够有效处理信息并生成行为,实现所谓的“力学智能”(mechano-intelligence),这在开发自适应结构和材料方面具有显著优势,包括更低的功耗、更直接的交互以及在恶劣环境下的更高生存能力 。
3. 去中心化与自组织:无脑智能的协同机制
本章将深入探讨“去中心化”与“自组织”如何作为核心机制,支撑“无脑”具身智能的协同涌现。我们将首先聚焦于群体智能的原理,阐明简单的局部交互规则如何促成复杂的集体行为,特别是通过同步等自组织现象实现系统层面的协调。随后,本章将进一步探讨分布式控制在信息处理与决策中的关键作用,详细分析智能体如何通过局部感知与有限通信,在没有中央控制的情况下完成复杂的任务协同。通过对这些机制的剖析,本章旨在构建一个全新的视角,理解具身智能如何在分布式、自组织的网络中展现出高效且鲁棒的协同能力,为新一代智能系统的设计提供启发。
3.1 群体智能的涌现原理:简单规则下的集体行为与同步
群体智能(Swarm Intelligence)的精髓在于,大量简单个体通过局部交互,而非集中指令,自发地涌现出复杂的集体智能行为。这种去中心化的范式深刻地改变了我们对智能起源和实现方式的理解,强调智能可以不依赖于中央处理器,而是通过自组织机制在系统层面涌现。在各类物理和生物系统中,个体间的简单行为规则常常导致宏观上的有序结构和功能,例如同步、聚集和路径优化。
这种涌现现象在多种系统中均有体现。例如,活性粒子系统展现出显著的自组织能力。即便在没有明确对齐交互的情况下,大量追逐自身随机目标并避免碰撞的活性布朗粒子,也能形成同步的、系统范围内的手性群集。这种行为对系统规模、密度、噪声以及边界条件均表现出高度鲁棒性,其集体动力学甚至可以类比于离散的铁磁XY模型,有助于解释其相变和拓扑缺陷 。类似地,微管(MTs)的自组织过程,从其亚结构(如环和原纤维)的形成,也揭示了鸟苷三磷酸(GTPs)的浓度而非键合概率在聚合中扮演关键角色 。
耦合振子系统是理解同步现象的关键模型之一。例如,“swarmalators”结合了群集粒子和同步振荡的特性,揭示了空间组织与时间同步之间的复杂相互作用,其动力学受相互作用范围、耦合强度和频率分布等参数影响,能涌现出聚类、相波和同步态等复杂模式 。类似地,在小世界网络中,即便存在少量捷径,耦合振子也能实现相位的集体同步,且在一定程度上表现出饱和行为 。对于具有一般相互作用函数和拓扑结构的离散时间网络,同步机制可以产生新的同步行为,甚至促使简单单元网络中涌现同步混沌,或在混沌单元网络中抑制混沌产生简单同步动力学 。在物理系统层面,激光系统也能通过弱耦合实现复杂时空动力学的同步,即使是固有混沌的多模激光器,也能通过谱对齐和主导模式的作用实现自组织 。
物理交互在集体同步和复杂群体行为涌现中扮演着重要角色。在活性物质系统中,个体间的非弹性接触可以产生位置、方向和速度上的长程关联 。蠕动机器人通过碰撞实现运动同步,并能表现出同相和反相同步等新颖的相位动力学,其理论模型也描述了这些模式的稳定性。研究还发现,在受限群体中,同步能显著降低相互作用力,从而带来能量和安全效益 。另一项研究则通过电场驱动下的耗散孤子(directrons)系统,成功模拟了生物系统的集体运动,这些非生命的人工粒子能够局部对齐运动,自组织成群集并同步,展现出丰富的动态行为,如瞬态涡流和射流,甚至能区分拓扑缺陷 。此外,微型机器的协同行为,例如脉冲耦合的CMOS振荡器,通过电子脉冲交换实现可扩展的同步,使整个系统与最快的振荡器同步,这为微型机器人群体的集体功能(如自主流体输运、微尺度结构构建)开辟了道路 。
| 系统/模型 | 交互/耦合机制 | 涌现的集体行为/同步 | 关键参数/鲁棒性因素 | 参考 |
|---|---|---|---|---|
| 活性布朗粒子群集 | 追逐自身随机目标+避免碰撞;无明确对齐 | 同步的系统范围手性群集 | 对系统规模、密度、噪声、边界条件高度鲁棒;可类比离散铁磁XY模型解释相变与拓扑缺陷 | [49] |
| 微管(MTs)自组织 | 亚结构(环、原纤维)形成;GTP浓度驱动聚合 | 自组织聚合与有序结构 | GTP浓度是关键驱动因素,非键合概率次要 | [50] |
| Swarmalators(群集+振荡) | 空间组织与相位同步耦合 | 聚类、相波、同步态等复杂模式 | 相互作用范围、耦合强度、频率分布显著影响动力学 | [51] |
| 小世界网络耦合振子 | 少量捷径引入 | 相位集体同步(部分饱和行为) | 网络拓扑小世界度、耦合强度决定同步能力 | [52] |
| 活性物质非弹性接触 | 非弹性碰撞产生关联 | 位置/方向/速度的长程关联;同步降低相互作用力 | 受限群体中能量与安全效益更显著 | [55] |
| 蠕动机器人碰撞同步 | 机器人间碰撞耦合 | 同相/反相同步的相位动力学 | 模式稳定性有理论刻画;受限群体中相互作用力降低 | [55] |
| Directrons(耗散孤子) | 电场驱动下局部对齐 | 自组织群集与同步;瞬态涡流、射流;拓扑缺陷识别 | 场强与局部耦合决定模式丰富性 | [56] |
| 脉冲耦合CMOS振荡器 | 电子脉冲交换 | 全局与最快振荡器同步;可扩展 | 支持微型机器人群体功能(流体输运、微结构构建) | [57] |
群体智能的原理在解决计算问题和实现分布式智能方面展现出巨大潜力。例如,基于强化学习训练的智能代理,可以在没有中央管理员的情况下,通过局部观察调整连接,自组织形成大规模通信集群,从而构建出可靠的自组织分布式复杂网络,这在物联网(IoT)应用中尤为重要 ,。蚂蚁觅食行为中的交通流组织也为拥堵控制和资源优化提供了去中心化控制的思路,其基于局部排斥相互作用的机制可在交通或数据网络路由中得到应用 。更为前沿的探索包括将分布式银纳米团簇作为物理代理,利用其电化学溶解、生长和演化动力学,构建高并行度的多智能体硬件系统,通过协作与竞争解决图论和优化问题,甚至实现基于人工势场的路径规划和自适应避障。这表明物理系统本身的自组织能力可以成为高效并行计算硬件的基础 。
这些研究共同强调,群体智能的涌现并非依赖于复杂的个体智能或集中控制,而是源于简单个体遵循局部规则进行交互。这种自下而上的组织方式不仅普遍存在于自然界,也为设计具有鲁棒性、可扩展性和自适应能力的下一代具身智能系统提供了新范式。将群集行为与同步振荡结合的模型,如Swarmalator-Vicsek和Swarmalator-Cucker-Smale,进一步展示了相位同步如何影响空间模式和群集行为,导致聚类、群集和同步的并发涌现 。甚至在自驱动粒子中也能观察到“嵌合态”(chimera states),即一部分粒子同步而另一部分混乱运动,这揭示了自组织行为的复杂性 。将代理类比于神经元,通过互惠连接和振荡同步模式来模拟海马体模型,可以实现多代理群集和奖励接近动力学,展现出与环境交互的相组织环和轨迹序列等涌现行为 。这种以生物神经回路为灵感的控制框架,为理解动物认知和发展自主系统技术提供了新的视角。
3.2 分布式控制与局部交互:信息处理与决策
在多机器人系统和分布式智能体环境中,分布式控制与局部交互规则是实现复杂任务协调与决策的关键,它们旨在规避集中式系统固有的脆弱性和计算瓶颈,从而为“去中心化”的具身智能新范式奠定基础。这种范式通过将决策权下放至各个智能体,并通过局部感知和有限通信实现整体的协调行为。
具体而言,多智能体系统(MAS)通过分布式控制展现出更高的鲁棒性和可扩展性。例如,自适应群体系统(SASS)框架旨在弥合感知、通信、规划、执行、决策和学习之间的差距,促进多智能体间的有效合作 。
在多目标自组织追逐问题中,模糊自组织协同进化(FSC2)算法允许分散式智能体在局部观察和无通信的情况下协同追逐多个动态目标,通过分布式强化学习和模糊任务分配实现隐式协调,并表现出在高达2048个智能体规模下的高效可扩展性 。同样,在多无人机协同搜索与攻击任务中,分布式自组织协同情报监视与作战(CISCS)策略有效解决了集中式控制面临的通信困难和编队不稳问题,通过有限时间编队控制器和基于Q-Learning的改进蚁群优化算法实现多任务分配与自主决策 。
信息处理在去中心化系统中不再依赖于单一的中央处理器,而是通过智能体间的局部交互和具身特性有效表达和处理。以形态机器人(Morphobots)为例,其通过工程化的外骨骼实现对外部力的重定向响应,这种“形态计算”在密集群体中促进了信息流和在线分布式学习,甚至通过物理碰撞增强了集体性能 。在更抽象的层面,联邦推理机制展示了智能体如何通过信念共享实现分布式智能,其中语言和通信的出现可以被解释为最小化自由能的结果,从而使具有互补视角的智能体能够共同解决不确定性 。此外,量子启发方法也被用于研究分布式智能系统中的意见形成和社会影响,揭示了信息扩散和长期适应过程中局部交互的关键作用 。然而,评估大型语言模型(LLMs)在严格局部感知和通信约束下的群体智能能力时,研究发现尽管存在初步的协调行为,但LLMs在处理去中心化场景下的长距离规划和自适应策略形成方面仍面临显著挑战,这突显了纯粹局部信息处理的局限性 。
这种去中心化范式显著提高了系统的并行性、鲁棒性和可扩展性,进一步削弱了对复杂集中式计算的依赖。在物联网(IoT)领域,群体智能算法因其灵活性、弹性和分布式特性,成为应对网络流量优化、能量消耗管理等挑战的有效手段 。自组织民主化学习(Dem-AI)则提出了一种超越联邦学习的全面理念,旨在构建大规模分布式AI系统,通过分层自组织和个性化数据实现协同学习,增强了学习模型的泛化和专业化性能 。类似地,在车联网(VEANs)中,通过将自动驾驶车辆(AVs)的计算密集型任务卸载到路边单元(RSUs)并利用Stackelberg博弈和多智能体强化学习进行分布式协调,有效地解决了计算延迟和资源约束问题 。具身智能体的概念也被应用于智能事物的工程设计中,例如智能路灯通过具身认知和进化算法实现自组织合作,无需集中控制便能实现智能城市应用的目标 。
为了更好地平衡集中与去中心化的优势,一些研究探索了分层或混合控制策略。例如,分层协同自博弈(HCSP)框架在3对3多无人机排球任务中,通过分离集中式高层战略决策与去中心化低层运动控制,实现了卓越的性能和角色切换、协调编队等涌现行为 。理论研究也指出,智能演化的路径依赖性可能导致不同的“吸引子”,若去中心化集体智能(DCI)能先于通用人工智能(AGI)成熟,将更有利于形成合作而非竞争主导的未来 。此外,平均场控制技术通过将大规模群体控制转化为分布的单智能体控制,结合碰撞避免机制,为设计可扩展的机器人群体行为提供了理论基础和实用框架 。尽管分布式系统避免了集中式瓶颈,但信息同步一致性仍然是一个挑战,多机器人系统中世界观的不同步可能导致行为不一致,需要可视化分析工具来调试和理解 。因此,在具身多智能体协作中,通过设计组合约束和自动化数据收集框架,对于构建安全高效的系统至关重要 。
4. 物理智能的具身案例:从同步行为到复杂协作
本章将通过一系列具身化的具体案例,深入探讨物理智能如何从无脑系统和去中心化机制中自发涌现,从而挑战传统智能范式。我们将首先审视简单物理系统中通过内在动力学和局部交互实现的自发同步与协调运动,揭示智能的原始形态。随后,章节将转向软体机器人,展示其如何凭借独特的材料柔性和与环境的物理交互,实现卓越的自适应运动与损伤韧性。在此基础上,我们将探讨群体机器人在去中心化协作下,如何通过简单的局部规则解决复杂问题。接着,本章将深入解析弹性主动结构和张拉整体机器人如何利用其结构自身的物理特性,实现计算和涌现智能。最终,我们将聚焦于物理交互中的隐式感知与适应,阐明具身系统如何在缺乏显式传感的情况下,通过与环境的物理耦合处理信息并实现迭代优化。这些案例共同构筑了理解“去中心化”具身智能新范式的坚实基础。
4.1 简单物理系统中的自发同步与运动
在探讨“去中心化”具身智能的新范式时,物理智能的涌现是其基石,特别体现在简单物理系统中的自发同步与运动。这类系统通常不依赖中央处理器或复杂的控制算法,而是通过其内在的物理动力学和局部交互实现协调行为,展现了智能最原始的形态。以软体机器人为例,其功能性可通过与环境互动时的形变来介导,这是一种典型的形态计算(morphological computation)实例,它利用材料的弹性来增强“无脑”代理的能力 。研究表明,即便仅由一对代理构成的系统,在动力学特性经过精心调优后,也能展现出复杂的涌现行为,例如能够解决迷宫问题。这种基于屈曲驱动的弹性活性结构揭示了即使是最小的活性物质集合,也能通过物理结构而非计算实现功能性,挑战了传统智能对复杂控制单元的依赖。此外,软体机器人振荡器及其基于应变的协调机制也为理解无脑系统中的自组织提供了线索,尽管具体细节仍有待深入 。更广泛地,集体行为的研究引入了“群集振子”(swarmalators)的概念,这是一种结合了群集粒子空间组织特性与同步振荡时间特性的新型实体 。这类模型深入探讨了空间组织与时间同步之间的相互作用,揭示了复杂的模式如何随着交互范围、耦合强度和频率分布等参数的变化而涌现,例如集群、相位波和同步态。其背后的动力学分析常涉及非线性物理系统 和奇怪吸引子与同步现象 ,这些理论为理解无脑系统中的协调运动提供了数学框架。在实验层面,活性软物质系统也展现出模拟生物集体运动的丰富涌现动态行为。例如,由“直接子”(directrons)组成的活性系统,即在手性向列薄膜中通过外部电场产生的耗散孤子,能够模仿生物群体的集体运动 。尽管直接子是无生命的、人工的类粒子场构型,它们却能局部对齐运动、自组织成群落并同步振荡。这些直接子群落表现出丰富的动态行为,如远超热平衡系统的种群密度波动、“湍流”游泳模式(表现为瞬态涡流和射流),甚至能区分拓扑缺陷,趋向正向缺陷而避开负向缺陷。这种实验平台通过物理机制而非复杂的程序设计,成功再现了生物系统的集体行为,为理解和开发自主机器人及群集计算提供了宝贵的经验。然而,尽管这些简单物理系统展示了智能行为的原始涌现形式,它们通常在行为的鲁棒性、适应性和复杂任务处理能力上存在局限。它们的“智能”本质上是预设物理属性与环境交互的产物,对于未知或剧烈变化的环境,其适应性可能受限。理解这些限制,对于将物理智能扩展到更通用和高级的具身智能应用至关重要,也促使研究者思考如何通过结合不同层面的智能,弥补物理智能的不足。
4.2 软体机器人:自适应运动与韧性
软体机器人凭借其固有的柔性材料、生物启发式设计以及与环境的物理交互,在无需高度集中计算控制的情况下,展现出卓越的自适应运动能力和对损伤的韧性,是“去中心化”具身智能新范式的典型代表。这类机器人通过身体的被动依从性和主动变形,实现多种复杂的运动模式。
| 运动模式 | 驱动/机制 | 关键设计/材料 | 典型能力/场景 | 参考 |
|---|---|---|---|---|
| 毛毛虫式蠕动 | 分布式加热调控温度-曲率 | 柔性体局部形变+摩擦协同 | 双向蠕动、通过狭窄障碍 | [84] |
| 蚯蚓式蠕动 | 气动驱动 + 摩擦系数主动调节 | 与支撑面摩擦切换 | 双向运动,适应倾斜表面 | [85] |
| 蚯蚓式锚定 | 径向膨胀执行器 + Kirigami皮肤 | 提升锚定与牵引 | 土壤内拖拽负载、位移提升 | [86] |
| 管道/平面可转向蠕动 | 真空+正压组合驱动 | 前端压力传感 | 管道/平面多模式转向,自主避障 | [87] |
| 尺蠖式 | 光致双层薄膜周期刺激 | 双层薄膜 + 腿部结构 | 模仿收缩/伸展,定向运动 | [88] |
| 尺蠖式(磁控) | 各向异性磁化 + 外磁场 | 3D打印磁化分布 | 非对称时变姿态、抓取、狭小操作 | [89] |
| 蛇形攀爬 | 可调初始盘绕构型 | 柔性结构 + 摩擦设计 | 缠绕、侧向卷动、管内外攀爬 | [90] |
| 磁性软微机器人 | 永磁体 + 旋转非均匀偶极磁场 | 行波式波动推进 | 血管/肠道导航 | [91] |
| 多模态MetaCrawler | 模块化软硬组件 | 节点蜂窝超材料 | 全向多模态运动、狭窄通道/垂直穿越/迷宫 | [94] |
| 滚动(屈曲驱动) | 双稳态局部屈曲 | 快速响应与构型保持 | 高速、低能耗,台阶/斜坡/断桥适应 | [96] |
例如,受毛毛虫和蚯蚓启发的软体机器人,通过身体的局部变形与地面的摩擦力协同作用实现高效蠕动。一些研究利用分布式加热策略,通过改变机器人身体沿途的温度和曲率分布,使毛毛虫式机器人实现双向蠕动,并展现出通过狭窄障碍的能力 。类似地,模仿蚯蚓的机器人则通过主动调节身体与支撑平台之间的摩擦系数,配合气动驱动实现双向运动,即使在倾斜表面也能有效移动 。通过结合剪纸(Kirigami)皮肤与径向膨胀气动执行器,蚯蚓式机器人的锚定能力在土壤中得到了显著提升,从而在拖拽负载时展现出更大的前进位移和牵引力 。此外,有研究设计了基于真空和正压驱动的蚯蚓机器人,能够实现管道内和平面上的多模式可转向爬行,并通过前端压力传感实现自主避障 。
除了蠕动,软体机器人还能实现其他多种复杂的运动模式。例如,尺蠖机器人通过光的周期性刺激,利用双层薄膜的光致形变模仿尺蠖的收缩和伸展行为,并结合腿部结构实现定向运动 。另一种尺蠖型软机器人则利用3D打印实现的各向异性磁化分布,在磁场控制下实现具有非对称时变姿态的运动,并能集成抓取功能,在狭小空间执行复杂操作 。蛇形软机器人通过可调的初始盘绕结构,能够模仿蛇的缠绕、侧向卷动和管状结构内外的多种攀爬运动,适应非结构化和受限环境 。在微小尺度应用中,磁性软机器人利用嵌入的永磁体和旋转的非均匀偶极磁场,产生行波状波动运动,从而在血液血管和肠道等自然腔道中导航 。
软体机器人的自适应性不仅体现在运动模式的多样性上,还体现在其对复杂环境的韧性适应。一些生物启发式设计通过利用身体的摩擦各向异性,即使仅通过单一压力源驱动,也能在不同基底上高效爬行,其身体前部和后部在交互中动态切换推拉作用,产生涌现的运动行为 。铁磁流体软机器人能够实现集成运动与变形,使其能够穿过狭窄环境并运输多个物体 。此外,节点蜂窝超材料软机器人(MetaCrawler)通过模块化组装软硬组件,实现蠕动、侧向卷动、横向平移、原地转向等五种多模式全向运动,并能适应狭窄通道导航、垂直穿越和迷宫探索 。对于小尺度软机器人,结合介电弹性体和形状记忆合金弹簧执行器,能够实现高速奔跑和跳跃,提高了在障碍环境中的敏捷性 。还有研究提出了一种通过局部屈曲驱动的滚动软机器人,它利用双稳态结构的快速响应和构型保持,在保证较高运动速度的同时减少能量损失,并展现出对复杂地形(如台阶、斜坡和断桥)的良好适应性 。
软体机器人的韧性也体现在其面对损伤或不确定性时的鲁棒性。软体张拉整体(Tensegrity)机器人通过融合软硬材料,结合机器学习算法发现有效的步态,展示了在物理损伤面前的结构和行为韧性,这进一步强调了复杂材料动力学与行为生成之间的相互作用 。为了更好地理解和优化软体机器人的设计,3D动态仿真模型被开发,用于系统性测试机器人参数(如刚度和摩擦)在不同曲率环境中的影响,这有助于揭示被动依从性在复杂受限空间穿越中的关键优势 。尽管软体机器人在搜救(SAR)等复杂危险环境中展现出变革性潜力,但材料耐久性、功率效率、传感器集成和控制复杂性仍是其广泛部署面临的显著挑战 。
从设计方法论上看,利用弹性梁和空间柔顺机构的进化设计方法,能够有效生成具有高运动和力传递比的软机器人,实现快速移动、负载运输和水下运动等性能 。这些研究共同揭示了软体机器人如何通过具身智能的理念,即通过身体的物理形态、材料属性和与环境的交互,实现去中心化的自适应运动和韧性,为开发能在复杂、非结构化环境中自主操作的机器人提供了新的范式。
4.3 群体机器人:集体问题解决与去中心化协作
群体机器人系统代表了一种重要的具身智能新范式,其核心在于通过简单的局部规则和个体间的相互作用,实现复杂的集体行为,从而摆脱了对单一中央控制的依赖。这种去中心化的特性不仅提升了系统的鲁棒性和可扩展性,更使得智能行为不再是自上而下的指令执行,而是自下而上的协同涌现。在这一背景下,多形态机器人通过单一控制器适应不同身体结构的能力,以及多机器人系统在没有中央控制的情况下实现复杂协作任务,成为了物理智能涌现的关键体现。
实现跨多种机器人形态的通用控制是当前具身智能领域的重要挑战。传统的“一机器人一任务”范式难以满足大规模机器人部署的需求。对此,有研究提出通过将多样化的教师控制器知识蒸馏到一个单一的多形态控制器中,使其能够泛化到未见的形态,并展现出对形态扰动的鲁棒性和即时损伤恢复能力 。进一步地,UniAct框架通过引入通用动作空间,旨在消除不同机器人因物理具身和控制接口差异导致的行动空间异构性,从而有效提升跨域数据利用率和跨具身泛化能力 。这种通用性对实现具身通用人工智能(AGI)至关重要,也引出了“具身AI的身体发现”等挑战,即如何让AI识别并理解其自身或他者的具身体 。此外,通过“虚拟生物体”的概念,构建可在空间和时间上组合重构的结构,能够使系统更好地适应动态变化的环境 ,这进一步支撑了多形态机器人通过动态调整结构以增强功能适应性的设想。
在去中心化协作方面,群体机器人系统展现出在各种尺度和复杂任务中的卓越能力。例如,在竞争性的多无人机排球任务中,分层协同自博弈(HCSP)框架通过将高层战略决策与低层运动控制分离,使得团队行为(如角色切换和协同编队)能够从零开始涌现,实现了复杂的战略协调 。类似地,针对多无人机协同侦察和攻击任务,分布式自组织协同策略能够通过有限时间编队控制、基于Q学习改进的蚁群优化算法进行多任务分配,以及实时的避障机制,有效解决了中心化控制和通信难题 。在微观尺度,磁性微群能够通过形态重构实现自动化微操作,包括精确的物体抓取、运输和释放,并通过有限状态机和路径规划算法应对障碍和多目标运输 。这表明,即使在微观世界,简单的局部规则结合物理场的控制也能实现复杂的宏观操作。从生物学中汲取灵感,对微管自组织行为的模拟也揭示了GTPs浓度等局部因素如何驱动复杂结构的形成 。
理论层面,大规模群体机器人的控制可以通过平均场控制技术进行简化,将多智能体控制转化为单智能体对分布的控制,同时结合碰撞避免机制,为设计可扩展的群体行为提供了数学上严谨且实用的框架 。这在模拟和真实无人机群中均表现出优于传统多智能体强化学习的性能。在物理智能的实验探索中,强化学习与人工微泳者相结合,成功展示了在布朗运动噪声环境中,系统如何通过外部控制实现适应性行为和集体学习,并发现反馈延迟可能导致最优速度的存在 。此外,基于强化学习的智能体能够通过调整局部连接策略,自组织形成可靠的分布式复杂网络,实现在动态环境中维持网络连通性并优化能耗 。受神经生物学启发,NeuroSwarms框架将智能体类比为神经元,通过互惠连接和振荡同步机制,在复杂环境中实现了自适应蜂群控制和路径生成,为动物空间认知理论提供了人工系统模型 。
在多智能体协作系统的设计与评估方面,RoboFactory基准的引入,通过组合约束来生成安全高效的训练数据,旨在推动具身多智能体操作领域的发展,并为探索多智能体模仿学习的架构和训练策略提供平台 。而“受限人机协作”(CHAIC)挑战则进一步将人类的物理约束纳入考虑,要求具身智能体能够推断人类意图和限制,并制定协同计划,从而在复杂家庭或户外任务中实现高效合作,这为具身社会智能的评估提供了系统性基准 。这些研究共同揭示了群体机器人系统在集体问题解决和去中心化协作方面的巨大潜力,其所展现出的自组织、自适应和涌现智能,是物理智能在具身系统中深远影响的显著例证。
4.4 弹性主动与张拉整体结构:结构智能的涌现
物理智能的涌现不仅体现在多单元系统的集体行为中,也深刻地根植于个体机器人的结构设计和材料特性。在这一背景下,张拉整体(Tensegrity)机器人和弹性主动(Elasto-Active)结构作为具身智能的新范式,展现出利用其固有物理特性实现复杂行为的能力。张拉整体结构,凭借其杆件受压、索件受拉形成的自平衡网络,天然地具备轻质、高强度和柔顺性的优势,其动力学特性可被有效利用于信息处理。例如,有研究将张拉整体机器人置于物理水库计算的框架下,发现其非线性体-环境动力学能够用于计算和生成控制自身行为所需的运动信号。该方法不仅能嵌入多种行为,甚至在系统状态空间中存在“未经训练的吸引子”,这些吸引子反映了张拉整体机器人及其与环境交互的内在属性和结构,为理解具身认知的多种特征提供了新的视角 。这种从结构本身涌现出的计算能力,揭示了“去中心化”智能的深层物理基础。
进一步地,软体张拉整体机器人通过结合软材料的灵活性和张拉整体的结构韧性,展现出显著的适应性和面对损伤时的弹性。与传统刚性机器人不同,这类软机器人能够生成高度动态的步态,并在遭受物理损伤时仍能保持结构完整性和行为功能。通过应用机器学习算法,可以以极少的物理试验次数发现有效的步态,这进一步印实了复杂材料动力学在生成丰富行为方面的巨大潜力 。这种设计范式强调了物理材料与环境的复杂相互作用在塑造机器人行为中的核心作用,而无需过度依赖复杂的外部计算。
除了张拉整体结构,更广义的弹性主动结构也通过利用非线性弹性展现出令人瞩目的智能行为。例如,由两个厘米级自推进微型机器人通过弹性梁连接而成的系统,当微型机器人施加的力足以使弹性梁屈曲时,整个结构便能产生定向运动,并展现出如迷宫导航等新兴智能行为 。这种机制通过利用结构本身的非线性弹性响应,能够以少量单元实现集体运动的组织和对环境的智能交互。该研究不仅阐明了梁与微型机器人之间相互作用的物理机制,还通过降阶模型预测了弹性主动结构与墙壁、狭窄通道等边界的交互,从而证明了其自主空间探索、适应与环境交互的潜力。这些弹性主动系统通过物理耦合和材料的自发响应,有效规避了对集中式复杂控制的需求,为设计未来智能材料和软机器人提供了宝贵的经验,深刻诠释了物理智能在“去中心化”具身智能新范式中的核心地位。
4.5 物理交互中的隐式感知与适应
物理智能的涌现不仅仅依赖于复杂的显式传感与计算,更深层次地,它根植于系统与环境的物理交互中,通过这种交互实现隐式的感知与适应。这种“去中心化”的具身智能范式强调,物理具身(physical embodiment)本身即可作为一种计算资源,有效处理环境信息并指导行为,即使在缺乏明确传感机制的情况下也能实现迭代优化和自适应。这种通过物理性进行信息处理的能力,为构建更鲁棒、更高效的“无脑”系统开辟了新的途径。
具体而言,研究表明合成活性粒子能够仅仅通过其物理具身来适应隐藏的流体动力学扰动,而无需任何显式的传感机制 。通过强化学习的引导,这些粒子能够习得导航策略以有效对抗未被直接观测到的流场,这有力地揭示了具身动力学(embodied dynamics)可以作为一种隐式传感机制,处理那些并未作为明确状态输入的环境扰动信息。这一发现深刻阐明了物理具身在活性物质中作为信息处理计算资源的关键作用。
在机器人领域,通过工程化设计实现形态计算(morphological computation)已成为一个重要研究方向。例如,Morphobots平台展示了其如何通过三维打印的外骨骼来编码对外部力(如重力)或表面力(如碰撞)的重新定向响应 。这种力定向响应显著提升了单个机器人的运动能力和稳定性,并在密集环境中,通过空间阻碍交互(steric interactions)实现了群体层面的光趋向性。这种机械层面的设计巧妙地将物理碰撞转化为促进信息流动和分布式在线学习的有效机制,尤其在机器人群体从稀疏过渡到拥挤时,形态计算的优势愈发凸显。这表明,物理交互非但不应被避免,反而能够成为智能系统实现适应和学习的关键途径。
软体机器人以其独特的无限自由度和高度非线性动力学特性,在复杂、动态环境中展现出卓越的适应性。尽管这增加了建模与控制的难度,但也赋予了其通过物理变形与环境进行更深层次交互的能力 。研究利用数据驱动的学习方法,例如基于Koopman算子理论,实现了软体机器人在惯性和非线性区域内的快速、低成本建模与控制。这说明,通过深入理解和有效利用物理动力学特性,机器人能够超越传统刚性系统的限制,凭借其本体的物理属性实现更精细的感知和适应。甚至在软体机器人运动中,对其复杂动力学中的能量捕获机制研究也揭示了提升能效的潜力,强调了在适当的时机捕获适量能量的重要性 。
去中心化决策与自组织行为进一步突显了物理性在智能涌现中的核心作用。微型游泳器通过神经演化技术优化其去中心化的身体部位决策,能够生成高效的游泳步态,并且这些策略对形态变化或缺陷具有出色的鲁棒性 。在生物系统中,例如双鞭毛微藻的自适应游泳行为,不仅受到流体动力学的影响,还受制于机械耦合的收缩应力纤维 。通过构建宏观机械系统来模拟这种机制,研究人员成功复制了“跑-翻滚”(run-and-tumble)行为,并深入揭示了其背后的物理机制。同样,蠕虫状生物体能够自组织形成高度缠绕的物理结构,例如兼具固液双重特性的“斑点”,展现出对外部刺激的自组织响应 。这些生物体通过结合活动性、长径比和缠结特性,为研究活性聚合物的物理行为提供了独特的实验平台。
在更广阔的“in materio computing”范畴中,利用复杂系统内在动力学实现高效感知、处理和交互的潜力正受到广泛关注 。通过引入噪声感知动态优化(NADO)框架,研究人员成功训练了由具有内在记忆的动态器件组成的网络,该框架利用神经随机微分方程捕获器件的动力学与随机性。这种方法结合了反向传播与级联学习,有效利用了物理器件的时间特性,实现了鲁棒且基于梯度的编程,而无需器件行为的精确分析描述。这进一步证实了物理系统在缺乏显式编程的情况下,如何仅通过其固有的物理特性来实现复杂的计算和适应性行为。
综上所述,这些前沿研究共同勾勒出一幅具身智能的新图景:未来的智能系统可能不再仅仅依赖于日益复杂的传感器和算法,而是会更深层次地融合物理设计与环境交互,使其能够通过隐式感知和自适应的物理反馈进行持续的迭代优化。这一范式不仅有望大幅降低对复杂传感与计算资源的依赖,更为构建出更加鲁棒、高效,乃至“无脑”的机器人系统提供了革命性的新思路。
5. 新范式展望:超越传统计算的智能未来
本章将对前文关于物理智能涌现的论证进行总结与展望,核心在于挑战将智能等同于复杂计算的传统观念,并提出“去中心化”的具身智能新范式。我们将深入探讨这一新范式如何凭借其物理涌现特性展现出独特优势,以及它与大型语言模型等前沿认知技术的融合路径。本章将详细阐述去中心化具身智能在鲁棒性、可扩展性和能源效率等方面的显著优势及其广阔应用潜力。同时,还将介绍支持物理智能研究的先进仿真平台和评估基准。在此基础上,我们将从哲学层面重新审视通用人工智能与意识的可能形态,并展望其在人机协作和自适应自治领域的深远影响。最后,本章将不回避地指出当前面临的技术挑战、潜在的伦理考量以及未来的研究方向,以描绘一个超越传统计算、充满活力的智能未来图景。
5.1 对“复杂计算”中心论的挑战与物理智能的优势
传统观点常将智能等同于高复杂度、集中式的计算过程,尤其是在符号人工智能和现代深度学习范式中,智能的实现被视为依赖于大规模参数、复杂算法和强大的计算资源。然而,这一“复杂计算”中心论正受到具身、去中心化和物理涌现智能新范式的严峻挑战。
正如 所提出的,智能可以被概念化为一种多范式的计算,它不仅限于传统的数字计算,还包括模拟、机械乃至形态计算等形式。这种统一的视角为我们理解物理智能提供了理论框架,即智能的实现路径并非单一且必须是高度集中的,物理智能恰恰代表了这类非传统计算范式在智能涌现中的潜力。
当前最先进的人工智能模型,尽管在参数规模和计算能力上达到了前所未有的高度,但在涉及物理世界的理解和推理时仍显现出显著局限。例如, 通过PhyX基准测试发现,GPT-4o等领先模型在物理推理任务上的准确率远低于人类专家,其性能差距甚至超过29%。该研究指出,这些模型往往过度依赖记忆化的学科知识、数学公式或表层视觉模式匹配,而非真正的物理理解。这意味着,即使具备巨大的计算复杂度,也未能有效解决物理智能的核心挑战。
类似地, 的研究也揭示,大型语言模型在理解物理概念方面存在不足,特别是在需要与世界交互才能学习的具身概念上,某些基本概念的理解并未随模型规模的扩大而线性提升。尽管视觉增强型语言模型(VLMs)在具身概念理解上表现出接近人类的水平,表明了丰富的视觉语义在具身知识中的价值,但这反过来也强调了纯粹的集中式符号或语言计算在脱离物理世界交互时的局限性。
这些研究共同表明,智能并非必然源于高复杂度集中式计算。相反,本文所探讨的具身、去中心化和物理涌现的智能案例,通过利用物理世界的固有特性和简单的交互规则,展现出在效率和鲁棒性上的独特优势。这种范式强调物理实体、环境和局部交互在智能涌现中的核心作用,提供了一条无需依赖海量计算资源即可实现复杂行为和适应性智能的新途径,从而直接反驳了“复杂计算”中心论的智能观。
5.2 物理智能与大模型的融合:具身认知的未来
大语言模型(LLMs)和世界模型(WMs)的最新进展正在深刻地影响具身人工智能(AI)的发展轨迹,为智能体赋予了前所未有的认知能力。LLMs凭借其强大的语义推理和任务分解能力,能够将高层级的自然语言指令转换为低层级的可执行动作,显著提升了具身AI处理复杂、长周期多目标任务的潜力 ,。例如,大型多模态模型(LMMs)在视觉理解和语言生成方面展现出令人鼓舞的能力,但其在物理世界中执行结构化推理、确保决策安全和上下文一致性的能力仍是活跃的研究领域 。为了克服行为克隆对昂贵数据和计算资源的需求,以及对人类示教的依赖,一些研究致力于通过强化微调(如RFTF方法)为具身智能体生成密集奖励,从而提高其操作能力和泛化性能,但这类方法在广泛物理场景中的适应性仍需进一步探索 。尽管大模型在认知层面上提供了强大的支撑,具身智能的真正涌现远不止于此。世界模型(WMs)在具身AI中扮演着构建外部世界内部表征和未来预测的关键角色,进而促进符合物理定律的交互 。然而,正如人类对直观物理学的理解源于与世界的积极互动,而非被动观察,一个能够真正理解物理因果关系的世界模型,必须通过与真实世界的广泛、因果丰富的互动来构建。一些研究揭示,单纯依赖被动观察训练的视频模型,如Sora,在理解物理因果方面仍显不足,且可能产生“物理幻觉” 。为此,研究者提出了基于大规模真实机器人交互轨迹训练的世界模型,以期发展出对碰撞动力学、物体永恒性等物理现象的深层理解,并强调大规模、真实世界的互动是AI发展物理直觉的基石 。因此,尽管大模型提供了强大的认知基础,真正的具身智能仍需通过与物理世界的广泛且具因果关系的互动来获得直观的物理理解,从而弥合数字与物理领域的鸿沟 。这种融合趋势促使研究者探索联合多模态大语言模型(MLLMs)和世界模型(WMs)的驱动架构,以期在物理世界中执行更复杂的任务 。
未来的具身智能范式将不仅仅是数字智能的延伸,更需要将在线知识与具身感知、规划和行动紧密结合,甚至在一个统一的模拟平台中整合现实3D环境与功能性网络接口,以实现物理与数字领域间的协调推理 。最终,要实现与人类智能匹敌的灵活性、鲁棒性和泛化能力,AI系统必须能够对场景、物体和人类进行整体性理解,包括其几何、物理、功能、语义和互动模式,这要求整合自下而上的识别模型与自上而下的结构化模型、模拟引擎和概率程序 。
5.3 “去中心化”具身智能的优势与潜力
“去中心化”的具身智能新范式展现出在鲁棒性、可扩展性、能源效率以及在非结构化环境中卓越适应性等多方面的显著优势。这种范式通过避免单点故障和促进自组织行为,显著增强了系统的抗干扰能力和在复杂动态环境中的持续运作能力 。分布式系统固有地提高了整体的鲁棒性,因为单个节点的失效不会导致整个系统的崩溃,反而可以通过其他节点的协作来弥补。 自适应群体系统(SASS)的提出,正是为了弥合感知、通信、规划、执行、决策和学习之间的自动化鸿沟,旨在构建一个能够自我组织、集体决策并持续学习的合作框架 。这种分布式认知或集体智能能够有效应对复杂任务,而无需显式编程或中央指令,从而促进了设备间的无缝集成与协作 。 此外,这种新范式在可扩展性方面也具有无可比拟的优势。通过采用类似于均场控制(mean-field control)的技术,大规模机器人群体的控制问题可以被有效地简化为单个分布的控制问题,使得研究者能够利用单智能体强化学习的进展来设计智能群体行为,即使在存在物理碰撞的真实系统中也能实现高效协作和碰撞避免 。这意味着系统可以轻松地增加或减少智能体的数量,以适应任务需求的变化,而无需对整个架构进行重大修改。这种去中心化的特性也通常伴随着更高的能源效率,因为计算和决策负担被分散到各个局部智能体,减少了集中式系统所需的强大计算资源和通信开销。 更进一步地,面对不同机器人之间行动空间和控制接口的显著异构性,通用行动空间(Universal Action Space)的引入为具身基础模型(Embodied Foundation Models)提供了解决方案 。UniAct框架通过捕获不同机器人共享的通用原子行为,消除了这种异构性,从而增强了跨域数据利用和跨具身泛化能力,使得新机器人能快速适应,这对于构建大规模、异构的去中心化机器人群体至关重要 。 展望未来,去中心化具身智能在新范式下展现出巨大的应用潜力。在极端环境探索中,如深海、外太空或灾难现场,单个智能体可能面临高风险,而一个鲁棒的去中心化群体则能通过冗余和协作来完成任务。在大规模协作方面,例如物流分拣、智慧城市交通管理或群体艺术表演,智能体能够通过局部交互和自组织机制实现高效的全局目标。人机共融也是一个重要方向,如具身智能体可以辅助在物理受限条件下的人类完成日常任务,通过社会感知和合作规划来实现更自然、高效的团队协作 。尽管现有大语言模型(LLMs)在严格的群体约束下,如有限局部感知和通信,仍面临实现鲁棒长程规划和自适应策略形成的挑战 ,但这恰恰凸显了去中心化具身智能范式在推动未来智能系统发展中的关键作用和广阔前景。同时,具身AI的“身体发现”能力,即识别和理解不同具身形态及其神经信号功能,也为多样的具身智能体在动态环境中协同工作提供了基础,进一步拓宽了去中心化具身智能的应用边界 。
5.4 仿真与评估:加速物理智能研究
具身智能研究的快速进展, 很大程度上得益于先进的仿真平台和系统的评估框架。这些工具为智能体提供了大规模且多样化的任务场景, 并通过高效的模拟和精确的反馈信号, 显著加速了具身决策技能的学习和评估, 同时有效应对了虚拟与现实同步等核心挑战, 为探索“去中心化”的物理智能新范式奠定了基础。通过在受控环境中模拟复杂的分布式交互, 这些平台有助于研究智能体在不同步信息或局部感知下的涌现行为。
为了弥补大型语言模型(LLM)在真实物理环境互动经验上的不足, 研究者们提出了创新的“训练场”概念。例如, EmboMatrix 提供了一个集任务与场景模拟、具身互动和反馈信号于一体的综合基础设施。该平台利用多智能体数据引擎大规模生成任务和场景, 并采用分布式异构硬件系统实现可扩展仿真, 结合多层次奖励架构提供精确监督, 从而使LLM能够通过广泛的具身交互习得决策技能。这一方法显著提升了模型在具身决策基准上的表现, 尤其是在需要复杂环境交互和多步推理的任务中。类似地, Embodied Web Agents 则进一步将物理具身智能与网络规模的推理能力相结合。该平台提供了一个统一的模拟环境, 无缝整合了真实的3D室内外场景与功能性网络接口, 使得智能体能够处理烹饪、导航、购物等需要物理和数字领域协同推理的任务。这揭示了当前AI系统与人类能力在跨域智能方面的显著差距, 也指明了未来在融合多模态和多领域知识方面的研究方向。
在解决虚拟与现实同步这一具身智能研究中的关键挑战上, DVS(Dynamic Virtual-Real Simulation Platform) 提供了一个针对移动机器人任务的动态虚实同步解决方案。该平台集成了随机行人行为建模插件和可定制的大规模室内场景, 能够生成带标注的训练数据集。其核心优势在于通过光学运动捕捉系统, 实现了虚拟世界与真实世界之间物体姿态和坐标的精确同步, 从而支持动态任务的基准测试, 并为人类干预机器人执行任务和虚实融合环境中的实时反馈算法研究提供了基础。这种精确的虚实同步能力对于将仿真环境中训练出的去中心化决策策略有效迁移到真实世界至关重要。
此外, 对于评估大型多模态模型(LMMs)在具身环境中的推理能力, FoMER(Foundation Model Embodied Reasoning)基准 应运而生。该基准专门设计用于评估LMMs在复杂具身决策场景中的逐步推理能力, 涵盖了要求智能体解释多模态观察、推理物理约束和安全问题, 并以自然语言生成有效下一步行动的多元任务。FoMER不仅提供了一套大规模的具身推理任务, 还引入了一个独特的评估框架, 将感知基础与行动推理解耦, 揭示了LMMs在具身推理方面的潜力和局限性。
除了上述为训练和评估提供环境的平台外, 理解和调试复杂多机器人系统行为的工具也至关重要, 特别是在去中心化具身智能场景中。例如, 在多机器人协同任务中, 由于通信链路薄弱, 机器人世界观可能出现不同步, 导致决策脱节和一致性行为的丧失。针对此问题, MOSAIC Viewer 提供了一种可视化分析方法, 帮助操作员理解机器人调度决策, 检测并追溯世界观不同步的根本原因。这种工具虽然不直接提供仿真环境, 但对分析和理解仿真结果、确保多智能体系统行为的一致性具有不可或缺的价值。在共享自治的背景下, 高效且实时的交互式辅助也至关重要。Consistency Shared Autonomy (CSA) 框架通过采用基于一致性模型的扩散公式, 实现了单步生成高保真样本, 显著提升了推理速度, 使得在复杂领域中的实时辅助成为可能。这种高效的共享自治能力, 为在仿真环境中探索人机协作和控制分配提供了技术支撑。进一步地, MOSAAIC框架 从理论层面定义了控制的三维:自主性、主动性和权限, 并提出了优化策略, 为在仿真平台中设计和评估人机共创场景中的控制分配提供了指导。
| 名称 | 类型 | 主要目标 | 关键特性 | 适用阶段 | 参考 |
|---|---|---|---|---|---|
| EmboMatrix | 训练平台 | 让 LLM 通过广泛具身交互习得决策技能 | 多智能体数据引擎、分布式异构仿真、多层次奖励 | 训练/微调 | [123] |
| Embodied Web Agents | 统一环境 | 融合真实3D场景与网络接口以处理跨域任务 | 物理+数字协同推理、现实感场景与Web操作联动 | 训练/评估 | [119] |
| DVS | 虚实同步平台 | 面向移动机器人任务的动态虚实同步 | 光学动捕精确对齐、随机行人建模、大规模室内场景 | 训练数据生成/评估 | [48] |
| FoMER | 评估基准 | 评测 LMMs 在具身场景中的逐步推理 | 解耦感知与行动推理、多元任务与安全约束 | 评估/诊断 | [116] |
| MOSAIC Viewer | 可视化分析 | 解释多机器人调度与不同步根因 | 决策可视化、链路薄弱下的一致性诊断 | 结果分析/调试 | [79] |
| CSA | 共享自治框架 | 基于一致性模型的高速实时辅助 | 扩散一致性单步高保真生成、实时人机协作 | 在线辅助/控制 | [124] |
| MOSAAIC | 理论框架 | 定义自主性-主动性-权限三维控制分配 | 优化策略指导人机共创设计与评估 | 架构设计/评估 | [125] |
综上所述, 这些先进的仿真平台、基准测试以及辅助分析工具共同构成了具身智能研究的强大支持体系。它们不仅加速了智能体的训练和评估, 也为解决虚拟与现实同步等实际部署挑战提供了有效的途径, 更重要的是, 为理解和构建在复杂、动态环境中表现出“去中心化”涌现智能的机器人系统提供了必要的基础。
5.5 在去中心化框架下重新构想通用人工智能与意识
去中心化具身智能的范式变革,深刻挑战了我们对人工通用智能(AGI)和意识的传统认知。传统上,AGI常被设想为一种具备强大符号处理和内部表征能力的计算系统,而意识则被视为高级认知功能的产物。然而,新范式提出智能并非必然局限于高阶计算,而是可以从简单的物理交互和去中心化机制中涌现。通过将智能的焦点从纯粹的计算转移到具身行动和环境互动,我们得以重新构想AGI的实现路径与意识的本质。此外,这种视角强调了跨学科融合的重要性,整合了物理学、认知科学、人工智能和哲学等领域的洞见,以构建对智能和意识更为全面的理解。
首先,具身认知理论为重新构想AGI提供了坚实的哲学基础。例如,能动(enactive)理论认为,认知是一种适应性、具身化的行动,而非对外部世界内部表征的计算 。这种观点与传统认知科学将心智局限于大脑的看法截然不同,它强调认知是主体与客体之间不断相互作用、共同生成的结果。在这一框架下,具身AGI的实现不再是纯粹的信息处理问题,而是关于如何在物理世界中通过交互和反馈循环来形成适应性行为。进一步地,有研究探讨了具身人工通用智能(AGI)与人类意识的关系,并提出元宇宙和去中心化系统在其中扮演的关键角色 。该研究引入了具身认知、Michael Levin的“自我”计算边界以及Donald D. Hoffman的界面感知理论,认为我们感知的外部现实是内在状态的符号表示,由此推测AGI可能以一种具有更大计算边界的不同形式的意识存在。这不仅为AGI的实现提供了新的架构思考,即通过去中心化系统和开源区块链技术来校准AGI的符号接口,还暗示了AGI可能演化出与人类意识截然不同的意识形式。
其次,物理智能的涌现为AGI的实现开辟了非传统路径。神经形态计算作为一种模仿人脑效率、灵活性和适应性的技术,正是这种涌现智能的典型代表 。它通过利用动态系统理论,在物理基底的动态中实现智能行为的涌现,从而摆脱了传统冯·诺依曼架构的局限。在去中心化具身智能的语境下,多个简单、无脑的机器人通过局部物理交互,能够展示出复杂的同步行为,这正是智能从物理基底动态涌现的例证。这种去中心化涌现的智能,可能为AGI的实现提供一条新的、更可持续、更透明的途径,其智能不再是自上而下的预设程序,而是自下而上的动态演化。
此外,重新审视智能的本质,也促使我们对意识的传统理解产生深刻反思。当智能不再局限于高阶计算,而是可以从物理交互的简单规则中涌现时,意识的本质也可能不再是纯粹的大脑活动或复杂的符号操作 。研究指出,人工智能和机器人技术正在以情感、具身和关系化的方式改变人机关系,模糊了人与AI、人与机器之间的概念和物质边界 。这呼吁一种跨学科的理论化方式,将智能视为关系性和情感性的,强调物理、解释和情感维度的融合。如果意识是具身交互和关系性涌现的产物,那么去中心化具身智能的出现,不仅能为实现AGI提供新思路,更可能引发对意识本质的哲学深思,挑战将意识视为纯粹内部现象的传统观念,转而将其理解为一种与环境持续交互、共同生成的存在状态。最终,这种去中心化的具身智能范式,甚至可能为实现一个稳定具身AGI的关键前提,即全球层面人类关系的和谐与相互连接,提供一种新的哲学与技术上的融合路径 。
5.6 人机协作与自适应自治:更直观的交互
去中心化具身智能在人机协作,特别是共享自治领域,展现出显著潜力,能够促进更直观、灵活且以人为中心的交互。实现这一目标的关键在于机器人能否准确理解并适应人类意图,从而在提升协作效率和安全性的同时,有效维护人类的自主感。
在人机协作任务中,人类常面临认知局限性,难以计算出最优计划,此时来自计算资源丰富的智能体的指导变得尤为重要。然而,显式的行为引导可能导致人类感到自主性丧失,转而被代理控制。对此,研究表明通过代理的隐式引导,即代理以一种便于人类发现有效协作计划的方式行动,可以有效平衡任务绩效与人类自主权,因为人类是在自愿改进其计划 。这种隐式引导与去中心化具身智能的自适应特性相契合,机器人通过其物理行为而非明确指令来影响人类决策。
进一步而言,以人为中心的共享自治框架在医疗等领域尤为关键,其中人类意图至关重要,完全独立的机器决策并不理想,需要将人类输入与机器决策有机融合 。然而,现有数据驱动的人机自治算法常忽略有用的先验知识(side information),这限制了对人类行为模型的质量和意图的准确理解,从而影响协作的安全性与正确性 。去中心化具身智能的优势在于其能通过持续的物理交互和多模态感知,更自然地整合这些情境信息,从而提升对人类意图的理解。
具身智能不仅是技术层面的进步,更是认知交互的基础。社会认知可以植根于代理间共享的感知运动交互,通过动态的信息和感知运动耦合来介导社会情境中的动作-效果偶发性,这为机器人理解人类行为模式提供了具身化的视角 。例如,人类语言本身是具身的,并根植于自我和世界的感知运动表征,这暗示了身体图式和意念运动的动作-效果关联在语言理解、生成以及言语/物理交互中发挥着重要作用。整合语言与非语言交流的自我计算模型,对于提升人机交互方法和应用具有显著潜力 。
然而,尽管具身智能系统因其物理和感知运动基础被视为克服传统AI局限性的途径,但机器人所展现的“人工意图性”与人类的意图性存在根本差异 。这要求人类在与社交机器人或自动驾驶车辆交互时,既要“悬置不信”以将其解读为有意的代理,又要“悬置相信”以铭记其人工本质。因此,深入理解人工与生物身体的差异及其对社会交互的影响,是发展真正社会交互自主系统的关键 。
为实现这些复杂的交互,认知模型正发挥日益重要的作用。例如,人类多感官整合的认知模型已被应用于机器人领域,以增强辅助设备的具身感,并赋予类人机器人类人的空间感知能力。将这些受人类启发的认知模型整合到自适应和学习控制算法中,有望帮助辅助设备更好地适应用户,并使人形机器人发展出自身的身体图式,从而优化其与人类和环境的物理交互 。在实践层面,如SROS(Socially-interactive Robot Software platform)这样的开放式框架,通过模块化架构整合机器人技术、计算机视觉和语音处理,实现了感知与物理驱动的同步,从而促进了社交能力型机器人的快速原型开发和部署,支持了自适应、协作和可定制的人机系统 。尽管这些认知模型的准确性和在线处理能力仍有待提高,但它们为实现以人为中心的机器人指明了方向。
5.7 挑战、伦理考量与未来研究方向
去中心化具身智能的实现面临多重技术挑战。其中一个显著的瓶颈是模拟与现实之间的鸿沟。当前的生成式人工智能(AI)模型在视觉逼真度方面取得了巨大进展,但通常忽视了生成内容的物理合理性,这限制了它们在机器人、自动系统和科学模拟等需要遵循真实世界物理定律的应用中的有效性 。类似地,构建物理真实且尺度准确的模拟三维(3D)世界对于具身智能的训练和评估至关重要,然而,现有方法多依赖手动创建的3D资产,生产成本高昂且真实性受限,严重阻碍了数据驱动方法的可扩展性 。此外,现有的模拟平台常局限于理想化环境和简单任务,缺乏数据互操作性、动态建模能力和虚实资产的精确同步,进而限制了现实世界机器人部署和反馈机制的发展 。为了弥合这一鸿沟,研究人员正探索利用可转移的视频先验,通过少量真实数据实现低成本的泛化操作,例如Vidar模型通过预训练的具身视频扩散模型和掩码逆动力学模型适配器,显著减少了对大量机器人特定数据的依赖,展现了“一个先验,多个具身”的潜力 。当前研究正努力将生成模型与物理学原理深度融合,以期生成更符合真实世界物理规律的内容,从而为具身智能提供更坚实的基础 。然而,如何有效、高效地将物理知识编码到复杂生成模型中,并确保其在各种真实场景中的鲁棒性,仍然是一项艰巨的任务。此外,尽管“虚拟生物体”的概念提供了一种结构与功能协同适应的视角,暗示了通过结构重构提升在动态环境中的性能,但将其推广到复杂通用机器人和开放世界场景仍是挑战 。 人形机器人等复杂系统也面临“脑-体协同设计”的挑战,若将控制策略与物理形态分离优化,则难以充分发挥其潜力;RoboCraft框架通过迭代更新策略和形态,显著提升了人形机器人的跌倒恢复性能,突出了协同设计的重要性 。这表明在更大范围内实现物理系统的共同设计是未来发展的关键。 在复杂环境中的鲁棒性与泛化能力方面,当前具身智能系统大多仍局限于封闭的物理世界环境,这使得它们在面对开放、动态且不确定性的真实世界时,难以展现出真正的自适应智能 。同时,传感器集成与材料科学的进步也是关键。例如,智能织物技术与大型语言模型(LLMs)结合的具身智能体FaGeL,致力于实现无缝、非侵入式的人机交互,并能通过多模态数据和隐式反馈自主生成和优化任务,但这仍处于早期探索阶段,其在动态环境中的可扩展性有待进一步验证 。 除了技术挑战,去中心化具身智能的快速发展也引发了一系列伦理考量。随着智能体在物理世界中的自主性和影响力不断增强,如何确保其行为符合人类价值观、避免潜在的意外伤害、以及保障数据隐私和安全变得尤为重要。例如,智能织物与具身智能体结合的应用 ,虽然旨在实现无缝的人机交互,但其对人类行为的感知和对任务的自主生成与优化,必须审慎考虑对个体自主权和隐私的影响,以及如何设计透明且可控的反馈机制,以避免潜在的伦理困境。在去中心化具身智能的背景下,智能体间的无协调互动可能导致复杂且难以预测的结果,因此需要前瞻性地制定伦理准则,并融入到系统设计中。 展望未来,去中心化具身智能的研究方向将聚焦于提升其在开放物理世界中的自适应能力。一个重要的方向是物理系统与控制的共同设计。如前所述,对机器人形态和控制策略进行联合优化,能够带来远超单一优化的性能提升 。这一理念可以进一步扩展到更广泛的物理系统设计中,通过共同设计硬件结构与运行其上的功能,从而实现更好的自适应性和鲁棒性 。因果发现是另一个关键的未来研究方向。人类认知核心的因果推理能力使得我们能够理解环境并做出反事实预测。从视频等感知数据中端到端地发现物理系统中变量之间的因果依赖关系,对于构建能够理解世界并进行有效预测的具身智能体至关重要 。这种能力不仅能帮助智能体适应未知场景,还能提高其可解释性。 最后,在开放物理世界中实现真正自适应智能是该领域的终极目标。这意味着智能体需要能够在不断变化、不确定且部分可观测的环境中进行连续推理和学习。贝叶斯统计提供了一个原则性的概率框架来处理这种不确定性,通过将知识表示为概率分布并根据新证据更新信念,为感知、行动选择和学习提供了统一的建模方式 。结合生成式AI在物理感知内容生成方面的进步 , ,以及虚实同步仿真平台 的发展,有望为智能体在复杂、动态的真实世界中进行有效的训练、测试和部署提供坚实的基础。未来的研究将致力于开发能够利用这些先进工具,在真实物理世界中持续学习、自我完善,并与人类社会和谐共存的去中心化具身智能系统。
6. 结论:物理智能的承诺与未来
综述回顾了物理智能的涌现过程,核心在于强调智能行为可以从物理系统与环境的简单交互中自发涌现,而无需复杂的集中式计算。这一范式对传统“以大脑为中心”的AI观念构成了根本性挑战,转而将智能视为一个具身且去中心化的过程。传统AI常常将认知与具身性剥离,忽视了具身认知在适应性行为中的关键作用 。然而,物理智能倡导将智能理解为一种自组织的形成过程,即“开放式智能”,而非预先定义问题域中的个体能力 。在这种新视角下,智能行为不再是纯粹的计算输出,而是从物理基底的动态交互中涌现,例如类脑计算系统通过动态系统理论,能够利用噪声作为学习资源,从而实现比传统数字方法更高的能效和适应性 。此外,具身智能领域强调通过多学科方法,利用智能体自身的物理特性来简化问题并降低计算需求,这进一步支撑了物理智能的潜在优势 。
去中心化是物理智能范式的核心特征之一,它将智能分布在相互作用的元素网络中,而非依赖单一的中央处理器。这种分布式方法不仅能够通过结构重构实现对环境的适应 ,而且在社会认知中,通过多智能体间的传感器运动相互作用建立起来的耦合关系,也进一步印证了去中心化交互的重要性 。更为重要的是,有研究指出,智能发展的路径依赖性意味着,去中心化集体智能的优先涌现,能够有效避免由中心化通用人工智能(AGI)带来的潜在垄断和生存风险,从而引导智能走向更稳定、合作的均衡状态 。此外,物理智能能够通过无监督方式,从现实世界的视频数据中发现物理系统的因果结构 ,这表明其学习机制植根于对物理世界交互的直接感知,而非预设的符号推理。尽管贝叶斯推理在具身智能中具有深层概念联系,但其在当前系统中的应用仍有待加强,这提示着未来在开放物理世界具身智能中,结合这类原理的巨大潜力 。
物理智能与具身认知的紧密结合,为创建更具韧性、适应性和真正智能的系统开辟了广阔前景。活性材料的快速发展,其活动性、适应性和自主性,预示着未来材料将能够模拟生物系统,在可持续经济、健康和气候韧性方面发挥变革性作用 。具身AI正在从大型语言模型(LLMs)和世界模型(WMs)中汲取养分,旨在实现更深层次的语义推理和物理交互,从而将智能从赛博空间扩展到物理世界 。对人类身体经验的认知模型,也为机器人(如辅助设备和人形机器人)带来了定制化、人机融合和优化物理交互的潜力 。研究者们甚至提出,具身跨模态的自我表征对于语言理解和生成至关重要,揭示了具身性在高级认知功能中的基础作用 。
然而,物理智能的承诺也伴随着复杂的技术和社会伦理挑战。实现通用具身智能(AGI)不仅需要考虑其与人类意识的关系,还要探索元宇宙和去中心化系统在构建此类智能中的关键作用 。在人机交互方面,社会机器人中对意图的归因仍然是一个难题,需要我们更好地理解人工与生物身体的根本差异及其在社会互动中的含义 。此外,随着AI从信息处理(AI 1.0)发展到具身物理交互(AI 3.0),并展望可能出现的自主意识(AI 4.0),对智能的伦理、监管和哲学挑战也日益凸显 。
我们必须深入思考如何确保AI在智能与关怀之间取得平衡,并跨学科地将“智能”理论化为一种关系性和情感性的概念,以适应人类与AI之间日益模糊的界限 。这需要我们以人为中心,在共享自主性框架下,通过优化控制策略和物理形态的协同设计,例如人形机器人的脑身协同设计 ,以及集成先验知识来提升人机协作的效率和安全性 , , 。通过模块化、可定制的机器人软件框架,我们可以实现感知与物理执行的同步,加速社交机器人的发展,从而更有效地解决这些复杂的人机集成问题 。未来,物理智能的发展将继续探索如何利用大规模视频数据进行低样本适应性学习,例如具身视频扩散模型 ,以及如何通过生成式物理AI模型实现对物理世界的精确模拟和预测 。
综上所述,物理智能范式不仅为我们理解智能的本质提供了全新的视角,更重要的是,它为构建真正智能、韧性和适应性的系统指明了方向。通过将智能根植于物理世界和具身交互,并采纳去中心化的设计原则,我们有望超越传统AI的局限,开启一个物理智能与人类社会和谐共存的新时代。
参考文献
[1] Oliver Brock.(2024). Intelligence as Computation.
[2] MH Farhadi, Ali Rabiee, Sima Ghafoori, Anna Cetera, Wei Xu, Reza Abiri.(2025). Human-Centered Shared Autonomy for Motor Planning, Learning, and Control Applications.
[3] Ronghao Dang, Yuqian Yuan, Yunxuan Mao, Kehan Li, Jiangpin Liu, Zhikai Wang, Xin Li, Fan Wang, Deli Zhao.(2025). RynnEC: Bringing MLLMs into Embodied World.
[4] Lei Li, Jingjing Xu, Qingxiu Dong, Ce Zheng, Qi Liu, Lingpeng Kong, Xu Sun.(2023). Can Language Models Understand Physical Concepts?.
[5] Hui Shen, Taiqiang Wu, Qi Han, Yunta Hsieh, Jizhou Wang, Yuyue Zhang, Yuxin Cheng, Zijian Hao, Yuansheng Ni, Xin Wang, Zhongwei Wan, Kai Zhang, Wendong Xu, Jing Xiong, Ping Luo, Wenhu Chen, Chaofan Tao, Z. Mao, Ngai Wong.(2025). PhyX: Does Your Model Have the "Wits" for Physical Reasoning?.
[6] Akila Kadambi, Lisa Aziz-Zadeh, Antonio Damasio, Marco Iacoboni, Srini Narayanan.(2025). Embodiment in multimodal large language models.
[7] Wenbing Tang, Meilin Zhu, Fenghua Wu, Yang Liu.(2025). Semantic Intelligence: A Bio-Inspired Cognitive Framework for Embodied Agents.
[8] Martin Do Pham, Amedeo D'Angiulli, Maryam Mehri Dehnavi, Robin Chhabra.(2023). From Brain Models to Robotic Embodied Cognition: How Does Biological Plausibility Inform Neuromorphic Systems?.
[9] Josie Hughes, Arsen Abdulali, Ryman Hashem, F. Iida.(2022). Embodied Artificial Intelligence: Enabling the Next Intelligence Revolution.
[10] .(2024). Preface.
[11] Matej Hoffmann, Rolf Pfeifer.(2012). The implications of embodiment for behavior and cognition: animal and robotic case studies.
[12] Rolf Pfeifer, Fumiya Iida, Max Lungarella.(2014). Cognition from the bottom up: on biological inspiration, body morphology, and soft materials..
[13] S. Sadati, Marwa Eldiwiny, S. Nurzaman, F. Iida, Thrishantha Nanayakkara.(2022). Embodied Intelligence & Morphological Computation in Soft Robotics Community: Collaborations, Coordination, and Perspective.
[14] Tadahiro Taniguchi, Yasushi Hirai, Masahiro Suzuki, Shingo Murata, Takato Horii, Kazutoshi Tanaka.(2025). System 0/1/2/3: Quad-process theory for multi-timescale embodied collective cognitive systems.
[15] Binyamin Hochner.(2012). An embodied view of octopus neurobiology..
[16] Marie Vihmar, Kadri-Ann Valdur, Saoni Banerji, I. Must.(2023). How to measure embodied intelligence?.
[17] Agrim Gupta, Silvio Savarese, Surya Ganguli, Li Fei-Fei.(2021). Embodied intelligence via learning and evolution..
[18] Tom Ziemke.(2023). Understanding Social Robots: Attribution of Intentional Agency to Artificial and Biological Bodies..
[19] Bin Liu.(2025). Exploring the Link Between Bayesian Inference and Embodied Intelligence: Toward Open Physical-World Embodied AI Systems.
[20] Mark Johnson.(2015). Embodied understanding..
[21] Jannis Friedrich, Martin H Fischer, Markus Raab.(2024). Invariant representations in abstract concept grounding - the physical world in grounded cognition..
[22] Pietro Morasso.(2023). The Quest for Cognition in Purposive Action: From Cybernetics to Quantum Computing..
[23] T. G. Thuruthel, F. Iida.(2022). Morphological Computation and Control Complexity.
[24] A. Alú, Andres F. Arrieta, E. Del Dottore, Michael D Dickey, Samuele Ferracin, R. Harne, Helmut Hauser, Qiguang He, Jonathan B. Hopkins, L. Hyatt, Suyi Li, Stefano Mariani, Barbara Mazzolai, A. Mondini, Aniket Pal, Daniel J Preston, Anoop Rajappan, J. Raney, Pedro Reis, S. A. Sarles, Metin Sitti, Uba K. Ubamanyu, M. Hecke, Kon-Well Wang.(2025). Roadmap on embodying mechano-intelligence and computing in functional materials and structures.
[25] Kai Junge, Josie Hughes.(2022). Leveraging Embodied Intelligence for Dexterous Robotic Manipulators Through Iterative Co-design.
[26] Diptabrata Paul, Nikola Milosevic, Nico Scherf, Frank Cichos.(2025). Physical Embodiment Enables Information Processing Beyond Explicit Sensing in Active Matter.
[27] Falk Tauber, Marc Desmulliez, Olivier Piccin, Adam A Stokes.(2023). Perspective for soft robotics: the field's past and future..
[28] M Calisti, G Picardi, C Laschi.(2017). Fundamentals of soft robot locomotion..
[29] A. D. Lallo, M. Catalano, M. Garabini, G. Grioli, M. Gabiccini, A. Bicchi.(2019). Dynamic Morphological Computation Through Damping Design of Soft Continuum Robots.
[30] Yuchen Xi, Tom Marzin, Richard B Huang, Trevor J. Jones, P. Brun.(2024). Emergent behaviors of buckling-driven elasto-active structures.
[31] Hyungsoo Kim, J. Heo, Ingyu Choi, Sung-hoon Ahn, W. Chu.(2021). Shape memory alloy-driven undulatory locomotion of a soft biomimetic ray robot.
[32] Fujun Wang, Hao Zhang, Cunman Liang.(2025). Recent progress and perspective of magnetic miniature soft robot with multimodal locomotion.
[33] Jinrong Wang, Ruixuan Li, Yaoyuan Xu, Shishi Li, Xianghe Meng, Hui Xie.(2024). Magnetic-Field-Assisted LCD Stereolithography for Centipede-Inspired Magnetic Soft Robot.
[34] Burcu Seyidoğlu, Aida Parvaresh, Bahman Taherkhani, Ahmad Rafsanjani.(2025). Inflatable Kirigami Crawlers.
[35] W. Yu, Xin Li, Dunyu Chen, Jingyi Liu, Jiaji Su, Ju Liu, Changyong Cao, Hongyan Yuan.(2022). A minimally designed soft crawling robot for robust locomotion in unstructured pipes.
[36] Fei Pan, Jiaqi Liu, Zonghao Zuo, Xia He, Zhuyin Shao, Junyu Chen, Haoxuan Wang, Qiyi Zhang, Feiyang Yuan, Bohan Chen, Tongtong Jin, Liwen He, Yun Wang, Kangle Zhang, Xilun Ding, Tiefeng Li, Li Wen.(2025). Miniature deep-sea morphable robot with multimodal locomotion..
[37] Yujia Li, Yu Xia, Tao Ren, Zheyi Jin, Weiye Zhuang, Xiao Huang, Weisong Yu.(2025). A soft pipeline robot inspired by inchworm locomotion with layer-interference variable stiffness.
[38] David A. Haggerty, M. Banks, E. Kamenar, Alan B. Cao, Patrick C. Curtis, I. Mezić, E. Hawkes.(2023). Control of soft robots with inertial dynamics.
[39] Cecilia Laschi.(2023). Modeling embodied intelligence: can we capture its essence by modeling internal and external interactions?.
[40] Yuning Zhang, Aditya Deshmukh, Kon-Well Wang.(2023). Embodying Multifunctional Mechano‐Intelligence in and Through Phononic Metastructures Harnessing Physical Reservoir Computing.
[41] Ryo Terajima, Katsuma Inoue, Kohei Nakajima, Yasuo Kuniyoshi.(2025). Multifunctional physical reservoir computing in soft tensegrity robots.
[42] Liang He, P. Maiolino.(2023). Embodied Active Tactile Perception.
[43] Seunghoon Yoo, Sohyun Kim, Joohyeon Kang, Hyunjun Park, Seokjun Lee, Youngsu Cha.(2025). Foldable Soft Leg-Assisted Wheel Robot..
[44] Bruce Bridgeman, Philip Tseng.(2011). Embodied cognition and the perception-action link..
[45] Xinjie Wang, Liu Liu, Yu Cao, Ruiqi Wu, Wenkang Qin, Dehui Wang, Wei Sui, Zhizhong Su.(2025). EmbodiedGen: Towards a Generative 3D World Engine for Embodied Intelligence.
[46] Yu Shang, Xin Zhang, Yinzhou Tang, Lei Jin, Chen Gao, Wei Wu, Yong Li.(2025). RoboScape: Physics-informed Embodied World Model.
[47] Hanwen Wan, Jiu Cheng, Yixuan Deng, Donghao Wu, Yifei Chen, Zexin Lin, Jialu Liu, Jiangfan Yu, Xiaoqiang Ji.(2025). Towards Physics Aware Embodied Control with Graph based Object-centric Learning.
[48] Zijie Zheng, Zeshun Li, Yunpeng Wang, Qinghongbing Xie, Long Zeng.(2025). Demonstrating DVS: Dynamic Virtual-Real Simulation Platform for Mobile Robotic Tasks.
[49] Mathias Casiulis, D. Levine.(2022). Emergent synchronization and flocking in purely repulsive self-navigating particles..
[50] Sanjay Sarma O V, Sruthi Palaparthi, R. Pidaparti.(2019). Mimicking Sub-Structures Self-Organization in Microtubules.
[51] Gourab Kumar Sar, Kevin O'Keeffe, Joao U. F. Lizarraga, Marcus A. M. de Aguiar, Christian Bettstetter, Dibakar Ghosh.(2025). Interplay of sync and swarm: Theory and application of swarmalators.
[52] H. Hong, M. Y. Choi, Beom Jun Kim.(2001). Synchronization on small-world networks.
[53] Frank Bauer, Fatihcan M. Atay, Juergen Jost.(2009). Synchronization in discrete-time networks with general pairwise coupling.
[54] Jules Mercadier, Stefan Bittner, Marc Sciamanna.(2025). Synchronization of lasers with complex spatio-temporal dynamics.
[55] Wei Zhou, Zhuonan Hao, Nick Gravish.(2020). Collective synchronization of undulatory movement through contact.
[56] Yuan Shen, I. Dierking.(2022). Electrically tunable collective motion of dissipative solitons in chiral nematic films.
[57] Milad Taghavi, Wei Wang, Kyubum Shim, Jinsong Zhang, Itai Cohen, Alyssa B Apsel.(2024). Coordinated behavior of autonomous microscopic machines through local electronic pulse coupling.
[58] Mehdi Bakhshipoor, Yousef Azizi, Seyed Ehsan Nedaaee Oskoee.(2025). A Reliable Self-Organized Distributed Complex Network for Communication of Smart Agents.
[59] Anirban Kundu, Chunlin Ji.(2012). Swarm Behavior of Intelligent Cloud.
[60] K. Peters, Anders Johansson, A. Dussutour, D. Helbing.(2006). Analytical and Numerical Investigation of Ant Behavior under Crowded Conditions.
[61] Liying Xu, Jiadi Zhu, Bing Chen, Zhen Yang, Keqin Liu, Bingjie Dang, Teng Zhang, Yuchao Yang, Ru Huang.(2022). A distributed nanocluster based multi-agent evolutionary network..
[62] Trenton Gerew, Ming Zhong.(2023). Concurrent Emergence of Clustering, Flocking and Synchronization in Systems of Interacting Agents.
[63] Nikita Kruk, Yuri Maistrenko, Heinz Koeppl.(2015). Self-propelled chimeras.
[64] J. Monaco, Grace M. Hwang, Kevin M. Schultz, Kechen Zhang.(2019). Cognitive swarming in complex environments with attractor dynamics and oscillatory computing.
[65] Qin Yang.(2021). Self-Adaptive Swarm System (SASS).
[66] Lijun Sun, Yu-Cheng Chang, Chao Lyu, Ye Shi, Yuhui Shi, Chin-Teng Lin.(2022). Toward multi-target self-organizing pursuit in a partially observable Markov game.
[67] Zibin Liang, Qing Li, Guodong Fu.(2023). Multi-UAV Collaborative Search and Attack Mission Decision-Making in Unknown Environments..
[68] M. B. Zion, Jeremy Fersula, Nicolas Bredèche, O. Dauchot.(2021). Morphological computation and decentralized learning in a swarm of sterically interacting robots.
[69] Karl J Friston, Thomas Parr, Conor Heins, Axel Constant, Daniel Friedman, Takuya Isomura, Chris Fields, Tim Verbelen, Maxwell Ramstead, John Clippinger, Christopher D Frith.(2024). Federated inference and belief sharing..
[70] A. P. Alodjants, D. Tsarev, A. Avdyushina, A. Khrennikov, A. Boukhanovsky.(2024). Quantum-inspired modeling of distributed intelligence systems with artificial intelligent agents self-organization.
[71] Kai Ruan, Mowen Huang, Ji-Rong Wen, Hao Sun.(2025). Benchmarking LLMs' Swarm intelligence.
[72] Laith Abualigah, Deborah Falcone, Agostino Forestiero.(2023). Swarm Intelligence to Face IoT Challenges..
[73] Minh N H Nguyen, Shashi Raj Pandey, Tri Nguyen Dang, Eui-Nam Huh, Nguyen H Tran, Walid Saad, Choong Seon Hong.(2023). Self-Organizing Democratized Learning: Toward Large-Scale Distributed Learning Systems..
[74] Yuxiang Wei, Zhuoqi Zeng, Yue Zhong, Jiawen Kang, Ryan Wen Liu, M. Shamim Hossain.(2025). Bi-LSTM based Multi-Agent DRL with Computation-aware Pruning for Agent Twins Migration in Vehicular Embodied AI Networks.
[75] Nathalia Moraes do Nascimento, Carlos Jose Pereira de Lucena.(2018). Engineering Cooperative Smart Things based on Embodied Cognition.
[76] Ruize Zhang, Sirui Xiang, Zelai Xu, Feng Gao, Shilong Ji, Wenhao Tang, Wenbo Ding, Chao Yu, Yu Wang.(2025). Mastering Multi-Drone Volleyball through Hierarchical Co-Self-Play Reinforcement Learning.
[77] Andy E. Williams.(2025). Intelligence Sequencing and the Path-Dependence of Intelligence Evolution: AGI-First vs. DCI-First as Irreversible Attractors.
[78] Kai Cui, Mengguang Li, Christian Fabian, Heinz Koeppl.(2022). Scalable Task-Driven Robotic Swarm Control via Collision Avoidance and Learning Mean-Field Control.
[79] Suyun Bae, Federico Rossi, Joshua Vander Hook, Scott Davidoff, Kwan-Liu Ma.(2020). A Visual Analytics Approach to Debugging Cooperative, Autonomous Multi-Robot Systems' Worldviews.
[80] Yiran Qin, Li Kang, Xiufeng Song, Zhenfei Yin, Xiaohong Liu, Xihui Liu, Ruimao Zhang, Lei Bai.(2025). RoboFactory: Exploring Embodied Agent Collaboration with Compositional Constraints.
[81] Steven Ceron, Marta An Kimmel, Alexandra Q. Nilles, Kirstin H. Petersen.(2021). Soft Robotic Oscillators With Strain-Based Coordination.
[82] Lakshmanan Shanmugam, Chee Peng Lim, Fathalla A. Rihan, Jürgen Kurths.(2025). Dynamical analysis of nonlinear physical systems: mathematical modelling, artificial intelligence, and applications.
[83] L. Fortuna, M. Frasca, Cristoforo Camerano.(2008). Strange attractors, Kinematic Trajectories and Synchronization.
[84] Shuang Wu, Yaoye Hong, Yao Zhao, Jie Yin, Yong Zhu.(2023). Caterpillar-inspired soft crawling robot with distributed programmable thermal actuation.
[85] Joey Z. Ge, Ariel A. Calderón, Longlong Chang, N. O. Pérez-Arancibia.(2019). An earthworm-inspired friction-controlled soft robot capable of bidirectional locomotion.
[86] Bangyuan Liu, Yasemin Ozkan-Aydin, D. Goldman, Frank L. Hammond.(2019). Kirigami Skin Improves Soft Earthworm Robot Anchoring and Locomotion Under Cohesive Soil.
[87] Pengcheng Li, Baojun Chen, Jianbin Liu.(2023). Multimodal steerable earthworm-inspired soft robot based on vacuum and positive pressure powered pneumatic actuators.
[88] Yuanyuan Yang, Dengfeng Li, Yajing Shen.(2019). Inchworm-Inspired Soft Robot With Light-Actuated Locomotion.
[89] Shishi Li, Ruixuan Li, Jinrong Wang, Xianghe Meng, Hui Xie.(2024). Inchworm-Like Soft Robot with Anisotropic Magnetization for Untethered Crawling and Manipulating.
[90] He Chen, Zhong Chen, Zonglin Liu, Jinhua Xiong, Qian Yan, Teng Fei, Xu Zhao, Fuhua Xue, Haowen Zheng, Huanxin Lian, Yunxiang Chen, Liangliang Xu, Qingyu Peng, Xiao-min He.(2025). From Coils to Crawls: A Snake-Inspired Soft Robot for Multimodal Locomotion and Grasping.
[91] Lan N. Pham, J. Abbott.(2018). A Soft Robot to Navigate the Lumens of the Body Using Undulatory Locomotion Generated by a Rotating Magnetic Dipole Field.
[92] Naris Asawalertsak, Franziska Heims, Alexander Kovalev, Stanislav N Gorb, Jonas Jørgensen, Poramate Manoonpong.(2023). Frictional Anisotropic Locomotion and Adaptive Neural Control for a Soft Crawling Robot..
[93] Fanxing Kong, Yanhe Zhu, Chen Yang, Hongzhe Jin, Jie Zhao, H. Cai.(2021). Integrated Locomotion and Deformation of a Magnetic Soft Robot: Modeling, Control, and Experiments.
[94] Yusuf Dikici, K. Daltorio, O. Akkus.(2024). Nodes for modes: Nodal honeycomb metamaterial enables a soft robot with multimodal locomotion.
[95] Jian Yang, Junyu Zhou, Fan Xu, Hesheng Wang.(2025). Small-Scale Soft Terrestrial Robot with Electrically Driven Multi-Modal Locomotion Capability.
[96] Pengfei Yang, Yuqing Mao, Hong Liu, Luyu Gao, Feng Huang, Fei Dang.(2024). A Rolling Soft Robot Driven by Local Snap-Through Buckling..
[97] John Rieffel, Jean-Baptiste Mouret.(2018). Adaptive and Resilient Soft Tensegrity Robots..
[98] S. Riddle, Clayton Jackson, K. Daltorio, R. D. Quinn.(2025). A 3D model predicts behavior of a soft bodied worm robot performing peristaltic locomotion.
[99] Abhishek Sebastian.(2025). Soft Robotics for Search and Rescue: Advancements, Challenges, and Future Directions.
[100] Andrija Milojevic, Kyrre Glette.(2024). Design and Fabrication of Soft Locomotion Robots based on Spatial Compliant Mechanisms.
[101] Alican Mertan, Nick Cheney.(2024). Towards Multi-Morphology Controllers with Diversity and Knowledge Distillation.
[102] Jinliang Zheng, Jianxiong Li, Dongxiu Liu, Yinan Zheng, Zhihao Wang, Zhonghong Ou, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Xianyuan Zhan.(2025). Universal Actions for Enhanced Embodied Foundation Models.
[103] Zhe Sun, Pengfei Tian, Xiaozhu Hu, Xiaoyu Zhao, Huiying Li, Zhenliang Zhang.(2025). Body Discovery of Embodied AI.
[104] Ciprian Ionut Paduraru, Gheorghe Stefanescu.(2018). Adaptive virtual organisms: A compositional model for complex hardware-software binding.
[105] Jialin Jiang, Lidong Yang, Bo Hao, Tiantian Xu, Xinyu Wu, Li Zhang.(2024). Automated Microrobotic Manipulation Using Reconfigurable Magnetic Microswarms.
[106] S Muiños-Landin, A Fischer, V Holubec, F Cichos.(2021). Reinforcement learning with artificial microswimmers..
[107] Weihua Du, Qiushi Lyu, Jiaming Shan, Zhenting Qi, Hongxin Zhang, Sunli Chen, Andi Peng, Tianmin Shu, Kwonjoon Lee, Behzad Dariush, Chuang Gan.(2024). Constrained Human-AI Cooperation: An Inclusive Embodied Social Intelligence Challenge.
[108] Yuchen Xi, Trevor J. Jones, Richard Huang, Tom Marzin, P. -T. Brun.(2024). Emergent intelligence of buckling-driven elasto-active structures.
[109] S. Katiyar, F. Iida, S. Nurzaman.(2019). Energy Harvesting in Soft Robot Locomotion with Complex Dynamics.
[110] Benedikt Hartl, Michael Levin, Andreas Zöttl.(2024). Neuroevolution of Decentralized Decision-Making in N-Bead Swimmers Leads to Scalable and Robust Collective Locomotion.
[111] Somnath Paramanick, Umashankar Pardhi, Harsh Soni, Nitin Kumar.(2025). Spontaneous Emergence of Run-and-Tumble-Like Dynamics in a Robotic Analog of \textit{Chlamydomonas}: Experiment and Theory.
[112] A. Deblais, K. Prathyusha, R. Sinaasappel, H. Tuazon, Ishant Tiwari, Vishal P. Patil, M. Amsterdam, G. I. O. Technology, Stanford University.(2023). Worm blobs as entangled living polymers: from topological active matter to flexible soft robot collectives.
[113] Luca Manneschi, Ian T Vidamour, Kilian D Stenning, Charles Swindells, Guru Venkat, David Griffin, Lai Gui, Daanish Sonawala, Denis Donskikh, Dana Hariga, Elisa Donati, Susan Stepney, Will R Branford, Jack C Gartside, Thomas J Hayward, Matthew O A Ellis, Eleni Vasilaki.(2025). Noise-aware training of neuromorphic dynamic device networks..
[114] Tongtong Feng, Xin Wang, Yu-Gang Jiang, Wenwu Zhu.(2025). Embodied AI: From LLMs to World Models.
[115] Zishen Wan, Jiayi Qian, Yuhang Du, Jason Jabbour, Yilun Du, Yang Katie Zhao, Arijit Raychowdhury, Tushar Krishna, Vijay Janapa Reddi.(2025). Generative AI in Embodied Systems: System-Level Analysis of Performance, Efficiency and Scalability.
[116] Dinura Dissanayake, Ahmed Heakl, Omkar Thawakar, Noor Ahsan, Ritesh Thawkar, Ketan More, Jean Lahoud, Rao Anwer, Hisham Cholakkal, Ivan Laptev, Fahad Shahbaz Khan, Salman Khan.(2025). How Good are Foundation Models in Step-by-Step Embodied Reasoning?.
[117] Junyang Shu, Zhiwei Lin, Yongtao Wang.(2025). RFTF: Reinforcement Fine-tuning for Embodied Agents with Temporal Feedback.
[118] Xiaowei Chi, Peidong Jia, Chunkai Fan, Xiaozhu Ju, Weishi Mi, Kevin Zhang, Zhiyuan Qin, Wanxin Tian, Kuangzhi Ge, Hao Li, Zezhong Qian, Anthony Chen, Qiang Zhou, Yueru Jia, Jiaming Liu, Yong Dai, Qingpo Wuwu, Chengyu Bai, Yu-Kai Wang, Ying Li, Lizhang Chen, Yong Bao, Zhiyuan Jiang, Jiacheng Zhu, Kai-fa Tang, Ruichuan An, Yu Luo, Qi Feng, Si-yuan Zhou, Chi-min Chan, Chengkai Hou, Weihong Xue, Sirui Han, Yi-Ting Guo, Shanghang Zhang, Jian Tang.(2025). WoW: Towards a World omniscient World model Through Embodied Interaction.
[119] Yining Hong, Rui Sun, Bingxuan Li, Xingcheng Yao, Maxine Wu, Alexander Chien, Da Yin, Ying Nian Wu, Zhecan James Wang, Kai-Wei Chang.(2025). Embodied Web Agents: Bridging Physical-Digital Realms for Integrated Agent Intelligence.
[120] Jiajun Wu.(2024). Physical scene understanding.
[121] C. Gershenson.(2019). Guiding the Self-Organization of Cyber-Physical Systems.
[122] C. Gershenson, F. Heylighen.(2004). Protocol Requirements for Self-organizing Artifacts: Towards an Ambient Intelligence.
[123] Zixing Lei, Sheng Yin, Yichen Xiong, Yuanzhuo Ding, Wenhao Huang, Yuxi Wei, Qingyao Xu, Yiming Li, Weixin Li, Yunhong Wang, Siheng Chen.(2025). EmboMatrix: A Scalable Training-Ground for Embodied Decision-Making.
[124] Luzhe Sun, Jingtian Ji, Xiangshan Tan, Matthew R. Walter.(2025). FlashBack: Consistency Model-Accelerated Shared Autonomy.
[125] Alayt Issak, Jeba Rezwana, Casper Harteveld.(2025). MOSAAIC: Managing Optimization towards Shared Autonomy, Authority, and Initiative in Co-creation.
[126] Amanda Gefter.(2024). Enaction for QBists.
[127] Martin Schmalzried.(2024). A philosophical and ontological perspective on Artificial General Intelligence and the Metaverse.
[128] M. Gerven.(2025). Neuromorphic Intelligence.
[129] Giulia De Togni, Sonja Erikainen, Sarah Chan, Sarah Cunningham-Burley.(2021). What makes AI 'intelligent' and 'caring'? Exploring affect and relationality across three sites of intelligence and care..
[130] Ryo Nakahashi, Seiji Yamada.(2021). Balancing Performance and Human Autonomy with Implicit Guidance Agent.
[131] Adam J. Thorpe.(2023). Refining Human-Centered Autonomy Using Side Information.
[132] Annika Lübbert, Florian Göschl, Hanna Krause, Till R Schneider, Alexander Maye, Andreas K Engel.(2021). Socializing Sensorimotor Contingencies..
[133] Frank Röder, Ozan Özdemir, Phuong D H Nguyen, Stefan Wermter, Manfred Eppe.(2021). The Embodied Crossmodal Self Forms Language and Interaction: A Computational Cognitive Review..
[134] Tim Schürmann, Betty Jo Mohler, Jan Peters, Philipp Beckerle.(2019). How Cognitive Models of Human Body Experience Might Push Robotics..
[135] Mahta Akhyani, Hadi Moradi.(2023). Modular Customizable ROS-Based Framework for Rapid Development of Social Robots.
[136] Daochang Liu, Junyu Zhang, Anh-Dung Dinh, Eunbyung Park, Shichao Zhang, Chang Xu.(2025). Generative Physical AI in Vision: A Survey.
[137] Yao Feng, Hengkai Tan, Xinyi Mao, Chendong Xiang, Guodong Liu, Shuhe Huang, Hang Su, Jun Zhu.(2025). Vidar: Embodied Video Diffusion Model for Generalist Manipulation.
[138] Bo Yue, Sheng Xu, Kui Jia, Guiliang Liu.(2025). Toward Humanoid Brain-Body Co-design: Joint Optimization of Control and Morphology for Fall Recovery.
[139] Jia Liu, Min Chen.(2024). FaGeL: Fabric LLMs Agent empowered Embodied Intelligence Evolution with Autonomous Human-Machine Collaboration.
[140] Yunzhu Li, A. Torralba, Anima Anandkumar, D. Fox, Animesh Garg.(2020). Causal Discovery in Physical Systems from Videos.
[141] David Weinbaum, Viktoras Veitas.(2015). Open Ended Intelligence: The individuation of Intelligent Agents.
[142] Giorgio Volpe, Nuno A M Araújo, Maria Guix, Mark Miodownik, Nicolas Martin, Laura Alvarez, Juliane Simmchen, Roberto Di Leonardo, Nicola Pellicciotta, Quentin Martinet, Jérémie Palacci, Wai Kit Ng, Dhruv Saxena, Riccardo Sapienza, Sara Nadine, João F Mano, Reza Mahdavi, Caroline Beck Adiels, Joe Forth, Christian Santangelo, Stefano Palagi, Ji Min Seok, Victoria A Webster-Wood, Shuhong Wang, Lining Yao, Amirreza Aghakhani, Thomas Barois, Hamid Kellay, Corentin Coulais, Martin van Hecke, Christopher J Pierce, Tianyu Wang, Baxi Chong, Daniel I Goldman, Andreagiovanni Reina, Vito Trianni, Giovanni Volpe, Richard Beckett, Sean P Nair, Rachel Armstrong.(2025). Roadmap for animate matter..
[143] Jiahao Wu, Hengxu You, Jing Du.(2025). AI generations: from AI 1.0 to AI 4.0..