新闻动态
AIRS共8篇论文将于国际机器人与自动化会议ICRA 2025发表
5月19-23日,国际机器人与自动化会议(International Conference on Robotics and Automation, ICRA 2025)将于美国亚特兰大举行,AIRS共8篇文章将于本届ICRA发表,并有5项科学+艺术联合实验室出品的机器人艺术作品入选ICRA Arts in Robotics展览。
ICRA是机器人领域最具影响力和权威性的国际学术会议之一,是机器人领域规模(千人以上)和影响力都排名第一的顶级国际会议。ICRA由IEEE机器人与自动化学会(IEEE Robotics and Automation Society, RAS)主办,每年举办一次,汇集了全球顶尖的机器人研究者、工程师和产业界人士,展示和讨论机器人技术、自动化系统及相关领域的最新研究成果和技术进展。ICRA 2025共收到4153篇投稿,接收率约为39%。
KARMA: Augmenting Embodied AI Agents with Long-and-short Term Memory Systems
论文介绍
负责执行相互关联、长序列家庭任务的具身智能体,常面临上下文记忆不足的问题,这导致任务执行效率降低并产生错误。为了解决这一难题,我们提出了一种创新的记忆系统 KARMA。该系统整合了长期和短期记忆模块,通过记忆增强的提示方式,提升大型语言模型(LLMs)在具身智能体规划方面的能力。
KARMA 区分长期记忆和短期记忆:长期记忆负责捕获环境的全面 3D 场景图作为其表征;而短期记忆则动态记录物体位置和状态的变化。这种双重记忆结构使得智能体能够检索相关的历史场景经验,从而提高任务规划的准确性和效率。短期记忆采用有效的自适应记忆替换策略,确保关键信息得以保留,同时淘汰不那么重要的数据。
实验结果表明,与配备最先进记忆的具身智能体相比,我们的记忆增强具身智能体在 AI2-THOR 模拟器的复合任务和复杂任务中的成功率分别提升了 1.3 倍和 2.3 倍,任务执行效率也分别提高了 3.4 倍和 62.7 倍。此外,我们还验证了 KARMA 的即插即用特性,使其能够无缝部署到现实世界的机器人系统上,例如移动操作平台。
借助这种即插即用的记忆系统,KARMA 显著增强了具身智能体生成连贯且符合上下文语境的规划的能力,从而更高效地执行复杂的家庭任务。

图1:KARMA的系统架构

图2:环境信息转化为拓补图和提示词
论文作者
本文的作者来自中科院计算所和深圳市人工智能与机器人研究院(AIRS)。通讯作者为中科院计算所助理研究员甘一鸣与AIRS研究员俞波。
Underwater Motions Analysis and Control of a Coupling-Tiltable Unmanned Aerial-Aquatic Vehicle
论文介绍
耦合变构型无人空海跨域航行器(UAAV)在工业界的应用重要性日益凸显,但目前仍缺乏系统性分析及适配的控制策略。本文针对自主研发的名为"Mirs-Alioth"的UAAV开展了水下运动特性分析并设计了相应控制器,通过实验验证了控制器的有效性。首先推导了Mirs-Alioth的奇异推力倾斜角(STTA)表征模型,该模型为分析其水下运动特性提供了理论工具。基于该模型的分析揭示了控制器设计需关注的若干关键要素:需要采用逻辑切换机制;在辅助通道引入Nussbaum函数以补偿控制方向的不确定性;通过辅助控制器消减耦合效应。基于上述要点,设计了一种包含推力倾斜角奇异值调节控制器、融合饱和Nussbaum函数的辅助控制器以及逻辑切换模块的复合控制方案。最终通过两组对比实验,既验证了控制器的有效性,也论证了Nussbaum函数引入的必要性。

论文作者
第一作者:黄东岳,深圳市人工智能与机器人研究院(AIRS)机器人系统中心助理研究员,2024年获香港中文大学机械与自动化系博士学位,研究兴趣包括变构型特种无人机的控制与规划。
通讯作者:张建国,博士,副研究员,担任深圳市人工智能与机器人研究院机器人系统中心主任,香港中文大学(深圳)客座研究员,为深圳市高层次人才(C类);主要研究方向为控制系统与AI算法开发,具身智能数据标准化采集,发表了10余篇机电方向期刊会议文章,在人机交互领域、机器人控制算法等具备10余项专利,电力EPTC协会专家委员,《公路与技术》期刊青年编委,长期致力于具身智能机器人技术的产业化应用,擅长机器人智能控制及具身智能数据标准化采集,关注具身智能机器人的落地应用场景,与广东电网、中集能源等企业建立了密切的合作。
Topology-based Visual Active Room Segmentation
论文介绍
房间分割任务能够通过将格点地图(occupancy grid map)分割为语义上有意义的区域从而对机器人下游任务进行引导。先前工作在对地图进行分割时需要预先构建好的场景地图或者人工控制机器人进行地图构建,并且普遍缺乏对RGB模态的利用,导致机器人无法自主地在杂乱的环境中得到准确的房间分割结果。本文提出了一种基于拓扑的主动式房间分割框架,与传统方法相比,该框架具有两个显著优势:首先,它充分利用视觉语义特征(尤其是门)来提高在杂乱环境下的分割准确性;其次,它将分割结果表征为拓扑地图从而使机器人能够利用房间之间的连接关系进行自主探索。该框架主要包含三个关键模块:(1)门提取模块:通过结合几何特征和深度学习的视觉检测方法,能够准确识别杂乱环境中的门位置;(2)房间内探索模块:通过限制对广度优先前沿(frontier)探测算法的探索区域,确保机器人能够完整地探索当前房间的所有区域;(3)拓扑地图构建模块:将分割结果以拓扑图的形式表示,有效建模房间之间的连接关系,从而辅助机器人的探索决策。在Gibson数据集中,本文方法展现了在杂乱环境中优秀的房间分割能力以及良好的探索效率。

论文作者
共同第一作者:
鲍晨毓,香港中文大学(深圳)理工学院计算机与信息工程专业硕士毕业生,导师为林天麟教授。研究兴趣为深度学习,基础模型在机器人领域应用,机器人场景理解。曾在TPAMI,RAL,Advanced Engineering Informatics发表文章。
胡君杰博士,深圳市人工智能与机器人研究院助理研究员。
第三作者:郑湫,香港中文大学(深圳)理工学院计算机与信息工程专业在读硕士生。
通讯作者:林天麟,香港中文大学(深圳)理工学院助理教授,机器人与智能制造国家地方联合工程实验室常务副主任、深圳市人工智能与机器人研究院项目负责人。长期从事模块化机器人、多机器人系统及特种机器人研究,在Nature Communications、IJRR、TRO、TPAMI等期刊会议发表论文100余篇,获熊有伦智湖优秀青年学者奖、TMECH年度最佳论文奖、IROS机器人机构设计最佳论文奖等荣誉,并担任TASE、JFR、《机器人》等期刊副编辑。
Transferring Visual Knowledge: Semi-Supervised Instance Segmentation for Object Navigation Across Varying Height Viewpoints
论文介绍
机器人目标物体导航任务作为具身智能领域的一个重要研究方向而受到广泛关注。然而,现有的模块化导航方法通常在固定相机高度视角数据集下训练实例分割模型,导致部署在不同高度视角时泛化性能下降。传统解决方案需要收集新的高度视角数据集并重新标注,成本高且效率低,严重制约了异构机器人平台的实际部署。为解决这一问题,我们提出了一种半监督知识迁移方法,方法包括:(1)利用投影策略预训练;(2)动态权重策略;(3)原型对比迁移训练策略。此外,我们还提供了一个包含10个不同高度视角的实例分割数据集。实验结果表明,我们提出的半监督知识迁移方法,相较于当前最先进的实例分割模型的半监督方法,在不同高度视角的知识迁移性能上有更优的效果。

论文作者
第一作者:郑湫,香港中文大学(深圳)理工学院计算机与信息工程专业在读硕士生。
其他参与作者:深圳市人工智能与机器人研究院助理研究员胡君杰、计算机与信息工程专业硕士刘宇明、百度公司的曾增烽、深圳市人工智能与机器人研究院研究员王凡。
通讯作者:林天麟,港中大(深圳)理工学院助理教授,机器人与智能制造国家地方联合工程实验室常务副主任、深圳市人工智能与机器人研究院项目负责人。
Configuration-Adaptive Visual Relative Localization for Spherical Modular Self-Reconfigurable Robots
论文介绍
本文提出了一种适用于球形模块化自重构机器人(SMSR)的配置自适应视觉相对定位方法,解决了现有方法在动态配置下精度不足的难题。SMSR的模块化特性使其能通过实时重构适应多样化任务,但模块间相对位姿的精确估计是实现协作的关键挑战。现有方法因低精度或依赖固定形状机器人视觉特征而受限,本文首次提出结合视觉检测、跟踪与优化的解决方案。该方法将机器人模块的视觉目标检测与追踪结果与里程计及机器人构型信息融合,构建非凸优化问题,并采用半定松弛方法转化为凸优化问题,实现高效求解。实验表明,该方法在真实场景中相对位置误差仅为2%,方向误差为6.64°,显著优于基于AprilTag和基于方位的基线方法。此外,在实时重构实验中,多模块信息融合有效应对了遮挡与配置变化,表明此方法可以适用于在SMSR实时重构场景下的定位问题。

论文作者
第一作者:刘宇明,香港中文大学(深圳)理工学院计算机与信息工程专业在读硕士生。
其他参与作者:深圳市人工智能与机器人研究院副研究员高源,香港中文大学(深圳)理工学院计算机与信息工程专业在读硕士生郑湫、在读博士生涂宇啸、博士毕业生梁冠琪。
通讯作者:林天麟,港中大(深圳)理工学院助理教授,机器人与智能制造国家地方联合工程实验室常务副主任、深圳市人工智能与机器人研究院项目负责人。
Enhancing Connection Strength in Freeform Modular Reconfigurable Robots through Holey Sphere and Gripper Mechanisms
论文介绍
自由形式的模块化自重构机器人(MSRR)克服了传统的对接限制,实现了模块之间在任何方向上的快速连续连接。自由形式MSRR技术的最新进展显著增强了连接性和移动性。然而,现有设计中连接器强度和操作效率限制了连接性能。本文提出了一种刚性自由连接器和磁履带设计,以提高SnailBot的连接和运动性能。夹爪和均匀分布孔的球壳组成的自由连接器允许机器人在任何位置和方向实现坚固的模块间连接。这些设计的有效性已通过一系列实验和分析得到验证,表明SnailBot双模连接器系统的连接和运动性能得到了改善,并扩展了其潜在的应用和功能。

论文作者
第一作者:王霈绮,香港中文大学(深圳)理工学院计算机与信息工程专业在读硕士生,研究方向为模块化自重构机器人。
其他参与作者:香港中文大学(深圳)理工学院计算机与信息工程博士毕业生梁冠琪。
通讯作者:林天麟,港中大(深圳)理工学院助理教授,机器人与智能制造国家地方联合工程实验室常务副主任、深圳市人工智能与机器人研究院项目负责人。
High-force electroadhesion based on unique liquid-solid dielectrics for UAV perching
论文介绍
静电吸附(EA)作为一种静电驱动的可控吸附技术,具有低噪声、强适应性和高能效等独特优势。然而,其吸附压强仍然较低(0.1~10kPa),这可能会显著限制其应用。本文提出了一种创新的静电吸附垫,嵌入了液体和固体电介质。实验表明,与传统的固体电吸附垫(SEAP)相比,这种液固电吸附垫(LSEAP)能够产生更大的吸附压力。一方面,LSEAP可以增加与基底的介电接触;另一方面,执行器可以提高其介电强度。我们还探索了该吸附垫在商用无人机(UAV)栖息中的应用,以促进无人机的可持续飞行。值得注意的是,无束缚的LSEAP系统,其吸附面积仅为4cm²,自重仅为8.7g,能够支持249.7g的无人机在各种表面上实现稳定吸附。我们的LSEAP产生的吸附压力可达32.2kPa,显著高于文献中报道的值。无人机与LSEAP系统的重量比为14.6,是之前研究的两倍以上。该EA系统的集成显著延长了无人机的运行时间,使其适用于可持续的监视和侦察任务。LSEAP也标志着基于静电吸附的应用(如抓取器和爬墙机器人)迈出了关键一步。
论文作者
论文由香港中文大学(深圳)、AIRS朱建教授团队与南方科技大学王宏强教授合作完成。
第一作者:罗俊杰,香港中文大学(深圳)理工学院计算机与信息工程硕士毕业生。
通讯作者:朱建,香港中文大学(深圳)理工学院副教授,深圳市人工智能与机器人研究院研究员。在此之前,他在新加坡国立大学任职助理教授。朱建博士于2008年在加拿大阿尔伯塔大学获得博士学位,并获得了加拿大NSERC(Natural Science and Engineering Research Council of Canada)博士后奖学金。朱建博士随后在哈佛大学从事博士后,研究方向是人工肌肉的力学分析。朱建博士是IEEE Robotics and Automation Letters的副编辑(Associate Editor),IEEE Transactions on Industrial Electronics的客座编辑(Guest Editor),SPIE EAPAD(Electroactive Polymer Actuators and Devices)Conference大会委员会委员。他的研究兴趣在于软体智能机器人、仿生机器人及智能材料和结构。朱建博士2021年入选“全球前2%顶尖科学家榜单”-“年度科学影响力排行榜”,2022年入选 “全球前2%顶尖科学家榜单”-“年度科学影响力排行榜”和“终身科学影响力排行榜”。朱建博士关于软体驱动器的工作被评为《中国科学:技术科学》2021高影响力论文。
Confidence-Aware Object Capture for a Manipulator Subject to Floating-Base Disturbances
(该论文被机器人学领域顶刊IEEE Transactions on Robotics接收,并将于ICRA 2025发表。)
论文介绍
在水面无人艇(USV)上捕捉静止的空中物体面临巨大挑战,主要原因是波浪引起的干扰会导致准周期性和快速的浮动基座运动。这些干扰的随机性使得我们难以维持高精度的运动预测,同时由于驱动力有限,实时跟踪并捕捉物体也变得十分困难。为此,我们在预测捕捉中引入了置信度分析。针对预测不准确的问题,我们计算了一个实时置信度通道,用于评估预测质量。为了克服难以跟踪目标的问题,我们基于预测信息规划轨迹,在未来某一时刻捕捉物体,同时最大化捕捉位置在预测轨迹上的置信度。所有计算均在0.2秒内完成,确保系统能够及时响应。我们通过实验验证了该方法,实验中利用伺服平台模拟真实的USV运动来生成干扰。实验结果表明,我们的方法成功率达到80%。

图1 论文中需要解决的问题和等效方法
论文作者
第一作者:许若愚,香港中文大学(深圳)理工学院计算机与信息工程专业博士毕业生。现为香港中文大学多尺度医疗机器人中心博士后研究员,主要研究方向为机器人系统的设计、动力学及运动控制。
其他参与作者:
蒋子星,香港中文大学(深圳)理工学院电子信息工程专业(现更名为电子与计算机工程专业)本科毕业生。现于香港中文大学攻读外科医学硕士学位,主要研究方向为医疗机器人及图像引导机器人介入治疗。
刘蓓蓓,香港中文大学(深圳)理工学院数学与应用数学专业本科毕业生。现于波士顿大学攻读系统工程专业博士学位,主要研究方向为控制理论与软体机器人。
王玉全,荷兰马斯特里赫特大学助理教授,其主要研究方向包括基于优化的控制、碰撞感知运动生成以及足式机器人。
通讯作者:钱辉环,现任香港中文大学(深圳)理工学院副教授,曾任深圳市人工智能与机器人研究院副院长。2004年于中国科学技术大学自动化系获学士学位,2010年于香港中文大学机械与自动化工程系获博士学位。其主要研究方向为机器人技术与智能系统,特别是在海洋环境中的应用。
(内容由研究团队提供)