When Search Becomes Memory: Turning Robot Design Trials into Transferable Skills
作者: Yunfei Wang, Xiaohao Xu, Yang Li, Xiaonan Huang
分类: cs.RO, cs.AI, cs.CL, cs.CV
发布日期: 2026-05-25
备注: 20 pages, 8 figures
💡 一句话要点
Auto-Robotist:将机器人设计经验转化为可迁移技能,提升进化搜索效率
🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 进化机器人设计 大型语言模型 技能迁移 自然语言处理 机器人学习
📋 核心要点
- 现有进化机器人设计方法缺乏记忆机制,无法有效利用历史设计经验。
- Auto-Robotist通过构建自然语言技能库,显式存储和检索设计知识,指导LLM进行机器人形态编辑。
- 实验表明,Auto-Robotist在EvoGym任务中显著提升了冷启动搜索效率,并成功迁移到更大设计空间。
📝 摘要(中文)
大型语言模型(LLMs)越来越多地被用作进化机器人设计的提议生成器,但大多数循环仍然是无记忆的:模拟器结果塑造了下一代种群,但没有作为可重用的设计知识保存下来。我们提出了Auto-Robotist,一个自我进化的LLM代理,它将形态搜索轨迹提炼成一个显式的自然语言技能库。每个技能存储一个结构原型、基于证据的正负规则以及支持它们的评估设计,使设计记忆可检查,而不是隐式地存在于种群中。在搜索过程中,该代理检索技能以调节LLM对精英个体的编辑,同时保留遗传算法(GA)的变异路径以进行探索;评估后,它通过添加、诊断和合并来更新库。在跨越 locomotion、traversal 和 object interaction 的七个 EvoGym 任务中,Auto-Robotist 改进了冷启动的 5x5 搜索,并将学习到的技能转移到 10x10 设计空间,其中参考条件下的转移在每个任务上都优于 GA。这些结果表明,LLM 代理可以将昂贵的物理评估转化为可重用的、可审计的设计原则。我们的代码将在接受后发布。
🔬 方法详解
问题定义:现有进化机器人设计方法,特别是基于LLM的方法,通常是“无记忆”的。每次进化迭代都从头开始,无法有效利用之前的设计经验和评估结果。这导致了搜索效率低下,尤其是在复杂任务和大型设计空间中。痛点在于无法将昂贵的模拟评估转化为可重用的设计知识。
核心思路:Auto-Robotist的核心思路是将机器人设计过程中的经验提炼成可重用的“技能”,并以自然语言的形式显式存储。这些技能包含了结构原型、设计规则(正例和反例)以及支持这些规则的评估结果。通过检索和应用这些技能,LLM可以更有效地生成新的机器人设计,从而加速进化过程。
技术框架:Auto-Robotist包含以下主要模块:1) 技能库:存储自然语言形式的机器人设计技能。2) LLM代理:负责生成和编辑机器人形态,并与技能库交互。3) 遗传算法(GA):提供变异路径,保证探索能力。4) 评估模块:评估机器人设计的性能。5) 技能更新模块:负责添加、诊断和合并技能,维护技能库的质量。
关键创新:最重要的创新在于将进化机器人设计过程中的经验显式化,并以自然语言的形式存储为可重用的技能。这使得LLM能够利用历史设计知识,避免重复探索,从而显著提升搜索效率。与传统的遗传算法相比,Auto-Robotist能够将昂贵的物理评估转化为可审计的设计原则。
关键设计:技能库中的每个技能都包含以下信息:结构原型(structural archetype)、正例规则(positive rules)、反例规则(negative rules)以及支持这些规则的评估设计。LLM代理在生成新设计时,会首先检索相关的技能,并根据这些技能的指导进行编辑。技能更新模块使用Add、Diagnose和Merge三种操作来维护技能库的质量。具体参数设置和网络结构在论文中未详细说明,属于未知内容。
📊 实验亮点
Auto-Robotist在七个EvoGym任务中取得了显著的性能提升。在冷启动的5x5搜索中,Auto-Robotist的效率提高了5倍。在10x10的设计空间中,参考条件下的技能迁移在每个任务上都优于传统的遗传算法。这些结果表明,Auto-Robotist能够有效地将设计经验转化为可迁移的技能,并显著提升进化机器人设计的效率。
🎯 应用场景
Auto-Robotist具有广泛的应用前景,可用于自动化机器人设计、定制化机器人开发、以及机器人教育等领域。通过将设计经验转化为可重用的技能,可以降低机器人设计的门槛,加速机器人创新,并为特定应用场景定制高性能机器人。
📄 摘要(原文)
Large language models (LLMs) are increasingly used as proposal generators for evolutionary robot design, yet most loops remain memoryless: simulator results shape the next population but are not preserved as reusable design knowledge. We present Auto-Robotist, a self-evolving LLM agent that distills morphology-search traces into an explicit natural-language skill library. Each skill stores a structural archetype, evidence-grounded positive and negative rules, and the evaluated designs that support them, making design memory inspectable rather than implicit in a population. During search, the agent retrieves skills to condition LLM edits of elite bodies while retaining a Genetic Algorithm (GA) mutation path for exploration; after evaluation, it updates the library through Add, Diagnose, and Merge. Across seven EvoGym tasks spanning locomotion, traversal, and object interaction, Auto-Robotist improves cold-start 5x5 search and transfers learned skills to 10x10 design spaces, where reference-conditioned transfer outperforms GA on every task. These results suggest that LLM agents can convert expensive physical evaluations into reusable, auditable design principles. Our code will be released upon acceptance.