When Search Becomes Memory: Turning Robot Design Trials into Transferable Skills

作者: Yunfei Wang, Xiaohao Xu, Yang Li, Xiaonan Huang

分类: cs.RO, cs.AI, cs.CL, cs.CV

发布日期: 2026-05-25

备注: 20 pages, 8 figures

💡 一句话要点

Auto-Robotist：将机器人设计经验转化为可迁移技能，提升进化搜索效率

🎯 匹配领域: 支柱一：机器人控制 (Robot Control) 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 进化机器人设计 大型语言模型 技能迁移 自然语言处理 机器人学习

📋 核心要点

现有进化机器人设计方法缺乏记忆机制，无法有效利用历史设计经验。
Auto-Robotist通过构建自然语言技能库，显式存储和检索设计知识，指导LLM进行机器人形态编辑。
实验表明，Auto-Robotist在EvoGym任务中显著提升了冷启动搜索效率，并成功迁移到更大设计空间。

📝 摘要（中文）

大型语言模型（LLMs）越来越多地被用作进化机器人设计的提议生成器，但大多数循环仍然是无记忆的：模拟器结果塑造了下一代种群，但没有作为可重用的设计知识保存下来。我们提出了Auto-Robotist，一个自我进化的LLM代理，它将形态搜索轨迹提炼成一个显式的自然语言技能库。每个技能存储一个结构原型、基于证据的正负规则以及支持它们的评估设计，使设计记忆可检查，而不是隐式地存在于种群中。在搜索过程中，该代理检索技能以调节LLM对精英个体的编辑，同时保留遗传算法（GA）的变异路径以进行探索；评估后，它通过添加、诊断和合并来更新库。在跨越 locomotion、traversal 和 object interaction 的七个 EvoGym 任务中，Auto-Robotist 改进了冷启动的 5x5 搜索，并将学习到的技能转移到 10x10 设计空间，其中参考条件下的转移在每个任务上都优于 GA。这些结果表明，LLM 代理可以将昂贵的物理评估转化为可重用的、可审计的设计原则。我们的代码将在接受后发布。

🔬 方法详解

问题定义：现有进化机器人设计方法，特别是基于LLM的方法，通常是“无记忆”的。每次进化迭代都从头开始，无法有效利用之前的设计经验和评估结果。这导致了搜索效率低下，尤其是在复杂任务和大型设计空间中。痛点在于无法将昂贵的模拟评估转化为可重用的设计知识。

核心思路：Auto-Robotist的核心思路是将机器人设计过程中的经验提炼成可重用的“技能”，并以自然语言的形式显式存储。这些技能包含了结构原型、设计规则（正例和反例）以及支持这些规则的评估结果。通过检索和应用这些技能，LLM可以更有效地生成新的机器人设计，从而加速进化过程。

技术框架：Auto-Robotist包含以下主要模块：1) 技能库：存储自然语言形式的机器人设计技能。2) LLM代理：负责生成和编辑机器人形态，并与技能库交互。3) 遗传算法（GA）：提供变异路径，保证探索能力。4) 评估模块：评估机器人设计的性能。5) 技能更新模块：负责添加、诊断和合并技能，维护技能库的质量。

关键创新：最重要的创新在于将进化机器人设计过程中的经验显式化，并以自然语言的形式存储为可重用的技能。这使得LLM能够利用历史设计知识，避免重复探索，从而显著提升搜索效率。与传统的遗传算法相比，Auto-Robotist能够将昂贵的物理评估转化为可审计的设计原则。

关键设计：技能库中的每个技能都包含以下信息：结构原型（structural archetype）、正例规则（positive rules）、反例规则（negative rules）以及支持这些规则的评估设计。LLM代理在生成新设计时，会首先检索相关的技能，并根据这些技能的指导进行编辑。技能更新模块使用Add、Diagnose和Merge三种操作来维护技能库的质量。具体参数设置和网络结构在论文中未详细说明，属于未知内容。

📊 实验亮点

Auto-Robotist在七个EvoGym任务中取得了显著的性能提升。在冷启动的5x5搜索中，Auto-Robotist的效率提高了5倍。在10x10的设计空间中，参考条件下的技能迁移在每个任务上都优于传统的遗传算法。这些结果表明，Auto-Robotist能够有效地将设计经验转化为可迁移的技能，并显著提升进化机器人设计的效率。

🎯 应用场景

Auto-Robotist具有广泛的应用前景，可用于自动化机器人设计、定制化机器人开发、以及机器人教育等领域。通过将设计经验转化为可重用的技能，可以降低机器人设计的门槛，加速机器人创新，并为特定应用场景定制高性能机器人。

📄 摘要（原文）

Large language models (LLMs) are increasingly used as proposal generators for evolutionary robot design, yet most loops remain memoryless: simulator results shape the next population but are not preserved as reusable design knowledge. We present Auto-Robotist, a self-evolving LLM agent that distills morphology-search traces into an explicit natural-language skill library. Each skill stores a structural archetype, evidence-grounded positive and negative rules, and the evaluated designs that support them, making design memory inspectable rather than implicit in a population. During search, the agent retrieves skills to condition LLM edits of elite bodies while retaining a Genetic Algorithm (GA) mutation path for exploration; after evaluation, it updates the library through Add, Diagnose, and Merge. Across seven EvoGym tasks spanning locomotion, traversal, and object interaction, Auto-Robotist improves cold-start 5x5 search and transfers learned skills to 10x10 design spaces, where reference-conditioned transfer outperforms GA on every task. These results suggest that LLM agents can convert expensive physical evaluations into reusable, auditable design principles. Our code will be released upon acceptance.

When Search Becomes Memory: Turning Robot Design Trials into Transferable Skills

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理