AutoPatent: A Multi-Agent Framework for Automatic Patent Generation

📄 arXiv: 2412.09796v1 📥 PDF

作者: Qiyao Wang, Shiwen Ni, Huaren Liu, Shule Lu, Guhong Chen, Xi Feng, Chi Wei, Qiang Qu, Hamid Alinejad-Rokny, Yuan Lin, Min Yang

分类: cs.CL, cs.AI

发布日期: 2024-12-13

备注: 19 pages, 7 figures

🔗 代码/项目: GITHUB


💡 一句话要点

提出AutoPatent框架以解决自动专利生成问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 自动专利生成 多代理框架 大型语言模型 自然语言处理 知识产权

📋 核心要点

  1. 现有研究主要集中在专利分类和短文本生成,缺乏对完整专利生成的深入探讨。
  2. 本文提出的AutoPatent框架通过多代理协作,利用LLM生成完整的专利文档,解决了专利生成的复杂性问题。
  3. 实验结果显示,AutoPatent在生成质量上超越了多种大型LLM,展现出更强的生成能力。

📝 摘要(中文)

随着大型语言模型(LLMs)能力的不断提升,专利处理领域在自然语言处理社区中受到越来越多的关注。然而,大多数研究集中在分类任务或短文本生成任务上。本文提出了一种新颖的任务Draft2Patent及其基准D2P,挑战LLMs生成平均17K标记的完整专利。专利的专业性和标准化术语使其对LLMs构成重大挑战。我们提出的AutoPatent多代理框架结合了基于LLM的规划代理、撰写代理和审查代理,生成复杂且高质量的专利文档。实验结果表明,AutoPatent框架显著提升了各种LLMs生成全面专利的能力,且基于Qwen2.5-7B模型生成的专利在客观指标和人类评估中优于更大更强的LLMs。

🔬 方法详解

问题定义:本文旨在解决现有专利生成方法在生成完整、复杂专利文档时面临的挑战,尤其是由于专利的专业性和标准化术语导致的困难。

核心思路:通过引入多代理框架,结合规划、撰写和审查功能,AutoPatent能够有效地生成高质量的专利文档,提升生成的准确性和完整性。

技术框架:AutoPatent框架包含三个主要模块:LLM规划代理负责制定生成策略,撰写代理负责具体文本生成,审查代理则对生成结果进行质量评估和优化。

关键创新:AutoPatent的创新在于其多代理协作机制,能够在生成过程中动态调整策略,与传统单一模型生成方法相比,显著提高了生成质量。

关键设计:在设计中,采用了PGTree和RRAG技术来优化生成过程,确保生成的专利文档符合专业标准,并设置了适当的损失函数以提升生成效果。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,基于AutoPatent框架生成的专利在客观指标和人类评估中均优于GPT-4o、Qwen2.5-72B和LLAMA3.1-70B等更强大的LLM,显示出显著的性能提升,尤其是在生成质量和完整性方面。

🎯 应用场景

该研究的潜在应用领域包括法律科技、知识产权管理和自动化文档生成等。通过提高专利生成的效率和质量,AutoPatent能够为企业和法律机构节省时间和成本,推动专利申请流程的自动化和智能化。未来,该技术可能在其他领域的文档生成中也具有广泛的应用前景。

📄 摘要(原文)

As the capabilities of Large Language Models (LLMs) continue to advance, the field of patent processing has garnered increased attention within the natural language processing community. However, the majority of research has been concentrated on classification tasks, such as patent categorization and examination, or on short text generation tasks like patent summarization and patent quizzes. In this paper, we introduce a novel and practical task known as Draft2Patent, along with its corresponding D2P benchmark, which challenges LLMs to generate full-length patents averaging 17K tokens based on initial drafts. Patents present a significant challenge to LLMs due to their specialized nature, standardized terminology, and extensive length. We propose a multi-agent framework called AutoPatent which leverages the LLM-based planner agent, writer agents, and examiner agent with PGTree and RRAG to generate lengthy, intricate, and high-quality complete patent documents. The experimental results demonstrate that our AutoPatent framework significantly enhances the ability to generate comprehensive patents across various LLMs. Furthermore, we have discovered that patents generated solely with the AutoPatent framework based on the Qwen2.5-7B model outperform those produced by larger and more powerful LLMs, such as GPT-4o, Qwen2.5-72B, and LLAMA3.1-70B, in both objective metrics and human evaluations. We will make the data and code available upon acceptance at \url{https://github.com/QiYao-Wang/AutoPatent}.