NeoAMT: Neologism-Aware Agentic Machine Translation with Reinforcement Learning
作者: Zhongtao Miao, Kaiyan Zhao, Masaaki Nagata, Yoshimasa Tsuruoka
分类: cs.CL, cs.AI
发布日期: 2026-01-07
💡 一句话要点
提出NeoAMT:一种基于强化学习和Wiktionary的感知新词的Agentic机器翻译框架
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 机器翻译 新词翻译 强化学习 Agentic框架 Wiktionary 外部知识 自然语言处理
📋 核心要点
- 现有机器翻译方法在新词翻译方面表现不足,缺乏有效利用外部知识的能力。
- NeoAMT框架利用Wiktionary作为外部知识源,通过强化学习训练翻译Agent,提升新词翻译质量。
- 论文构建了大规模新词翻译数据集和搜索工具,并设计了新的奖励机制和自适应rollout策略。
📝 摘要(中文)
本文提出了一种agentic框架NeoAMT,用于感知新词的机器翻译,该框架利用Wiktionary搜索工具。与通用机器翻译(MT)相比,感知新词的机器翻译领域仍有待探索。具体来说,我们首先创建了一个新的感知新词的机器翻译数据集,并开发了一个基于Wiktionary的搜索工具。新数据集涵盖16种语言和75个翻译方向,来源于约1000万条英文Wiktionary转储记录。搜索工具的检索语料库也由约300万条清理后的Wiktionary转储记录构建。然后,我们使用它来训练具有强化学习(RL)的翻译agent,并评估感知新词的机器翻译的准确性。在此基础上,我们还提出了一个RL训练框架,该框架包含一种新颖的奖励设计和一种自适应的rollout生成方法,通过利用“翻译难度”来进一步提高使用我们的搜索工具的翻译agent的翻译质量。
🔬 方法详解
问题定义:论文旨在解决机器翻译中新词翻译的难题。现有方法通常难以准确翻译新出现的词汇,因为这些词汇不在模型的训练语料库中,导致翻译质量下降。现有的机器翻译模型缺乏有效利用外部知识来辅助新词翻译的能力。
核心思路:论文的核心思路是利用Wiktionary等外部知识库,通过强化学习训练一个翻译Agent,使其能够根据上下文和外部知识,更准确地翻译新词。通过Agent与环境的交互,学习如何有效地利用外部知识来提升翻译质量。
技术框架:NeoAMT框架包含以下主要模块:1) 新词翻译数据集构建模块,用于构建包含新词的翻译数据集;2) Wiktionary搜索工具,用于检索与新词相关的翻译信息;3) 翻译Agent,基于强化学习训练,负责生成翻译结果;4) 奖励函数设计,用于评估翻译Agent的翻译质量;5) 自适应Rollout生成模块,用于生成训练数据。整体流程是,给定包含新词的源语句,Agent首先利用Wiktionary搜索工具获取相关信息,然后生成翻译结果,最后根据奖励函数进行学习。
关键创新:论文的关键创新在于:1) 提出了一个基于Agentic框架的新词翻译方法,将外部知识融入到翻译过程中;2) 设计了一种新颖的奖励函数,能够更准确地评估新词翻译的质量;3) 提出了一种自适应Rollout生成方法,能够根据翻译难度动态调整训练数据的生成策略。
关键设计:奖励函数的设计考虑了翻译的准确性和流畅性,同时对正确翻译新词给予更高的奖励。自适应Rollout生成方法根据翻译难度动态调整Rollout的长度,对于难以翻译的句子,采用更长的Rollout,以探索更多的翻译可能性。具体参数设置和网络结构等细节在论文中进行了详细描述,但此处未知。
📊 实验亮点
论文构建了一个包含16种语言和75个翻译方向的大规模新词翻译数据集,并开发了一个基于Wiktionary的搜索工具。实验结果表明,NeoAMT框架在感知新词的机器翻译任务上取得了显著的性能提升,具体提升幅度未知,但优于现有基线方法。
🎯 应用场景
该研究成果可应用于各种机器翻译场景,尤其是在需要处理大量新词的领域,如社交媒体、新闻报道和科技文献翻译。通过提升新词翻译的准确性,可以提高机器翻译的整体质量,促进跨语言交流和信息共享。未来,该方法可以扩展到其他类型的外部知识库,并与其他机器翻译技术相结合,进一步提升翻译效果。
📄 摘要(原文)
Neologism-aware machine translation aims to translate source sentences containing neologisms into target languages. This field remains underexplored compared with general machine translation (MT). In this paper, we propose an agentic framework, NeoAMT, for neologism-aware machine translation using a Wiktionary search tool. Specifically, we first create a new dataset for neologism-aware machine translation and develop a search tool based on Wiktionary. The new dataset covers 16 languages and 75 translation directions and is derived from approximately 10 million records of an English Wiktionary dump. The retrieval corpus of the search tool is also constructed from around 3 million cleaned records of the Wiktionary dump. We then use it for training the translation agent with reinforcement learning (RL) and evaluating the accuracy of neologism-aware machine translation. Based on this, we also propose an RL training framework that contains a novel reward design and an adaptive rollout generation approach by leveraging "translation difficulty" to further improve the translation quality of translation agents using our search tool.