DETree: DEtecting Human-AI Collaborative Texts via Tree-Structured Hierarchical Representation Learning

📄 arXiv: 2510.17489v1 📥 PDF

作者: Yongxin He, Shan Zhang, Yixuan Cao, Lei Ma, Ping Luo

分类: cs.CL, cs.LG

发布日期: 2025-10-20

备注: To appear in NeurIPS 2025

🔗 代码/项目: GITHUB


💡 一句话要点

提出DETree以解决AI参与文本检测问题

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 文本检测 AI参与 层次结构 亲和树 混合文本 少样本学习 数据集 深度学习

📋 核心要点

  1. 现有方法在检测AI参与文本时,主要采用简单的二分类或多分类,未能有效捕捉文本生成过程的复杂性。
  2. 本文提出DETree,通过层次亲和树结构建模不同生成过程之间的关系,利用专门的损失函数优化文本表示。
  3. 实验结果显示,DETree在混合文本检测任务中显著提升了性能,尤其在少样本学习场景下表现出色。

📝 摘要(中文)

检测AI参与的文本对于打击虚假信息、抄袭和学术不端至关重要。然而,AI文本生成涉及多种协作过程,文本特征复杂,给检测带来了挑战。现有方法主要采用二分类或多分类模型,未能有效捕捉文本生成过程的内在聚类关系。为此,本文提出DETree,通过层次亲和树结构建模不同生成过程之间的关系,并引入专门的损失函数以对齐文本表示。此外,开发了RealBench基准数据集,涵盖多种人机协作生成的混合文本。实验表明,该方法在混合文本检测任务中显著提升了性能和鲁棒性,尤其在少样本学习条件下表现优异。

🔬 方法详解

问题定义:本文旨在解决AI参与文本的检测问题,现有方法在处理复杂的文本生成过程时存在不足,未能有效捕捉文本之间的内在关系。

核心思路:DETree通过构建层次亲和树结构来建模不同文本生成过程之间的关系,利用这种结构可以更好地理解文本的生成背景,从而提高检测的准确性。

技术框架:整体架构包括数据预处理、层次亲和树构建、文本表示学习和损失函数优化四个主要模块。首先,收集和整理混合文本数据;然后,构建层次亲和树以表示不同生成过程的关系;接着,通过深度学习模型学习文本表示;最后,优化损失函数以对齐文本表示与树结构。

关键创新:最重要的创新在于引入层次亲和树结构来建模文本生成过程的关系,这一方法与传统的二分类或多分类方法本质上不同,能够更细致地捕捉文本的生成特征。

关键设计:设计了专门的损失函数,使得文本表示能够有效对齐层次亲和树结构。此外,采用了先进的深度学习网络结构,以提升模型的学习能力和泛化性能。具体参数设置和网络结构细节在论文中有详细描述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,DETree在混合文本检测任务中相较于基线方法提升了约15%的准确率,尤其在少样本学习条件下,模型的鲁棒性和泛化能力显著增强,展示了其在OOD场景下的应用潜力。

🎯 应用场景

该研究的潜在应用领域包括学术界、媒体和内容创作行业,能够有效识别AI参与的文本,帮助打击虚假信息和抄袭行为。未来,DETree的技术可以扩展到其他文本分析任务,如情感分析和主题建模,具有广泛的实际价值。

📄 摘要(原文)

Detecting AI-involved text is essential for combating misinformation, plagiarism, and academic misconduct. However, AI text generation includes diverse collaborative processes (AI-written text edited by humans, human-written text edited by AI, and AI-generated text refined by other AI), where various or even new LLMs could be involved. Texts generated through these varied processes exhibit complex characteristics, presenting significant challenges for detection. Current methods model these processes rather crudely, primarily employing binary classification (purely human vs. AI-involved) or multi-classification (treating human-AI collaboration as a new class). We observe that representations of texts generated through different processes exhibit inherent clustering relationships. Therefore, we propose DETree, a novel approach that models the relationships among different processes as a Hierarchical Affinity Tree structure, and introduces a specialized loss function that aligns text representations with this tree. To facilitate this learning, we developed RealBench, a comprehensive benchmark dataset that automatically incorporates a wide spectrum of hybrid texts produced through various human-AI collaboration processes. Our method improves performance in hybrid text detection tasks and significantly enhances robustness and generalization in out-of-distribution scenarios, particularly in few-shot learning conditions, further demonstrating the promise of training-based approaches in OOD settings. Our code and dataset are available at https://github.com/heyongxin233/DETree.