Knowledge-Integrated Representation Learning for Crypto Anomaly Detection under Extreme Label Scarcity; Relational Domain-Logic Integration with Retrieval-Grounded Context and Path-Level Explanations
作者: Gyuyeon Na, Minjung Park, Soyoun Kim, Jungbin Shin, Sangmi Chai
分类: cs.LG, q-fin.RM
发布日期: 2026-01-19
备注: Gyuyeon Na, Minjung Park, Soyoun Kim contributed equally to this work
💡 一句话要点
提出RDLI框架,解决加密货币异常检测中标签稀缺和对抗性攻击问题
🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)
关键词: 加密货币 异常检测 图神经网络 知识图谱 反洗钱
📋 核心要点
- 现有方法难以在加密货币异常检测中应对标签稀缺和对抗性攻击,尤其缺乏对复杂洗钱模式的理解。
- RDLI框架通过嵌入专家知识和结合检索增强的上下文信息,提升模型对复杂交易流的检测能力。
- 实验表明,RDLI在极度标签稀缺情况下,F1得分显著优于现有GNN基线,并提升了模型的可解释性。
📝 摘要(中文)
在去中心化加密网络中检测异常交易轨迹面临着标签极度稀缺和非法行为者自适应规避策略的根本挑战。图神经网络(GNN)虽然能有效捕捉局部结构模式,但难以理解多跳、逻辑驱动的模式,如资金分散和分层,这些模式是复杂洗钱的特征,限制了其在FATF Travel Rule等法规下的取证责任。为了解决这个问题,我们提出了关系领域逻辑集成(RDLI)框架,该框架将专家导出的启发式方法嵌入为表征学习中可微的、逻辑感知的潜在信号。与静态的基于规则的方法不同,RDLI能够检测逃避标准消息传递的复杂交易流。为了进一步考虑市场波动,我们引入了一个检索基础上下文(RGC)模块,该模块根据监管和宏观经济背景来调节异常评分,从而减轻良性状态转移引起的误报。在极度标签稀缺(0.01%)的情况下,RDLI在F1得分上优于最先进的GNN基线28.9%。一项微型专家用户研究进一步证实,与现有方法相比,RDLI路径级别的解释显著提高了可信度、感知有用性和清晰度,突出了将领域逻辑与上下文基础相结合对于准确性和可解释性的重要性。
🔬 方法详解
问题定义:论文旨在解决在极度标签稀缺的情况下,如何准确检测加密货币网络中的异常交易。现有方法,特别是图神经网络,虽然能捕捉局部结构信息,但难以理解复杂的、多跳的洗钱模式,并且容易受到市场波动的影响,导致误报。
核心思路:论文的核心思路是将专家领域的知识(例如,洗钱的常见模式)融入到表征学习过程中,同时结合检索增强的上下文信息(例如,监管政策、宏观经济数据),从而提高模型对异常交易的识别能力,并降低误报率。这种方法旨在弥补现有方法在处理复杂交易模式和市场波动方面的不足。
技术框架:RDLI框架主要包含两个核心模块:关系领域逻辑集成(RDLI)模块和检索基础上下文(RGC)模块。RDLI模块将专家定义的启发式规则转化为可微的潜在信号,嵌入到表征学习过程中,从而使模型能够学习到复杂的交易模式。RGC模块则通过检索相关的监管和宏观经济信息,为异常评分提供上下文信息,从而降低市场波动带来的误报。
关键创新:RDLI的关键创新在于将专家知识和上下文信息融入到表征学习中。与传统的基于规则的方法相比,RDLI能够学习到更加灵活和适应性强的异常检测模型。与传统的GNN方法相比,RDLI能够更好地理解复杂的交易模式,并降低市场波动带来的影响。
关键设计:RDLI模块的关键设计在于如何将专家规则转化为可微的潜在信号。论文采用了一种基于逻辑的嵌入方法,将规则表示为逻辑表达式,然后将这些表达式转化为可微的函数。RGC模块的关键设计在于如何有效地检索相关的上下文信息。论文采用了一种基于向量相似度的检索方法,将交易信息表示为向量,然后检索与该向量最相似的监管和宏观经济信息。
🖼️ 关键图片
📊 实验亮点
在极度标签稀缺(0.01%)的情况下,RDLI框架在F1得分上优于最先进的GNN基线28.9%。用户研究表明,RDLI提供的路径级别解释显著提高了模型的可信度、感知有用性和清晰度,证明了领域知识和上下文信息结合的重要性。
🎯 应用场景
该研究成果可应用于加密货币反洗钱、金融风险管理等领域。通过提高异常交易检测的准确性和可解释性,有助于监管机构和金融机构更好地识别和防范非法活动,维护金融市场的稳定。未来,该方法可以扩展到其他类型的网络安全和欺诈检测问题。
📄 摘要(原文)
Detecting anomalous trajectories in decentralized crypto networks is fundamentally challenged by extreme label scarcity and the adaptive evasion strategies of illicit actors. While Graph Neural Networks (GNNs) effectively capture local structural patterns, they struggle to internalize multi hop, logic driven motifs such as fund dispersal and layering that characterize sophisticated money laundering, limiting their forensic accountability under regulations like the FATF Travel Rule. To address this limitation, we propose Relational Domain Logic Integration (RDLI), a framework that embeds expert derived heuristics as differentiable, logic aware latent signals within representation learning. Unlike static rule based approaches, RDLI enables the detection of complex transactional flows that evade standard message passing. To further account for market volatility, we incorporate a Retrieval Grounded Context (RGC) module that conditions anomaly scoring on regulatory and macroeconomic context, mitigating false positives caused by benign regime shifts. Under extreme label scarcity (0.01%), RDLI outperforms state of the art GNN baselines by 28.9% in F1 score. A micro expert user study further confirms that RDLI path level explanations significantly improve trustworthiness, perceived usefulness, and clarity compared to existing methods, highlighting the importance of integrating domain logic with contextual grounding for both accuracy and explainability.