PolySwarm: A Multi-Agent Large Language Model Framework for Prediction Market Trading and Latency Arbitrage
作者: Rajat M. Barot, Arjun S. Borkhatariya
分类: cs.AI, cs.CL, cs.MA, fin.TR
发布日期: 2026-04-07
💡 一句话要点
PolySwarm:用于预测市场交易和延迟套利的LLM多智能体框架
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 多智能体系统 大型语言模型 预测市场 延迟套利 贝叶斯聚合
📋 核心要点
- 现有预测市场交易方法缺乏利用LLM进行实时决策的能力,且难以有效处理市场低效和延迟套利机会。
- PolySwarm通过部署多个LLM智能体,结合贝叶斯聚合和信息论分析,实现更准确的概率预测和风险控制的交易执行。
- 实验表明,PolySwarm在Polymarket预测任务中,通过群体智能聚合,概率校准性能优于单模型基线。
📝 摘要(中文)
本文提出了PolySwarm,一种新颖的多智能体大型语言模型(LLM)框架,专为去中心化平台(如Polymarket)上的实时预测市场交易和延迟套利而设计。PolySwarm部署了50个不同的LLM角色,它们同时评估二元结果市场,通过置信度加权的贝叶斯组合将个体概率估计与市场隐含概率聚合,并应用四分之一凯利仓位调整进行风险控制执行。该系统包含一个信息论市场分析引擎,使用Kullback-Leibler(KL)散度和Jensen-Shannon(JS)散度来检测跨市场效率低下和否定对定价错误。一个延迟套利模块通过从对数正态定价模型中导出CEX隐含概率并在人类反应时间窗口内执行交易来利用过时的Polymarket价格。我们提供了完整的架构描述、实现细节和评估方法,使用Brier分数、校准分析和对数损失指标,并以人类超预测者的表现作为基准。我们进一步讨论了开放的挑战,包括智能体池中的幻觉、大规模计算成本、监管风险和反馈循环风险,并概述了未来研究的五个优先方向。实验结果表明,在Polymarket预测任务中,群体聚合在概率校准方面始终优于单模型基线。
🔬 方法详解
问题定义:论文旨在解决预测市场中,尤其是在去中心化平台如Polymarket上,如何利用大型语言模型(LLM)进行高效的实时交易和套利的问题。现有方法通常依赖于单一模型或人工分析,难以充分利用市场信息,且在处理市场低效和延迟套利机会时存在局限性。现有方法的痛点在于概率预测的准确性不足,风险控制能力较弱,以及对市场微观结构变化的反应速度较慢。
核心思路:PolySwarm的核心思路是利用多智能体系统,每个智能体都是一个具有不同个性的LLM,独立评估市场并生成概率预测。通过群体智慧,将各个智能体的预测进行聚合,从而提高预测的准确性和鲁棒性。此外,系统还利用信息论方法检测市场低效,并设计延迟套利模块,抓住市场价格的短暂偏差。这种设计旨在模拟人类交易员的群体决策过程,并利用LLM的强大分析能力,实现更高效的交易策略。
技术框架:PolySwarm的整体架构包含以下几个主要模块:1) LLM智能体池:包含50个具有不同个性的LLM智能体,每个智能体独立分析市场并生成概率预测。2) 概率聚合模块:使用置信度加权的贝叶斯组合方法,将各个智能体的预测与市场隐含概率进行聚合,生成最终的概率预测。3) 信息论市场分析引擎:使用Kullback-Leibler(KL)散度和Jensen-Shannon(JS)散度检测跨市场效率低下和否定对定价错误。4) 延迟套利模块:从CEX数据推导隐含概率,与Polymarket价格比较,利用价格延迟进行套利。5) 风险管理模块:使用四分之一凯利仓位调整进行风险控制。
关键创新:PolySwarm最重要的技术创新点在于其多智能体架构和群体智慧的运用。与传统的单模型方法相比,PolySwarm能够利用多个LLM的独立视角,通过聚合降低预测误差,提高鲁棒性。此外,信息论市场分析引擎和延迟套利模块的设计,使得系统能够主动发现和利用市场低效,从而获得超额收益。这种多智能体架构的设计,更接近真实世界中人类交易员的决策模式,具有更强的适应性和灵活性。
关键设计:在LLM智能体池中,每个智能体都具有不同的prompt,从而模拟不同的交易风格和风险偏好。概率聚合模块中,置信度权重是根据智能体的历史表现动态调整的。延迟套利模块中,CEX隐含概率的推导采用了对数正态定价模型。风险管理模块中,四分之一凯利仓位调整是为了在收益和风险之间取得平衡。此外,系统还采用了Brier分数、校准分析和对数损失等指标来评估模型的性能。
🖼️ 关键图片
📊 实验亮点
实验结果表明,PolySwarm在Polymarket预测任务中,通过群体聚合,概率校准性能始终优于单模型基线。具体而言,PolySwarm在Brier分数、校准分析和对数损失等指标上均取得了显著提升,表明其预测的准确性和可靠性更高。此外,PolySwarm还能够有效地检测和利用市场低效,实现延迟套利,从而获得超额收益。这些实验结果验证了PolySwarm的有效性和优越性。
🎯 应用场景
PolySwarm的应用场景广泛,包括金融市场的量化交易、风险管理、预测分析等。该框架可以应用于股票、期货、加密货币等多种资产的交易,帮助投资者提高收益、降低风险。此外,PolySwarm还可以用于预测事件结果,例如政治选举、体育比赛等,为决策者提供参考。未来,该技术有望应用于更广泛的领域,例如供应链管理、医疗诊断等,提升决策效率和准确性。
📄 摘要(原文)
This paper presents PolySwarm, a novel multi-agent large language model (LLM) framework designed for real-time prediction market trading and latency arbitrage on decentralized platforms such as Polymarket. PolySwarm deploys a swarm of 50 diverse LLM personas that concurrently evaluate binary outcome markets, aggregating individual probability estimates through confidence-weighted Bayesian combination of swarm consensus with market-implied probabilities, and applying quarter-Kelly position sizing for risk-controlled execution. The system incorporates an information-theoretic market analysis engine using Kullback-Leibler (KL) divergence and Jensen-Shannon (JS) divergence to detect cross-market inefficiencies and negation pair mispricings. A latency arbitrage module exploits stale Polymarket prices by deriving CEX-implied probabilities from a log-normal pricing model and executing trades within the human reaction-time window. We provide a full architectural description, implementation details, and evaluation methodology using Brier scores, calibration analysis, and log-loss metrics benchmarked against human superforecaster performance. We further discuss open challenges including hallucination in agent pools, computational cost at scale, regulatory exposure, and feedback-loop risk, and outline five priority directions for future research. Experimental results demonstrate that swarm aggregation consistently outperforms single-model baselines in probability calibration on Polymarket prediction tasks.