PolySwarm: A Multi-Agent Large Language Model Framework for Prediction Market Trading and Latency Arbitrage

作者: Rajat M. Barot, Arjun S. Borkhatariya

分类: cs.AI, cs.CL, cs.MA, fin.TR

发布日期: 2026-04-07

💡 一句话要点

PolySwarm：用于预测市场交易和延迟套利的LLM多智能体框架

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 多智能体系统 大型语言模型 预测市场 延迟套利 贝叶斯聚合

📋 核心要点

现有预测市场交易方法缺乏利用LLM进行实时决策的能力，且难以有效处理市场低效和延迟套利机会。
PolySwarm通过部署多个LLM智能体，结合贝叶斯聚合和信息论分析，实现更准确的概率预测和风险控制的交易执行。
实验表明，PolySwarm在Polymarket预测任务中，通过群体智能聚合，概率校准性能优于单模型基线。

📝 摘要（中文）

本文提出了PolySwarm，一种新颖的多智能体大型语言模型（LLM）框架，专为去中心化平台（如Polymarket）上的实时预测市场交易和延迟套利而设计。PolySwarm部署了50个不同的LLM角色，它们同时评估二元结果市场，通过置信度加权的贝叶斯组合将个体概率估计与市场隐含概率聚合，并应用四分之一凯利仓位调整进行风险控制执行。该系统包含一个信息论市场分析引擎，使用Kullback-Leibler（KL）散度和Jensen-Shannon（JS）散度来检测跨市场效率低下和否定对定价错误。一个延迟套利模块通过从对数正态定价模型中导出CEX隐含概率并在人类反应时间窗口内执行交易来利用过时的Polymarket价格。我们提供了完整的架构描述、实现细节和评估方法，使用Brier分数、校准分析和对数损失指标，并以人类超预测者的表现作为基准。我们进一步讨论了开放的挑战，包括智能体池中的幻觉、大规模计算成本、监管风险和反馈循环风险，并概述了未来研究的五个优先方向。实验结果表明，在Polymarket预测任务中，群体聚合在概率校准方面始终优于单模型基线。

🔬 方法详解

问题定义：论文旨在解决预测市场中，尤其是在去中心化平台如Polymarket上，如何利用大型语言模型（LLM）进行高效的实时交易和套利的问题。现有方法通常依赖于单一模型或人工分析，难以充分利用市场信息，且在处理市场低效和延迟套利机会时存在局限性。现有方法的痛点在于概率预测的准确性不足，风险控制能力较弱，以及对市场微观结构变化的反应速度较慢。

核心思路：PolySwarm的核心思路是利用多智能体系统，每个智能体都是一个具有不同个性的LLM，独立评估市场并生成概率预测。通过群体智慧，将各个智能体的预测进行聚合，从而提高预测的准确性和鲁棒性。此外，系统还利用信息论方法检测市场低效，并设计延迟套利模块，抓住市场价格的短暂偏差。这种设计旨在模拟人类交易员的群体决策过程，并利用LLM的强大分析能力，实现更高效的交易策略。

技术框架：PolySwarm的整体架构包含以下几个主要模块：1) LLM智能体池：包含50个具有不同个性的LLM智能体，每个智能体独立分析市场并生成概率预测。2) 概率聚合模块：使用置信度加权的贝叶斯组合方法，将各个智能体的预测与市场隐含概率进行聚合，生成最终的概率预测。3) 信息论市场分析引擎：使用Kullback-Leibler（KL）散度和Jensen-Shannon（JS）散度检测跨市场效率低下和否定对定价错误。4) 延迟套利模块：从CEX数据推导隐含概率，与Polymarket价格比较，利用价格延迟进行套利。5) 风险管理模块：使用四分之一凯利仓位调整进行风险控制。

关键创新：PolySwarm最重要的技术创新点在于其多智能体架构和群体智慧的运用。与传统的单模型方法相比，PolySwarm能够利用多个LLM的独立视角，通过聚合降低预测误差，提高鲁棒性。此外，信息论市场分析引擎和延迟套利模块的设计，使得系统能够主动发现和利用市场低效，从而获得超额收益。这种多智能体架构的设计，更接近真实世界中人类交易员的决策模式，具有更强的适应性和灵活性。

关键设计：在LLM智能体池中，每个智能体都具有不同的prompt，从而模拟不同的交易风格和风险偏好。概率聚合模块中，置信度权重是根据智能体的历史表现动态调整的。延迟套利模块中，CEX隐含概率的推导采用了对数正态定价模型。风险管理模块中，四分之一凯利仓位调整是为了在收益和风险之间取得平衡。此外，系统还采用了Brier分数、校准分析和对数损失等指标来评估模型的性能。

🖼️ 关键图片

📊 实验亮点

实验结果表明，PolySwarm在Polymarket预测任务中，通过群体聚合，概率校准性能始终优于单模型基线。具体而言，PolySwarm在Brier分数、校准分析和对数损失等指标上均取得了显著提升，表明其预测的准确性和可靠性更高。此外，PolySwarm还能够有效地检测和利用市场低效，实现延迟套利，从而获得超额收益。这些实验结果验证了PolySwarm的有效性和优越性。

🎯 应用场景

PolySwarm的应用场景广泛，包括金融市场的量化交易、风险管理、预测分析等。该框架可以应用于股票、期货、加密货币等多种资产的交易，帮助投资者提高收益、降低风险。此外，PolySwarm还可以用于预测事件结果，例如政治选举、体育比赛等，为决策者提供参考。未来，该技术有望应用于更广泛的领域，例如供应链管理、医疗诊断等，提升决策效率和准确性。

📄 摘要（原文）

This paper presents PolySwarm, a novel multi-agent large language model (LLM) framework designed for real-time prediction market trading and latency arbitrage on decentralized platforms such as Polymarket. PolySwarm deploys a swarm of 50 diverse LLM personas that concurrently evaluate binary outcome markets, aggregating individual probability estimates through confidence-weighted Bayesian combination of swarm consensus with market-implied probabilities, and applying quarter-Kelly position sizing for risk-controlled execution. The system incorporates an information-theoretic market analysis engine using Kullback-Leibler (KL) divergence and Jensen-Shannon (JS) divergence to detect cross-market inefficiencies and negation pair mispricings. A latency arbitrage module exploits stale Polymarket prices by deriving CEX-implied probabilities from a log-normal pricing model and executing trades within the human reaction-time window. We provide a full architectural description, implementation details, and evaluation methodology using Brier scores, calibration analysis, and log-loss metrics benchmarked against human superforecaster performance. We further discuss open challenges including hallucination in agent pools, computational cost at scale, regulatory exposure, and feedback-loop risk, and outline five priority directions for future research. Experimental results demonstrate that swarm aggregation consistently outperforms single-model baselines in probability calibration on Polymarket prediction tasks.

PolySwarm: A Multi-Agent Large Language Model Framework for Prediction Market Trading and Latency Arbitrage

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

🖼️ 关键图片

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册

👤 用户管理