FinMarBa: A Market-Informed Dataset for Financial Sentiment Classification

📄 arXiv: 2507.22932v1 📥 PDF

作者: Baptiste Lefort, Eric Benhamou, Beatrice Guez, Jean-Jacques Ohana, Ethan Setrouk, Alban Etienne

分类: cs.CL, q-fin.GN

发布日期: 2025-07-24

备注: 8 pages


💡 一句话要点

提出结合金融新闻情感与市场指标的分层强化学习投资组合优化框架

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 投资组合优化 深度强化学习 情感分析 金融新闻 分层架构

📋 核心要点

  1. 现有投资组合优化方法难以有效融合金融新闻情感与市场数据,导致投资决策不够精准。
  2. 论文提出分层强化学习框架,利用LLM提取情感信号,多层代理协同决策,提升投资组合优化效果。
  3. 实验结果表明,该框架在年化回报率和夏普比率上均优于传统基准,验证了其有效性。

📝 摘要(中文)

本文提出了一种新颖的分层投资组合优化框架,该框架集成了轻量级大型语言模型(LLM)与深度强化学习(DRL),以结合金融新闻的情感信号与传统的市场指标。我们的三层架构采用基础强化学习代理来处理混合数据,元代理来聚合它们的决策,以及一个超级代理来基于市场数据和情感分析合并决策。在2018年至2024年的数据上进行评估(在2000年至2017年的数据上进行训练),该框架实现了26%的年化回报率和1.2的夏普比率,优于等权重和标准普尔500指数基准。主要贡献包括可扩展的跨模态集成、用于增强稳定性的分层强化学习结构以及开源可复现性。

🔬 方法详解

问题定义:现有投资组合优化方法通常依赖于传统的市场指标,忽略了金融新闻中蕴含的情感信息。直接将情感信息融入传统模型可能导致模型不稳定或难以解释。因此,如何有效地融合金融新闻情感与市场数据,提升投资组合的收益和稳定性,是一个亟待解决的问题。

核心思路:论文的核心思路是构建一个分层的强化学习框架,利用轻量级LLM提取金融新闻的情感信号,并将其与市场数据相结合。通过多层代理的协同决策,实现更精准的投资组合优化。这种分层结构旨在提高模型的稳定性和可扩展性。

技术框架:该框架包含三个层级:基础代理层、元代理层和超级代理层。基础代理层负责处理混合数据(金融新闻情感和市场指标),并做出初步的投资决策。元代理层聚合基础代理的决策,形成更全面的投资策略。超级代理层则基于整体市场数据和情感分析,对元代理的决策进行最终调整。整个框架通过强化学习进行训练,以最大化投资组合的收益。

关键创新:该论文的关键创新在于其分层强化学习结构,以及对跨模态数据(金融新闻情感和市场数据)的有效集成。与传统的单层强化学习模型相比,该分层结构能够更好地处理复杂的数据和决策过程,提高模型的稳定性和可扩展性。此外,利用轻量级LLM提取情感信号,降低了计算成本。

关键设计:基础代理、元代理和超级代理均采用强化学习算法进行训练。具体的算法选择和参数设置(例如,奖励函数、折扣因子、学习率等)需要根据实际情况进行调整。论文中可能使用了特定的损失函数来优化模型的性能。此外,LLM的选择和训练方式,以及情感信号的提取方法,也是影响模型性能的关键因素。具体的网络结构(例如,LSTM、Transformer等)的选择也需要根据数据的特点进行优化。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,该框架在2018年至2024年的数据上实现了26%的年化回报率和1.2的夏普比率。与等权重和标准普尔500指数基准相比,该框架在收益和风险调整后的收益方面均表现出显著的优势。这些结果验证了该框架在实际金融市场中的有效性。

🎯 应用场景

该研究成果可应用于智能投顾、量化交易等金融领域。通过融合金融新闻情感与市场数据,该框架能够为投资者提供更精准、更稳健的投资组合优化方案,降低投资风险,提高投资回报。未来,该方法有望扩展到其他金融市场和资产类别,为金融行业的智能化发展做出贡献。

📄 摘要(原文)

This paper presents a novel hierarchical framework for portfolio optimization, integrating lightweight Large Language Models (LLMs) with Deep Reinforcement Learning (DRL) to combine sentiment signals from financial news with traditional market indicators. Our three-tier architecture employs base RL agents to process hybrid data, meta-agents to aggregate their decisions, and a super-agent to merge decisions based on market data and sentiment analysis. Evaluated on data from 2018 to 2024, after training on 2000-2017, the framework achieves a 26% annualized return and a Sharpe ratio of 1.2, outperforming equal-weighted and S&P 500 benchmarks. Key contributions include scalable cross-modal integration, a hierarchical RL structure for enhanced stability, and open-source reproducibility.