Not All News Is Equal: Topic- and Event-Conditional Sentiment from Finetuned LLMs for Aluminum Price Forecasting
作者: Alvaro Paredes Amorin, Andre Python, Christoph Weisser
分类: cs.LG, cs.AI
发布日期: 2026-03-10
备注: 8 pages
💡 一句话要点
利用微调LLM提取主题和事件条件情感,用于铝价预测,提升高波动期预测精度。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 铝价预测 情感分析 大型语言模型 LSTM 金融市场 时间序列分析 Qwen3
📋 核心要点
- 现有商品价格预测方法难以有效利用文本数据中的情感信息,尤其是在市场高波动时期。
- 本文提出利用微调的LLM提取新闻标题中的主题和事件相关情感,并将其融入到铝价预测模型中。
- 实验表明,在高波动时期,结合情感数据的LSTM模型显著优于传统模型,夏普比率从0.23提升到1.04。
📝 摘要(中文)
本文研究了轻量级微调大型语言模型(LLM)在提取铝价预测信号方面的有效性,以及这些信号最具信息量的特定市场条件。通过分析路透社、道琼斯通讯社和中国新闻社的中英文新闻标题,生成月度情感得分,并将其与基本金属指数、汇率、通货膨胀率和能源价格等传统表格数据相结合。通过对上海金属交易所2007年至2024年的多空模拟,评估了这些模型的预测性能和经济效用。结果表明,在高波动时期,结合了微调Qwen3模型情感数据的长短期记忆(LSTM)模型(夏普比率1.04)明显优于仅使用表格数据的基线模型(夏普比率0.23)。进一步的分析阐明了新闻来源、主题和事件类型在铝价预测中的细微作用。
🔬 方法详解
问题定义:现有铝价预测模型主要依赖于传统的表格数据,如金属指数、汇率等,忽略了新闻文本中蕴含的市场情绪和事件信息。尤其是在市场高波动时期,这些信息对于准确预测铝价至关重要。因此,该论文旨在解决如何有效利用新闻文本数据,特别是情感信息,来提升铝价预测的准确性,尤其是在高波动时期。
核心思路:该论文的核心思路是利用微调的大型语言模型(LLM)从新闻标题中提取情感信息,并将其作为额外的特征融入到传统的铝价预测模型中。通过对LLM进行微调,使其能够更好地理解与铝价相关的特定主题和事件,从而更准确地捕捉市场情绪。
技术框架:整体框架包括以下几个主要步骤:1) 数据收集:收集包括路透社、道琼斯通讯社和中国新闻社的中英文新闻标题,以及基本金属指数、汇率、通货膨胀率和能源价格等表格数据。2) 情感分析:使用微调的Qwen3模型对新闻标题进行情感分析,生成月度情感得分。3) 模型构建:构建基于LSTM的铝价预测模型,将情感得分与表格数据相结合。4) 模型评估:通过对上海金属交易所2007年至2024年的多空模拟,评估模型的预测性能和经济效用。
关键创新:该论文的关键创新在于:1) 利用微调的LLM提取主题和事件相关的情感信息,而不是简单地使用预训练的情感分析模型。2) 关注高波动时期,并证明了情感信息在这些时期对于提高预测准确性的重要性。3) 结合中英文新闻数据,考虑了全球市场的影响。
关键设计:该论文的关键设计包括:1) 使用Qwen3模型作为基础LLM,并针对铝价预测任务进行微调。2) 使用LSTM模型来捕捉时间序列数据中的依赖关系。3) 通过夏普比率来评估模型的经济效用,而不仅仅是预测准确率。
🖼️ 关键图片
📊 实验亮点
实验结果表明,在高波动时期,结合了微调Qwen3模型情感数据的LSTM模型表现显著优于仅使用表格数据的基线模型,夏普比率从0.23提升到1.04。这表明情感信息在市场高波动时期对于提高铝价预测的准确性至关重要。此外,研究还分析了不同新闻来源、主题和事件类型对铝价预测的影响。
🎯 应用场景
该研究成果可应用于金融领域的商品价格预测,帮助投资者和交易员更好地理解市场情绪,制定更有效的交易策略,降低投资风险。此外,该方法也可推广到其他受新闻事件影响的金融资产价格预测,例如股票、债券等,具有广泛的应用前景。
📄 摘要(原文)
By capturing the prevailing sentiment and market mood, textual data has become increasingly vital for forecasting commodity prices, particularly in metal markets. However, the effectiveness of lightweight, finetuned large language models (LLMs) in extracting predictive signals for aluminum prices, and the specific market conditions under which these signals are most informative, remains under-explored. This study generates monthly sentiment scores from English and Chinese news headlines (Reuters, Dow Jones Newswires, and China News Service) and integrates them with traditional tabular data, including base metal indices, exchange rates, inflation rates, and energy prices. We evaluate the predictive performance and economic utility of these models through long-short simulations on the Shanghai Metal Exchange from 2007 to 2024. Our results demonstrate that during periods of high volatility, Long Short-Term Memory (LSTM) models incorporating sentiment data from a finetuned Qwen3 model (Sharpe ratio 1.04) significantly outperform baseline models using tabular data alone (Sharpe ratio 0.23). Subsequent analysis elucidates the nuanced roles of news sources, topics, and event types in aluminum price forecasting.