Multimodal Stock Price Prediction

📄 arXiv: 2502.05186v1 📥 PDF

作者: Furkan Karadaş, Bahaeddin Eravcı, Ahmet Murat Özbayoğlu

分类: q-fin.ST, cs.AI, cs.LG

发布日期: 2025-01-23

备注: 9 pages, 6 table

期刊: In Proceedings of the 17th International Conference on Agents and Artificial Intelligence 3 (2025) 687-694

DOI: 10.5220/0013174500003890


💡 一句话要点

提出融合金融数据、新闻和社交媒体情感分析的多模态LSTM股票价格预测模型

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 股票价格预测 多模态学习 情感分析 LSTM 金融时间序列

📋 核心要点

  1. 金融市场受多种因素影响,准确的股票价格预测需要整合多样化数据源并结合机器学习。
  2. 论文提出一种多模态方法,融合金融指标、新闻和推文的情感分析,以提升LSTM模型的预测性能。
  3. 实验结果表明,整合情感分析数据能显著提高股票价格预测的准确性,最高提升可达5%。

📝 摘要(中文)

本文提出了一种多模态机器学习方法,用于股票价格预测,该方法结合了来自不同来源的数据,包括传统金融指标、推文和新闻文章。通过使用ChatGPT-4o和FinBERT模型对这些文本数据进行情感分析,捕捉实时的市场动态和投资者情绪。研究考察了这些整合的数据流如何增强标准长短期记忆(LSTM)模型的预测效果,并展示了性能提升的程度。研究结果表明,整合上述数据源可以显著提高参考模型的预测效果,最高可达5%。此外,还深入分析了这些模态的个体和组合预测能力,突出了整合来自推文和新闻文章的情感分析的重大影响。这项研究为在金融时间序列预测中应用多模态数据分析技术提供了一个系统而有效的框架,为投资者利用数据进行决策提供了一个新的视角。

🔬 方法详解

问题定义:股票价格预测是一个复杂的时间序列问题,传统方法往往只依赖于历史金融数据,忽略了新闻舆情和社交媒体情绪等重要信息。现有方法难以有效整合这些异构数据,导致预测精度受限。

核心思路:论文的核心思路是将传统金融数据与新闻、推文的情感分析结果相结合,构建多模态输入,利用LSTM模型学习不同模态之间的关联,从而更准确地预测股票价格。通过捕捉市场情绪和舆论变化,弥补传统方法的不足。

技术框架:整体框架包括数据收集、情感分析和LSTM模型训练三个主要阶段。首先,收集历史金融数据、新闻文章和推文。然后,使用ChatGPT-4o和FinBERT模型对新闻和推文进行情感分析,提取情感得分。最后,将金融数据和情感得分作为LSTM模型的输入,训练模型进行股票价格预测。

关键创新:关键创新在于多模态数据的融合和情感分析的应用。通过整合不同来源的数据,模型能够捕捉更全面的市场信息。使用ChatGPT-4o和FinBERT进行情感分析,能够更准确地反映市场情绪,从而提高预测精度。

关键设计:情感分析部分,使用了ChatGPT-4o和FinBERT两种模型,可能采用了不同的情感极性分类方法或情感强度量化方法。LSTM模型的具体结构(层数、神经元数量)以及训练参数(学习率、优化器)未知,损失函数也未明确说明,但推测是均方误差或类似的回归损失函数。

📊 实验亮点

实验结果表明,整合新闻和推文的情感分析数据能够显著提高LSTM模型的股票价格预测精度,最高提升可达5%。这表明情感分析在金融时间序列预测中具有重要价值,为投资者提供了新的数据驱动的决策支持工具。

🎯 应用场景

该研究成果可应用于量化交易、投资组合管理和风险评估等金融领域。投资者可以利用该模型更准确地预测股票价格,辅助投资决策,降低投资风险。未来,该方法还可以扩展到其他金融资产的预测,例如债券、期货等。

📄 摘要(原文)

In an era where financial markets are heavily influenced by many static and dynamic factors, it has become increasingly critical to carefully integrate diverse data sources with machine learning for accurate stock price prediction. This paper explores a multimodal machine learning approach for stock price prediction by combining data from diverse sources, including traditional financial metrics, tweets, and news articles. We capture real-time market dynamics and investor mood through sentiment analysis on these textual data using both ChatGPT-4o and FinBERT models. We look at how these integrated data streams augment predictions made with a standard Long Short-Term Memory (LSTM model) to illustrate the extent of performance gains. Our study's results indicate that incorporating the mentioned data sources considerably increases the forecast effectiveness of the reference model by up to 5%. We also provide insights into the individual and combined predictive capacities of these modalities, highlighting the substantial impact of incorporating sentiment analysis from tweets and news articles. This research offers a systematic and effective framework for applying multimodal data analytics techniques in financial time series forecasting that provides a new view for investors to leverage data for decision-making.