Uni-FinLLM: A Unified Multimodal Large Language Model with Modular Task Heads for Micro-Level Stock Prediction and Macro-Level Systemic Risk Assessment

作者: Gongao Zhang, Haijiang Zeng, Lu Jiang

分类: cs.LG, q-fin.RM, q-fin.ST

发布日期: 2026-01-06

💡 一句话要点

Uni-FinLLM：统一多模态大语言模型，用于微观股票预测和宏观系统性风险评估

🎯 匹配领域: 支柱九：具身大模型 (Embodied Foundation Models)

关键词: 多模态学习 大语言模型 金融风险评估 股票预测 系统性风险 跨模态注意力 多任务学习

📋 核心要点

现有金融风险评估方法通常孤立处理微观股票波动和宏观系统性风险，忽略了它们之间的跨尺度依赖关系。
Uni-FinLLM采用共享Transformer骨干网络和模块化任务头，通过跨模态注意力和多任务优化，学习微观、中观和宏观层面的统一表示。
实验表明，Uni-FinLLM在股票预测、信用风险评估和系统性风险检测方面均显著优于基线模型，验证了其有效性。

📝 摘要（中文）

金融机构和监管机构需要整合异构数据的系统，以评估从股票波动到系统性脆弱性的风险。现有方法通常孤立地处理这些任务，未能捕捉跨尺度的依赖关系。我们提出了Uni-FinLLM，一个统一的多模态大语言模型，它使用共享的Transformer骨干网络和模块化的任务头，联合处理金融文本、数值时间序列、基本面数据和视觉数据。通过跨模态注意力和多任务优化，它学习了微观、中观和宏观层面预测的连贯表示。在股票预测、信用风险评估和系统性风险检测方面的评估表明，Uni-FinLLM显著优于基线模型。它将股票方向预测准确率提高到67.4%（从61.7%），信用风险准确率提高到84.1%（从79.6%），宏观早期预警准确率提高到82.3%。结果验证了统一的多模态LLM可以联合建模资产行为和系统性脆弱性，为金融领域提供可扩展的决策支持引擎。

🔬 方法详解

问题定义：现有金融风险评估方法通常将股票预测、信用风险评估和系统性风险检测等任务孤立地处理，忽略了这些任务之间存在的复杂的跨尺度依赖关系。这种孤立的处理方式导致模型无法充分利用不同类型数据之间的关联性，从而限制了预测的准确性和可靠性。

核心思路：Uni-FinLLM的核心思路是构建一个统一的多模态大语言模型，通过共享的Transformer骨干网络和模块化的任务头，联合处理金融文本、数值时间序列、基本面数据和视觉数据。通过跨模态注意力和多任务优化，模型能够学习到微观、中观和宏观层面预测的连贯表示，从而更好地捕捉不同任务之间的依赖关系。

技术框架：Uni-FinLLM的整体架构包括以下几个主要模块：1) 多模态数据输入模块，用于处理金融文本、数值时间序列、基本面数据和视觉数据；2) 共享的Transformer骨干网络，用于提取多模态数据的通用特征表示；3) 模块化的任务头，针对不同的预测任务（如股票预测、信用风险评估和系统性风险检测）进行定制；4) 跨模态注意力机制，用于融合不同模态的数据特征；5) 多任务优化模块，用于联合训练模型，使其能够同时完成多个预测任务。

关键创新：Uni-FinLLM最重要的技术创新点在于其统一的多模态建模框架。与现有方法相比，Uni-FinLLM能够同时处理多种类型的金融数据，并学习到不同任务之间的依赖关系。这种统一的建模方式使得模型能够更好地捕捉金融市场的复杂动态，从而提高预测的准确性和可靠性。

关键设计：Uni-FinLLM的关键设计包括：1) 使用Transformer作为骨干网络，以捕捉序列数据的长期依赖关系；2) 采用跨模态注意力机制，以融合不同模态的数据特征；3) 设计模块化的任务头，以适应不同的预测任务；4) 使用多任务损失函数，以联合训练模型。具体的参数设置和网络结构细节在论文中有详细描述。

📊 实验亮点

Uni-FinLLM在股票预测、信用风险评估和系统性风险检测方面均取得了显著的性能提升。具体而言，股票方向预测准确率从61.7%提高到67.4%，信用风险准确率从79.6%提高到84.1%，宏观早期预警准确率提高到82.3%。这些结果表明，Uni-FinLLM能够有效地捕捉金融市场的复杂动态，并提供更准确的风险评估。

🎯 应用场景

Uni-FinLLM可应用于金融机构和监管机构，用于风险管理、投资决策和监管合规。它可以帮助金融机构更准确地预测股票波动、评估信用风险和检测系统性风险，从而降低投资风险、提高盈利能力。同时，监管机构可以利用Uni-FinLLM进行金融市场监测和风险预警，维护金融稳定。

📄 摘要（原文）

Financial institutions and regulators require systems that integrate heterogeneous data to assess risks from stock fluctuations to systemic vulnerabilities. Existing approaches often treat these tasks in isolation, failing to capture cross-scale dependencies. We propose Uni-FinLLM, a unified multimodal large language model that uses a shared Transformer backbone and modular task heads to jointly process financial text, numerical time series, fundamentals, and visual data. Through cross-modal attention and multi-task optimization, it learns a coherent representation for micro-, meso-, and macro-level predictions. Evaluated on stock forecasting, credit-risk assessment, and systemic-risk detection, Uni-FinLLM significantly outperforms baselines. It raises stock directional accuracy to 67.4% (from 61.7%), credit-risk accuracy to 84.1% (from 79.6%), and macro early-warning accuracy to 82.3%. Results validate that a unified multimodal LLM can jointly model asset behavior and systemic vulnerabilities, offering a scalable decision-support engine for finance.

Uni-FinLLM: A Unified Multimodal Large Language Model with Modular Task Heads for Micro-Level Stock Prediction and Macro-Level Systemic Risk Assessment

💡 一句话要点

📋 核心要点

📝 摘要（中文）

🔬 方法详解

📊 实验亮点

🎯 应用场景

📄 摘要（原文）

⭐ 我的收藏

📁 新建收藏夹

⚙️ 管理收藏夹

🔍 搜索论文

🔐 登录 / 注册