Addressing Market Regime Changes and Heavy-Tailed Returns in Portfolio Optimization via Bayesian VAR and Elliptical Black-Litterman

📄 arXiv: 2606.09104v1 📥 PDF

作者: Daniil Mikriukov, Ruoyu Sun, Angelos Stefanidis, Jionglong Su, Zhengyong Jiang

分类: cs.LG, cs.AI, q-fin.PM

发布日期: 2026-06-08

备注: 9 pages, 3 figures, 4 tables. Extends our prior work [Mikriukov et al., ICIC 2025] on Black-Litterman under Elliptical Distributions (BLED). Manuscript under review


💡 一句话要点

提出BAVAR-BLED算法以解决投资组合优化中的市场状态变化与重尾收益问题

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 投资组合优化 深度强化学习 贝叶斯模型 重尾收益 市场状态变化 动态配置 金融科技

📋 核心要点

  1. 现有投资组合优化方法未能有效处理重尾收益和市场状态变化,导致模型在极端市场条件下表现不佳。
  2. 本文提出的BAVAR-BLED算法结合了贝叶斯平均向量自回归和椭圆分布的Black-Litterman模型,能够动态适应市场变化。
  3. 实验结果表明,BAVAR-BLED在道琼斯工业平均指数成分股的投资组合中显著提升了收益率和风险调整后的表现。

📝 摘要(中文)

深度强化学习(DRL)框架在投资组合优化中展现出动态学习配置规则的潜力。然而,现有模型未能考虑重尾收益,这种收益特征在实际市场中表现为极端事件的频繁发生。此外,历史数据被视为同质化,未考虑时间的重要性,导致模型在市场状态变化时失效。本文提出了一种新的BAVAR-BLED算法,该算法结合了贝叶斯平均向量自回归(BAVAR)和基于椭圆分布的Black-Litterman模型(BLED),在TD3架构下进行实现。BAVAR能够捕捉多尺度时间特征的向量自回归表示,从而基于状态感知的收益预期和离散矩阵进行自适应配置决策。BLED则利用Student's t分布,提供更为真实的重尾收益估计。实验表明,BAVAR-BLED在29个道琼斯工业平均指数成分股的十年市场期内显著优于现有方法,Sharpe比率和Sortino比率分别达到1.72和2.70,总收益为57.26%。

🔬 方法详解

问题定义:本文旨在解决投资组合优化中未能有效处理重尾收益和市场状态变化的问题。现有方法通常将历史数据视为同质化,忽视了时间序列的动态特性,导致在市场状态变化时模型表现不佳。

核心思路:BAVAR-BLED算法通过结合贝叶斯平均向量自回归(BAVAR)和椭圆分布的Black-Litterman模型(BLED),实现了对市场状态的感知和重尾收益的有效建模,从而提升投资组合的动态配置能力。

技术框架:该算法采用TD3架构,主要模块包括BAVAR用于收益预期和离散矩阵的估计,BLED用于重尾收益的建模,以及基于变换器网络的观点构建和卷积神经网络(CNN)用于风险厌恶估计。

关键创新:BAVAR-BLED的核心创新在于引入了多尺度时间特征的向量自回归表示和使用Student's t分布进行重尾收益估计,这与传统方法在处理极端市场事件时的局限性形成了鲜明对比。

关键设计:在参数设置上,BAVAR-BLED采用了适应性学习率和动态调整的损失函数,网络结构中结合了变换器和CNN,以实现对市场条件的实时响应和动态配置决策。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果显示,BAVAR-BLED算法在29个道琼斯工业平均指数成分股的十年市场期内,Sharpe比率达到1.72,Sortino比率达到2.70,总收益率为57.26%。与现有最先进的方法相比,BAVAR-BLED显著提升了投资组合的风险调整后表现,展示了其在实际应用中的有效性。

🎯 应用场景

该研究在金融投资领域具有广泛的应用潜力,尤其是在动态市场环境下的投资组合管理。BAVAR-BLED算法能够帮助投资者在面对市场波动和极端事件时,做出更为精准的资产配置决策,从而提高投资收益和降低风险。未来,该方法还可以扩展到其他金融产品和市场分析中,推动智能投资的进一步发展。

📄 摘要(原文)

Deep reinforcement learning (DRL) frameworks for portfolio optimization have shown promise for their ability to learn allocation rules dynamically from market data. However, these models fail to account for fat-tailed returns, which characterize actual market behavior with more frequent extreme events. Furthermore, historical data is treated homogeneously, without accounting for temporal importance, leading models to fail during regime changes. We propose a new BAVAR-BLED algorithm that combines methods derived from Bayesian-Averaging Vector Autoregressive (BAVAR) and the Black-Litterman model using Elliptical Distributions (BLED) within a TD3 architecture. BAVAR captures a set of vector autoregressive representations that consider multi-scale temporal features, enabling adaptive allocation decisions based on regime-aware estimates of return expectations and dispersion matrices. These estimates serve as prior inputs to BLED, a model that uses Student's t-distributions, allowing for more realistic fat tail return estimates. The BAVAR-BLED algorithm uses transformer networks for view construction and CNNs for risk-aversion estimates, which modify dynamic allocation decisions based on market conditions. An evaluation of 29 Dow Jones Industrial Average constituents over a decade-long market period shows that BAVAR-BLED significantly outperforms state-of-the-art methods, achieving Sharpe and Sortino ratios of 1.72 and 2.70, respectively, and total returns of 57.26%.