Cross-Sectional Asset Retrieval via Future-Aligned Soft Contrastive Learning

📄 arXiv: 2602.10711v1 📥 PDF

作者: Hyeongmin Lee, Chanyeol Choi, Jihoon Kwon, Yoon Kim, Alejandro Lopez-Lira, Wonbin Ahn, Yongjae Lee

分类: cs.CE, cs.AI

发布日期: 2026-02-11


💡 一句话要点

提出FASCL框架,通过未来收益相关性进行横截面资产检索。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture)

关键词: 资产检索 量化投资 对比学习 表征学习 未来收益 金融市场 时间序列分析

📋 核心要点

  1. 现有资产检索方法依赖历史数据,无法保证检索到的资产在未来具有相似的收益表现,这是核心挑战。
  2. FASCL框架通过软对比学习,利用未来收益相关性作为监督信号,学习更具前瞻性的资产表征。
  3. 实验结果表明,FASCL在预测资产未来行为方面显著优于现有方法,证明了其有效性。

📝 摘要(中文)

资产检索,即在金融市场中寻找相似资产,对于量化投资决策至关重要。现有方法通常基于历史价格模式或行业分类定义相似性,但这些后向指标无法保证未来的行为一致性。我们认为,有效的资产检索应面向未来:检索到的资产应在未来表现出相关的收益。为此,我们提出了未来对齐的软对比学习(FASCL),这是一个表征学习框架,其软对比损失使用成对的未来收益相关性作为连续监督目标。我们还引入了一种评估协议,旨在直接评估检索到的资产是否具有相似的未来轨迹。对4,229只美国股票的实验表明,FASCL在所有未来行为指标上始终优于13个基线模型。源代码即将发布。

🔬 方法详解

问题定义:论文旨在解决金融领域中横截面资产检索的问题。现有方法主要依赖于历史价格模式或行业分类来定义资产之间的相似性,但这些方法无法保证检索到的资产在未来具有相似的收益表现。因此,如何找到在未来表现出相关收益的资产是本研究要解决的关键问题。

核心思路:论文的核心思路是利用未来收益的相关性作为监督信号,训练一个能够学习到未来对齐的资产表征的模型。通过这种方式,模型可以学习到哪些资产在未来更有可能表现出相似的收益模式,从而实现更有效的资产检索。

技术框架:FASCL框架包含以下主要模块:1) 数据预处理:对历史价格数据进行处理,并计算未来收益的相关性。2) 表征学习:使用神经网络学习资产的表征,该表征能够反映资产之间的未来收益相关性。3) 软对比学习:使用未来收益相关性作为监督信号,通过软对比损失函数优化表征学习模型。4) 资产检索:基于学习到的资产表征,检索与目标资产相似的资产。

关键创新:FASCL的关键创新在于使用未来收益相关性作为软对比学习的监督信号。与传统的对比学习方法不同,FASCL使用连续的未来收益相关性作为目标,而不是简单的正负样本对,这使得模型能够更精细地学习资产之间的相似性。

关键设计:FASCL的关键设计包括:1) 软对比损失函数:该损失函数使用未来收益相关性作为权重,鼓励模型学习到具有相似未来收益的资产的相似表征。2) 未来收益相关性的计算方式:论文中使用了特定的方法来计算未来收益的相关性,以确保其能够准确反映资产之间的未来关系。3) 网络结构:论文中使用了特定的神经网络结构来学习资产表征,该结构能够有效地捕捉资产之间的复杂关系。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,FASCL在所有未来行为指标上始终优于13个基线模型。具体而言,FASCL在预测资产未来收益相关性方面取得了显著的提升,证明了其能够有效地学习到未来对齐的资产表征。这些结果表明,FASCL是一种有效的资产检索方法,具有很高的实际应用价值。

🎯 应用场景

该研究成果可应用于量化投资、风险管理和投资组合构建等领域。通过更准确地识别具有相似未来收益模式的资产,投资者可以构建更稳健的投资组合,降低风险并提高收益。此外,该方法还可以用于发现新的投资机会和识别潜在的风险因素。

📄 摘要(原文)

Asset retrieval--finding similar assets in a financial universe--is central to quantitative investment decision-making. Existing approaches define similarity through historical price patterns or sector classifications, but such backward-looking criteria provide no guarantee about future behavior. We argue that effective asset retrieval should be future-aligned: the retrieved assets should be those most likely to exhibit correlated future returns. To this end, we propose Future-Aligned Soft Contrastive Learning (FASCL), a representation learning framework whose soft contrastive loss uses pairwise future return correlations as continuous supervision targets. We further introduce an evaluation protocol designed to directly assess whether retrieved assets share similar future trajectories. Experiments on 4,229 US equities demonstrate that FASCL consistently outperforms 13 baselines across all future-behavior metrics. The source code will be available soon.