InvestAlign: Overcoming Data Scarcity in Aligning Large Language Models with Investor Decision-Making Processes under Herd Behavior
作者: Huisheng Wang, Zhuoshi Pan, Hangjing Zhang, Mingxiao Liu, Hanqing Gao, H. Vicky Zhao
分类: cs.CL, cs.AI, cs.ET, cs.LG
发布日期: 2025-07-09
🔗 代码/项目: GITHUB
💡 一句话要点
InvestAlign:解决羊群效应下LLM在投资者决策对齐中的数据稀缺问题
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 大型语言模型 行为金融学 投资者决策 羊群效应 监督式微调 数据合成 智能投顾
📋 核心要点
- 现有方法依赖大量真实用户数据进行LLM微调,成本高昂且存在隐私风险,限制了其在行为金融学中的应用。
- InvestAlign利用简单投资问题的理论解生成高质量SFT数据集,避免直接依赖真实用户数据,降低成本并保护隐私。
- 实验表明,使用InvestAlign训练的LLM参数收敛速度更快,且在模拟投资者决策时更接近真实用户数据。
📝 摘要(中文)
在行为金融学中,将大型语言模型(LLM)与羊群效应下的投资者决策过程对齐是一个关键挑战,其根本限制在于:监督式微调(SFT)所需的真实用户数据稀缺。虽然SFT可以弥合LLM输出与人类行为模式之间的差距,但它对大量真实数据的依赖带来了巨大的收集成本和隐私风险。我们提出了InvestAlign,这是一个新颖的框架,通过利用类似且简单的最优投资问题的理论解来构建高质量的SFT数据集,而不是复杂的场景。我们的理论分析表明,使用InvestAlign生成的数据训练LLM比使用真实用户数据更快地实现参数收敛,表明了卓越的学习效率。此外,我们开发了InvestAgent,一个使用InvestAlign进行微调的LLM Agent,在简单和复杂的投资问题中,它比预SFT模型更接近真实用户数据。这突出了我们提出的InvestAlign作为一种有前途的方法,它有潜力解决复杂的最优投资问题,并将LLM与羊群效应下的投资者决策过程对齐。我们的代码已在https://github.com/thu-social-network-research-group/InvestAlign上公开。
🔬 方法详解
问题定义:论文旨在解决大型语言模型(LLM)在行为金融学中与投资者决策过程对齐的问题,尤其是在羊群效应影响下。现有方法,即直接使用监督式微调(SFT),需要大量真实用户数据,这导致了高昂的数据收集成本和潜在的隐私泄露风险。因此,如何克服数据稀缺性,高效且安全地将LLM与投资者行为对齐,是本研究要解决的核心问题。
核心思路:InvestAlign的核心思路是利用理论解来合成高质量的SFT数据。具体来说,它不是直接收集复杂的真实用户投资数据,而是选择一些具有明确理论最优解的简单投资问题。通过这些理论解,可以生成大量高质量的“伪数据”,用于训练LLM。这种方法的核心在于,即使是基于简单问题的训练,也能使LLM学习到通用的投资决策模式,从而在更复杂的场景中表现良好。
技术框架:InvestAlign框架主要包含以下几个阶段:1) 问题选择:选择具有明确理论最优解的简单投资问题,例如经典的均值-方差模型。2) 数据生成:基于选定的问题和理论解,生成大量的合成投资决策数据。这些数据包括投资者的风险偏好、预期收益、投资组合选择等。3) 模型微调:使用生成的合成数据对LLM进行监督式微调(SFT),使其学习投资决策模式。4) 模型评估:在真实用户数据上评估微调后的LLM,验证其与真实投资者行为的对齐程度。InvestAgent是基于InvestAlign框架微调后的LLM Agent。
关键创新:InvestAlign最重要的技术创新点在于其数据合成方法。与直接依赖真实用户数据的传统SFT方法不同,InvestAlign利用理论解生成合成数据,从而克服了数据稀缺性和隐私风险。这种方法不仅降低了数据收集成本,而且可以通过控制合成数据的质量和多样性,提高LLM的学习效率和泛化能力。
关键设计:InvestAlign的关键设计包括:1) 问题选择策略:选择具有代表性的简单投资问题,确保其理论解能够反映通用的投资决策原则。2) 数据生成策略:设计合理的数据生成策略,例如,通过调整风险偏好参数来生成不同类型的投资者行为数据。3) 损失函数设计:使用合适的损失函数来指导LLM的学习,例如,最小化LLM预测的投资组合与理论最优解之间的差异。4) 模型结构选择:选择适合处理投资决策问题的LLM模型,例如,基于Transformer的模型。
🖼️ 关键图片
📊 实验亮点
实验结果表明,使用InvestAlign生成的数据训练的LLM比使用真实用户数据训练的LLM具有更快的参数收敛速度,表明其学习效率更高。此外,InvestAgent在简单和复杂的投资问题中,都比预训练的LLM更接近真实用户数据,验证了InvestAlign的有效性。具体性能提升数据未知。
🎯 应用场景
InvestAlign可应用于智能投顾、风险管理、金融教育等领域。通过与投资者决策过程对齐,LLM可以提供更个性化、更符合投资者需求的投资建议和服务。此外,该方法还可以用于分析市场情绪、预测市场风险,并帮助投资者更好地理解金融市场。
📄 摘要(原文)
Aligning Large Language Models (LLMs) with investor decision-making processes under herd behavior is a critical challenge in behavioral finance, which grapples with a fundamental limitation: the scarcity of real-user data needed for Supervised Fine-Tuning (SFT). While SFT can bridge the gap between LLM outputs and human behavioral patterns, its reliance on massive authentic data imposes substantial collection costs and privacy risks. We propose InvestAlign, a novel framework that constructs high-quality SFT datasets by leveraging theoretical solutions to similar and simple optimal investment problems rather than complex scenarios. Our theoretical analysis demonstrates that training LLMs with InvestAlign-generated data achieves faster parameter convergence than using real-user data, suggesting superior learning efficiency. Furthermore, we develop InvestAgent, an LLM agent fine-tuned with InvestAlign, which demonstrates significantly closer alignment to real-user data than pre-SFT models in both simple and complex investment problems. This highlights our proposed InvestAlign as a promising approach with the potential to address complex optimal investment problems and align LLMs with investor decision-making processes under herd behavior. Our code is publicly available at https://github.com/thu-social-network-research-group/InvestAlign.