CrunchLLM: Multitask LLMs for Structured Business Reasoning and Outcome Prediction

📄 arXiv: 2509.10698v2 📥 PDF

作者: Rabeya Tus Sadia, Qiang Cheng

分类: cs.LG, cs.CV

发布日期: 2025-09-12 (更新: 2025-10-11)


💡 一句话要点

CrunchLLM:用于结构化商业推理和结果预测的多任务LLM

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 创业成功预测 结构化数据 非结构化数据 领域自适应 参数高效微调 提示工程 可解释性

📋 核心要点

  1. 现有方法难以有效利用Crunchbase等数据集中异构的结构化和非结构化信息来预测初创公司的成功。
  2. CrunchLLM通过融合结构化公司属性与非结构化文本叙述,并进行参数高效的微调和提示优化,实现领域自适应。
  3. CrunchLLM在Crunchbase初创公司成功预测中实现了超过80%的准确率,显著优于传统方法,并提供可解释的推理过程。

📝 摘要(中文)

预测初创公司的成功(定义为通过收购或首次公开募股实现退出)是创业和创新研究中的一个关键问题。诸如Crunchbase之类的数据集提供了结构化信息(例如,融资轮次、行业、投资者网络)和非结构化文本(例如,公司描述),但有效地利用这种异构数据进行预测仍然具有挑战性。传统的机器学习方法通常仅依赖于结构化特征,并且只能达到中等的准确性,而大型语言模型(LLM)提供了丰富的推理能力,但难以直接适应特定领域的业务数据。我们提出了 extbf{CrunchLLM},一个用于初创公司成功预测的领域自适应LLM框架。CrunchLLM将结构化的公司属性与非结构化的文本叙述相结合,并应用参数高效的微调策略以及提示优化,以使基础模型专门用于创业数据。我们的方法在Crunchbase初创公司成功预测中实现了超过80%的准确性,大大优于传统的分类器和基线LLM。除了预测性能之外,CrunchLLM还提供了可解释的推理轨迹,从而证明了其预测的合理性,从而增强了金融和政策决策者的透明度和可信赖性。这项工作表明,通过领域感知的微调和结构化-非结构化数据融合来调整LLM可以促进创业结果的预测建模。CrunchLLM为风险投资和创新政策中的数据驱动决策提供了一个方法论框架和一个实用工具。

🔬 方法详解

问题定义:论文旨在解决初创公司成功预测的问题,即预测一家初创公司是否能通过收购或IPO成功退出。现有方法,如传统机器学习模型,通常只利用结构化数据,预测准确率有限。而通用LLM虽然具备强大的推理能力,但难以直接适应特定领域的商业数据,缺乏领域知识和针对性。

核心思路:论文的核心思路是利用领域自适应的LLM框架CrunchLLM,将结构化的公司属性(如融资轮次、行业)与非结构化的文本叙述(如公司描述)相结合,从而更全面地理解初创公司的状况。通过参数高效的微调和提示优化,使LLM能够更好地理解和利用创业领域的数据。

技术框架:CrunchLLM框架包含以下几个主要步骤:1) 数据准备:收集和整理Crunchbase等数据集中的结构化和非结构化数据。2) 数据融合:将结构化数据和非结构化文本进行有效融合,例如通过prompt工程将结构化数据融入到文本提示中。3) 模型微调:使用参数高效的微调策略(如LoRA)在预训练的LLM基础上进行微调,使其适应创业领域的数据。4) 预测和推理:使用微调后的LLM进行初创公司成功预测,并提供可解释的推理轨迹。

关键创新:论文的关键创新在于领域自适应的LLM框架CrunchLLM,它有效地融合了结构化和非结构化数据,并利用参数高效的微调策略,使LLM能够更好地理解和利用创业领域的数据。与传统方法相比,CrunchLLM能够更准确地预测初创公司的成功,并提供可解释的推理过程。

关键设计:论文采用了参数高效的微调策略,例如LoRA,以减少微调所需的计算资源。同时,论文还使用了prompt工程,将结构化数据融入到文本提示中,从而使LLM能够更好地利用这些数据。具体的损失函数和网络结构细节可能依赖于所使用的基础LLM和微调策略。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

CrunchLLM在Crunchbase初创公司成功预测任务中取得了超过80%的准确率,显著优于传统的分类器和基线LLM。这一结果表明,通过领域自适应的微调和结构化-非结构化数据融合,LLM能够有效地应用于特定领域的预测任务,并取得优异的性能。

🎯 应用场景

CrunchLLM可应用于风险投资领域,帮助投资者评估初创公司的潜力,做出更明智的投资决策。此外,该模型还可用于创新政策制定,为政府提供数据支持,以促进创业和创新生态系统的发展。该研究的未来影响在于推动数据驱动的创业和创新决策,提高资源配置效率。

📄 摘要(原文)

Predicting the success of start-up companies, defined as achieving an exit through acquisition or IPO, is a critical problem in entrepreneurship and innovation research. Datasets such as Crunchbase provide both structured information (e.g., funding rounds, industries, investor networks) and unstructured text (e.g., company descriptions), but effectively leveraging this heterogeneous data for prediction remains challenging. Traditional machine learning approaches often rely only on structured features and achieve moderate accuracy, while large language models (LLMs) offer rich reasoning abilities but struggle to adapt directly to domain-specific business data. We present \textbf{CrunchLLM}, a domain-adapted LLM framework for startup success prediction. CrunchLLM integrates structured company attributes with unstructured textual narratives and applies parameter-efficient fine-tuning strategies alongside prompt optimization to specialize foundation models for entrepreneurship data. Our approach achieves accuracy exceeding 80\% on Crunchbase startup success prediction, significantly outperforming traditional classifiers and baseline LLMs. Beyond predictive performance, CrunchLLM provides interpretable reasoning traces that justify its predictions, enhancing transparency and trustworthiness for financial and policy decision makers. This work demonstrates how adapting LLMs with domain-aware fine-tuning and structured--unstructured data fusion can advance predictive modeling of entrepreneurial outcomes. CrunchLLM contributes a methodological framework and a practical tool for data-driven decision making in venture capital and innovation policy.