Leveraging LLMs for Predictive Insights in Food Policy and Behavioral Interventions

📄 arXiv: 2411.08563v1 📥 PDF

作者: Micha Kaiser, Paul Lohmann, Peter Ochieng, Billy Shi, Cass R. Sunstein, Lucia A. Reisch

分类: cs.AI

发布日期: 2024-11-13


💡 一句话要点

利用微调LLM预测食物政策和行为干预的效果,提升政策制定的数据驱动性。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 大型语言模型 食物政策 行为干预 预测模型 政策评估

📋 核心要点

  1. 现有食物政策评估面临外部有效性挑战,难以确定政策在特定环境下的有效性。
  2. 论文提出微调大型语言模型(LLM)来预测食物政策和行为干预的效果方向。
  3. 实验表明,微调后的LLM在约80%的案例中能准确预测饮食相关影响的变化方向。

📝 摘要(中文)

食物消费和生产是全球温室气体排放的重要来源,因此是减缓气候变化和维持地球宜居性的关键切入点。过去二十年,食物政策倡议探索了重塑生产和消费模式的干预措施,重点是减少食物浪费和控制反刍动物肉类的消费。虽然“什么有效”的证据不断改进,但由于外部有效性挑战,评估哪些政策在特定背景下是适当和有效的仍然很困难。本文表明,经过微调的大型语言模型(LLM)可以准确预测约80%的实证研究中,饮食相关影响(如食物选择、销售、浪费)因行为干预和政策而产生的变化方向。大约需要75个提示才能达到最佳效果,超过此点性能会表现出灾难性损失的迹象。我们的研究结果表明,更多的输入细节可以提高预测准确性,但该模型在未见过的研究中仍然面临挑战,突显了代表性训练样本的重要性。随着LLM的不断改进和多样化,它们有望推动数据驱动、循证决策。

🔬 方法详解

问题定义:现有食物政策评估方法难以泛化到不同情境,因为食物消费行为受多种因素影响,导致外部有效性不足。因此,如何快速、准确地评估政策在特定环境下的潜在影响,是政策制定者面临的挑战。

核心思路:利用大型语言模型(LLM)的强大语言理解和推理能力,通过学习已有的食物政策干预研究数据,使LLM能够预测新的政策干预可能产生的结果。核心在于将LLM视为一个知识库和推理引擎,通过微调使其适应食物政策评估任务。

技术框架:该研究采用了一种基于提示工程和微调的策略。首先,收集大量的食物政策干预研究数据,包括政策描述、干预措施和结果指标。然后,设计一系列提示(prompt),引导LLM理解研究内容并进行预测。最后,使用收集到的数据对LLM进行微调,使其更好地适应食物政策评估任务。整体流程包括数据收集、提示设计、模型微调和结果评估四个阶段。

关键创新:该研究的关键创新在于将LLM应用于食物政策评估领域,并证明了LLM在预测政策干预效果方面的潜力。与传统的统计模型相比,LLM能够处理更复杂的文本信息,并捕捉到政策干预与结果之间的非线性关系。此外,通过提示工程,可以灵活地控制LLM的预测行为,使其更好地适应不同的评估场景。

关键设计:为了获得最佳性能,研究人员尝试了大约75个不同的提示。输入细节的丰富程度对预测准确性有显著影响,更详细的输入信息通常能提高预测的准确性。然而,模型在处理未见过的研究时仍面临挑战,这表明训练样本的代表性至关重要。此外,研究发现,超过一定数量的提示后,模型性能会急剧下降,这可能与过拟合有关。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,经过微调的LLM能够以约80%的准确率预测食物政策和行为干预对饮食相关影响(如食物选择、销售、浪费)产生的变化方向。研究还发现,输入细节的丰富程度对预测准确性有显著影响,但模型在处理未见过的研究时仍面临挑战,突显了训练样本代表性的重要性。性能在提示数量达到75左右时达到峰值,之后出现性能下降。

🎯 应用场景

该研究成果可应用于食品政策制定、公共卫生干预、以及消费者行为研究等领域。政策制定者可以利用该模型预测不同政策干预措施的潜在效果,从而制定更有效、更具针对性的政策。企业可以利用该模型预测消费者对新产品的反应,从而优化产品设计和营销策略。此外,该模型还可以用于评估现有政策的实施效果,为政策调整提供数据支持。

📄 摘要(原文)

Food consumption and production contribute significantly to global greenhouse gas emissions, making them crucial entry points for mitigating climate change and maintaining a liveable planet. Over the past two decades, food policy initiatives have explored interventions to reshape production and consumption patterns, focusing on reducing food waste and curbing ruminant meat consumption. While the evidence of "what works" improves, evaluating which policies are appropriate and effective in specific contexts remains difficult due to external validity challenges. This paper demonstrates that a fine-tuned large language model (LLM) can accurately predict the direction of outcomes in approximately 80\% of empirical studies measuring dietary-based impacts (e.g. food choices, sales, waste) resulting from behavioral interventions and policies. Approximately 75 prompts were required to achieve optimal results, with performance showing signs of catastrophic loss beyond this point. Our findings indicate that greater input detail enhances predictive accuracy, although the model still faces challenges with unseen studies, underscoring the importance of a representative training sample. As LLMs continue to improve and diversify, they hold promise for advancing data-driven, evidence-based policymaking.