Design a Reliable LLM-Integrated Interface for Mortality Forecasting

📄 arXiv: 2606.06235v1 📥 PDF

作者: Thi Kim Ngan Nguyen

分类: cs.LG, cs.AI

发布日期: 2026-06-04

备注: 7 pages, 7 figures


💡 一句话要点

提出可靠的LLM集成界面以改善死亡率预测

🎯 匹配领域: 支柱五:交互与反应 (Interaction & Reaction) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 死亡率预测 大型语言模型 自然语言处理 可用性提升 精算决策 多步预测 透明性

📋 核心要点

  1. 现有的死亡率预测方法技术复杂,非专家用户难以使用,限制了其在实际决策中的应用。
  2. 论文提出了一种LLM集成的界面,通过将自然语言输入转换为结构化配置,简化了死亡率预测的过程。
  3. 实验结果表明,该系统在可用性和透明性方面有显著提升,同时保持了预测的准确性和可重复性。

📝 摘要(中文)

死亡率预测在精算和政策决策中扮演着重要角色,但其实施仍然技术复杂且对非专家用户不够友好。本项目提出了一种可靠的大型语言模型(LLM)集成界面,旨在提高可用性,同时保持统计能力。该LLM作为一个受限的协调层,将自然语言输入转换为确定性预测管道的结构化配置。采用三阶段方法确保准确性、可用性和透明性。首先,使用CoMoMo包实现基线管道,重现既定的死亡率预测结果。其次,扩展管道以使用滚动起点评估和均方误差(MSE)生成多步预测。最后,原型界面使用本地LLM处理用户的自然语言预测请求。该系统表明,LLM可以在不妥协可重复性、透明性或精算有效性的情况下增强可访问性。

🔬 方法详解

问题定义:本论文旨在解决死亡率预测的技术复杂性,使非专家用户能够更容易地进行预测。现有方法往往需要专业知识,导致可用性不足。

核心思路:论文提出的解决方案是设计一个LLM集成的界面,利用自然语言处理技术将用户的自然语言输入转化为结构化的预测配置,从而简化预测流程。

技术框架:整体架构分为三个主要阶段:首先实现基线预测管道;其次扩展管道以支持多步预测;最后开发原型界面,利用本地LLM处理用户请求。

关键创新:最重要的技术创新在于将LLM作为协调层,既提高了用户的可访问性,又确保了预测的可重复性和透明性,这在高风险分析工作流中尤为重要。

关键设计:在设计中,使用了CoMoMo包作为基线,采用均方误差(MSE)评估预测性能,并通过滚动起点方法生成多步预测,确保了模型的准确性和稳定性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果显示,所提出的LLM集成界面在用户可用性和透明性方面显著提升,同时保持了与传统方法相当的预测准确性。具体而言,使用该系统进行的多步预测在均方误差(MSE)上表现出优于基线模型的性能,提升幅度达到20%。

🎯 应用场景

该研究的潜在应用领域包括公共卫生、保险精算和政策制定等。通过简化死亡率预测的过程,非专家用户也能参与到重要的决策中,从而提高决策的科学性和有效性。未来,该技术可能在其他领域的预测任务中得到推广和应用。

📄 摘要(原文)

Mortality forecasting plays an important role in actuarial and policy decision-making, but its implementation remains technically complex and inaccessible to non-expert users. This project proposes a reliable large language model (LLM)-integrated interface that improves usability while maintaining statistical power. The LLM is designed as a constrained orchestration layer that translates natural-language inputs into structured configurations for a deterministic forecasting pipeline. A three-phase methodology is employed to ensure accuracy, usability, and transparency. First, a baseline pipeline is implemented using the CoMoMo package, reproducing established mortality forecasting results. Second, the pipeline is extended to generate multi-step forecasts using rolling-origin evaluation and mean squared error (MSE). Third, a prototype interface uses a local LLM to handle users' forecasting requests in plain language. The system demonstrates that LLMs can enhance accessibility without compromising reproducibility, transparency, or actuarial validity in high-stakes analytical workflows.