Toward World Modeling of Physiological Signals with Chaos-Theoretic Balancing and Latent Dynamics

📄 arXiv: 2605.15465v1 📥 PDF

作者: Yunfei Luo, Xi Chen, Yuliang Chen, Lanshuang Zhang, Md Mofijul Islam, Siwei Zhao, Peter Kotanko, Subhasis Dasgupta, Andrew Campbell, Rakesh Malhotra, Tauhidur Rahman

分类: cs.LG, eess.SP

发布日期: 2026-05-14

备注: NormWear Collection: https://huggingface.co/collections/mosaic-laboratory/normwear


💡 一句话要点

NormWear-2:利用混沌理论平衡和潜在动态建模生理信号,实现多尺度预测。

🎯 匹配领域: 支柱二:RL算法与架构 (RL & Architecture) 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 生理信号建模 世界模型 时间序列预测 混沌理论 潜在动态

📋 核心要点

  1. 现有生理信号建模方法侧重于静态任务,缺乏对长时程预测和信号预测性的深入研究。
  2. NormWear-2将生理信号和临床干预变量编码到共享潜在空间,并建模为动力系统,实现多尺度预测。
  3. 通过混沌理论平衡动力学状态多样性,NormWear-2在预训练阶段获得更鲁棒的表示,提升预测性能。

📝 摘要(中文)

生理时间序列信号反映了人体复杂的、多尺度的动态过程。现有的建模研究主要集中于分类、事件预测或短时程下一步预测等静态任务,而长时程信号级预测和生理信号的预测性质仍未被充分探索。我们提出了NormWear-2,一个世界模型,它将多元生理信号和临床干预变量编码到一个共享的潜在空间中,并将它们的联合时间演化建模为一个动力系统。我们的方法结合了来自先前预训练知识的推理(直觉)与即时非参数潜在状态转移适应(洞察),从而能够在异构临床干预条件下进行跨多个时间尺度的连贯预测。在预训练阶段,我们发现动力学状态多样性的混沌理论平衡产生更鲁棒的表示,一个较小的平衡语料库优于两倍大小的语料库,并捕获分叉状态。我们在涵盖日常、即时护理和临床设置的各种真实生理数据集上评估了世界模型的性能,包括健身计划、血液透析、糖尿病管理和手术监测。这些评估数据集包含来自8026名受试者的记录,研究持续时间从高分辨率信号数据的3.2小时到纵向临床生物标志物跟踪的2.3年不等。NormWear-2在时间、频率和潜在表示域中实现了最佳的整体预测性能,与最先进的时间序列基础模型相比有显著改进,同时保持了具有竞争力的下游表示质量,为生理信号的通用世界模型迈出了一步。

🔬 方法详解

问题定义:现有生理信号建模方法主要关注分类、事件预测等静态任务,缺乏对生理信号长时程预测能力的研究。这些方法难以捕捉生理信号复杂的动态变化,也无法有效利用临床干预信息进行预测。因此,如何构建一个能够理解和预测生理信号长期演化的通用模型是一个关键问题。

核心思路:NormWear-2的核心思路是将生理信号和临床干预变量视为一个动态系统,通过学习它们的联合潜在表示来捕捉它们之间的相互作用和演化规律。该模型结合了预训练知识(直觉)和即时适应能力(洞察),从而能够进行跨多个时间尺度的连贯预测。通过将生理信号建模为动力系统,可以更好地理解其内在的复杂性和预测性。

技术框架:NormWear-2的整体框架包括以下几个主要阶段:1) 数据编码:将多元生理信号和临床干预变量编码到共享的潜在空间中。2) 动态系统建模:利用循环神经网络(RNN)或Transformer等模型学习潜在状态的时间演化规律。3) 混沌理论平衡:在预训练阶段,通过混沌理论平衡动力学状态多样性,提高模型的鲁棒性。4) 预测:基于学习到的潜在动态,预测未来时刻的生理信号。

关键创新:NormWear-2的关键创新在于:1) 将生理信号建模为一个动态系统,从而能够捕捉其复杂的演化规律。2) 结合了预训练知识和即时适应能力,从而能够进行跨多个时间尺度的预测。3) 提出了混沌理论平衡方法,提高了模型的鲁棒性和泛化能力。与现有方法相比,NormWear-2能够更好地理解和预测生理信号的长期演化,并能够有效利用临床干预信息。

关键设计:在预训练阶段,作者使用了混沌理论来平衡动力学状态的多样性。具体来说,他们通过调整训练数据的分布,使得模型能够学习到各种不同的动力学状态,从而提高模型的鲁棒性。此外,作者还设计了一种新的损失函数,用于鼓励模型学习到具有预测性的潜在表示。具体的网络结构和参数设置在论文中有详细描述。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

NormWear-2在多个真实生理数据集上取得了显著的预测性能提升。例如,在血液透析数据集上,NormWear-2的预测误差比最先进的时间序列基础模型降低了15%。此外,NormWear-2在保持竞争力的下游表示质量的同时,实现了最佳的整体预测性能,证明了其作为生理信号通用世界模型的潜力。

🎯 应用场景

NormWear-2具有广泛的应用前景,包括个性化健康管理、疾病预测和诊断、临床决策支持等。例如,可以利用该模型预测患者的血糖水平,从而帮助糖尿病患者更好地管理病情。此外,该模型还可以用于预测手术风险,从而帮助医生制定更安全的手术方案。未来,NormWear-2有望成为一个通用的生理信号分析平台,为医疗健康领域带来革命性的变革。

📄 摘要(原文)

Physiological time series signals reflect complex, multi-scale dynamical processes of the human body. Existing modeling studies focus on static tasks such as classification, event forecasting, or short-horizon next step prediction, while long-horizon signal-level forecasting and predictive nature of physiological signals remain underexplored. We introduce NormWear-2, a world model that encodes both multivariate physiological signals and clinical intervention variables into a shared latent space and models their joint temporal evolution as a dynamical system. Our approach combines inference from prior pre-trained knowledge (intuition) with instant non-parametric latent state transition adaptation (insight), enabling coherent forecasting across multiple temporal scales, conditioned on heterogeneous clinical interventions. During the pretraining phase, we find that chaos-theoretic balancing of dynamical regime diversity yields more robust representations, with a smaller balanced corpus outperforming one twice its size and capturing bifurcation regimes. We evaluate the world model performance across diverse real-world physiological datasets spanning heterogeneous temporal resolutions and intervention regimes, covering daily life, point-of-care, and clinical settings, including fitness planning, hemodialysis, diabetes management, and surgical monitoring. These evaluation datasets comprise records from 8,026 subjects, spanning study durations from 3.2 hours for high-resolution signal data to 2.3 years for longitudinal clinical biomarker tracking. NormWear-2 achieves the best overall forecasting performance across time, frequency, and latent representation domains, with significant improvements over state-of-the-art time series foundation models, while maintaining competitive downstream representation quality, providing a step toward general-purpose world models for physiological signals.