What Your Posts Reveal: A Benchmark and Agentic Framework for User-Level Privacy Leakage on Social Media

📄 arXiv: 2606.06784v1 📥 PDF

作者: Zifan Peng, Yini Huang, Aiwen Lu, Qiming Ye, Peixian Zhang, Jingyi Zheng, Yule Liu, Xuechao Wang, Xinlei He, Jiaheng Wei

分类: cs.CR, cs.AI, cs.CY

发布日期: 2026-06-05


💡 一句话要点

提出SopriBench和Argus框架以解决社交媒体用户隐私泄露问题

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 用户隐私 社交媒体 多模态分析 隐私泄露 基准评估 信息安全 机器学习

📋 核心要点

  1. 核心问题:现有研究缺乏统一的用户级多模态隐私泄露基准和评估指标,无法准确捕捉泄露的严重性。
  2. 方法要点:提出SopriBench基准和隐私暴露评分(PES),并引入Argus框架进行累积泄露推断,形成隐私档案。
  3. 实验或效果:Argus在跨帖子泄露上实现了0.55的PES,相较于最强基线提升了25%,显示出显著的效果提升。

📝 摘要(中文)

公共社交媒体帖子通过文本、图像或元数据中散布的微弱线索揭示私人信息。这种泄露通常是累积性的和跨帖子的,单独看似无害的线索可能共同暴露用户的家庭、工作场所或日常活动。然而,现有研究缺乏用户级多模态隐私泄露的统一基准和评估指标。为了解决这些问题,本文提出了SopriBench,一个基于泄露模式的合成基准,并引入隐私暴露评分(PES),该评分通过上下文敏感性加权值的粒度。此外,本文还提出了Argus,一个无训练的代理框架,用于累积泄露推断,最终在跨帖子泄露上实现了0.55的PES,相较于最强基线提升了25%。

🔬 方法详解

问题定义:本文旨在解决社交媒体上用户隐私泄露的评估问题,现有方法无法有效捕捉多模态信息的累积泄露效果,缺乏统一的基准和评估指标。

核心思路:通过构建SopriBench基准和隐私暴露评分(PES),结合上下文敏感性来评估信息泄露的严重性,同时引入Argus框架进行推断,形成用户隐私档案。

技术框架:整体架构包括SopriBench基准的构建、PES的计算和Argus框架的推断过程。SopriBench基于Rednote和Instagram的私有参考语料库,涵盖50个用户档案和1569张图像。Argus通过累积证据形成假设并验证支持证据。

关键创新:最重要的技术创新在于提出了SopriBench和PES,提供了一个系统化的评估框架,并通过Argus实现了无训练的累积泄露推断,显著提升了隐私泄露的识别能力。

关键设计:在PES的设计中,考虑了上下文敏感性和信息粒度的加权,Argus框架则通过假设形成和证据验证的方式进行推断,确保了隐私档案的准确性和完整性。

🖼️ 关键图片

fig_0
fig_1
fig_2

📊 实验亮点

实验结果表明,Argus框架在跨帖子泄露的隐私暴露评分(PES)上达到了0.55,相较于最强基线提升了25%。这一显著提升表明了新方法在多模态隐私泄露推断中的有效性,尤其是在处理累积信息时的优势。

🎯 应用场景

该研究的潜在应用领域包括社交媒体平台的隐私保护、用户信息安全评估以及相关法律法规的制定。通过提供有效的隐私泄露评估工具,能够帮助用户更好地管理个人信息,提升社交媒体使用的安全性。未来,该框架可能影响社交媒体的设计和隐私政策的制定,促进更安全的在线环境。

📄 摘要(原文)

Public social media posts can reveal private information through weak cues scattered across text, images, or metadata. Such leakage is often cumulative and cross-post: cues that appear harmless in isolation may jointly expose a user's home, workplace, or routine. However, current research lacks a unified benchmark for user-level multimodal privacy leakage and an evaluation metric that captures exposure severity beyond binary accuracy. To address these gaps, we propose SopriBench, a synthetic benchmark guided by leakage patterns abstracted from a private reference corpus of Rednote and Instagram accounts, covering 50 user profiles and 1,569 images with attributes, contextual sensitivity, granularity, leakage type, inference difficulty, and supporting evidence. We further introduce the Privacy Exposure Score (PES), which weights value granularity by contextual sensitivity. Inspired by abductive reasoning, we introduce Argus, a training-free agentic framework for cumulative leakage inference. Argus forms hypotheses from accumulated evidence, verifies supporting evidence, and aggregates cross-post cues into privacy profiles, achieving 0.55 PES, a 25% improvement over the strongest baseline, with the largest gain on cross-post leakage.