Dynamic Tactile Sensing System and Soft Actor Critic Reinforcement Learning for Inclusion Characterization

📄 arXiv: 2601.16061v1 📥 PDF

作者: John Bannan, Nazia Rahman, Chang-Hee Won

分类: eess.SY

发布日期: 2026-01-22


💡 一句话要点

提出基于动态触觉传感与强化学习的内含物定位与表征系统

🎯 匹配领域: 支柱一:机器人控制 (Robot Control) 支柱二:RL算法与架构 (RL & Architecture)

关键词: 触觉传感 强化学习 Soft Actor Critic 机器人 内含物表征

📋 核心要点

  1. 现有方法在嵌入式内含物(如肿瘤)的定位和表征方面存在精度和效率的挑战,依赖人工操作易受主观因素影响。
  2. 该论文提出一种动态触觉传感系统,结合机器人触觉和强化学习,通过动态询问程序实现内含物的精确定位和机械属性识别。
  3. 实验结果表明,该系统在内含物大小估计方面优于人类专家,为乳腺肿瘤等应用提供了更准确和自主的表征方法。

📝 摘要(中文)

本文提出了一种动态触觉传感系统,该系统结合了机器人触觉传感和强化学习,用于定位和表征嵌入式内含物。该系统集成了一个双臂机器人和一个光学触觉成像传感器,并利用Soft Actor Critic算法,基于像素强度奖励获取触觉数据。开发了一种用于触觉探索的动态询问程序,使机器人能够首先定位内含物,然后细化其位置以进行精确成像。在聚二甲基硅氧烷(PDMS)模型上进行的实验验证表明,与人类专家操作员的7.84%和6.87%相比,使用触觉Soft Actor Critic模型的机器人对软硬内含物的大小估计误差分别达到了2.61%和5.29%。结果还表明,动态触觉传感系统能够定位嵌入式内含物并自主确定其机械性能,这在乳腺肿瘤表征等应用中非常有用。

🔬 方法详解

问题定义:论文旨在解决嵌入式内含物(例如,在生物组织中的肿瘤)的自动定位和精确表征问题。现有方法通常依赖于人工触诊或静态触觉传感,这些方法存在主观性强、效率低、难以精确量化内含物机械属性等痛点。

核心思路:论文的核心思路是利用机器人触觉感知和强化学习相结合,构建一个动态的触觉探索系统。通过强化学习算法,机器人能够自主学习最优的触觉探索策略,从而高效地定位内含物并准确地估计其大小和硬度。动态询问程序允许机器人根据已获得的触觉信息调整探索策略,实现自适应的精确成像。

技术框架:该系统主要包含以下几个模块:1) 双臂机器人平台,用于执行触觉探索任务;2) 光学触觉成像传感器,用于获取触觉数据;3) Soft Actor Critic (SAC) 强化学习算法,用于训练机器人自主探索策略;4) 动态询问程序,用于根据触觉反馈调整探索路径。整体流程是:机器人通过触觉传感器与目标物体交互,获取触觉图像数据,SAC算法根据像素强度奖励学习最优策略,动态询问程序根据当前触觉信息调整下一步的探索位置,最终实现内含物的定位和表征。

关键创新:该论文的关键创新在于将动态触觉传感与强化学习相结合,实现了内含物的自主定位和表征。与传统的静态触觉传感方法相比,该方法能够根据触觉反馈动态调整探索策略,提高了定位和表征的精度和效率。此外,使用Soft Actor Critic算法能够学习到更鲁棒和高效的触觉探索策略。

关键设计:奖励函数的设计是关键。论文中使用像素强度作为奖励信号,鼓励机器人探索能够提供更多信息的区域。具体来说,奖励与触觉图像中像素强度的变化相关,变化越大,奖励越高。SAC算法使用两个Q函数和一个策略网络,通过最大化期望累积奖励来学习最优策略。动态询问程序通过调整机器人的运动轨迹,使其能够更精确地扫描内含物区域。

📊 实验亮点

实验结果表明,使用触觉Soft Actor Critic模型的机器人在软硬内含物的大小估计方面,误差分别仅为2.61%和5.29%,显著优于人类专家操作员的7.84%和6.87%。这表明该系统在内含物表征方面具有更高的精度和可靠性,验证了动态触觉传感与强化学习结合的有效性。

🎯 应用场景

该研究成果可应用于医疗领域,例如乳腺肿瘤的早期检测和精确表征,辅助医生进行诊断和治疗方案制定。此外,该技术还可扩展到其他领域,如材料检测、质量控制和机器人辅助装配等,用于检测隐藏缺陷或评估材料的机械性能。未来,该技术有望实现更智能、更高效的自动化检测和操作。

📄 摘要(原文)

This paper presents the Dynamic Tactile Sensing System that utilizes robotic tactile sensing in conjunction with reinforcement learning to locate and characterize embedded inclusions. A dual arm robot is integrated with an optical Tactile Imaging Sensor that utilizes the Soft Actor Critic Algorithm to acquire tactile data based on a pixel intensity reward. A Dynamic Interrogation procedure for tactile exploration is developed that enables the robot to first localize inclusion and refine their positions for precise imaging. Experimental validation conducted on Polydimethylsiloxane phantoms demonstrates that the robot using the Tactile Soft Actor Critic Model was able to achieve size estimation errors of 2.61% and 5.29% for soft and hard inclusions compared to 7.84% and 6.87% for expert human operators. Results also show that Dynamic Tactile Sensing System was able to locate embedded inclusions and autonomously determine their mechanical properties, useful in applications such as breast tumor characterization.