A Contextual Help Browser Extension to Assist Digital Illiterate Internet Users
作者: Christos Koutsiaris
分类: cs.IR, cs.AI, cs.HC
发布日期: 2026-03-18
备注: 9 pages, 5 figures, 2 tables; MSc dissertation reformatted as conference paper; extended version available at github.com/unseen1980/acro-helper
💡 一句话要点
提出一种上下文帮助浏览器扩展,辅助数字素养不足的用户理解技术术语。
🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)
关键词: 浏览器扩展 上下文帮助 数字素养 自然语言处理 大型语言模型
📋 核心要点
- 数字素养不足的用户在理解网页上的技术术语时面临挑战,传统搜索耗时且效率低。
- 该扩展利用技术词典和LLM,通过上下文感知的工具提示,即时提供术语解释,提升用户体验。
- 实验表明,该工具显著提高了用户对技术术语的理解,节省了信息检索时间,且用户体验良好。
📝 摘要(中文)
本文介绍了一种浏览器扩展的设计、实现和评估,该扩展为用户在网页上悬停在技术缩略语和首字母缩写词上时提供上下文帮助。该扩展结合了一个精心策划的技术词典和 OpenAI 的大型语言模型 (LLM),通过轻量级工具提示叠加层提供按需定义。一个双层人工智能 (AI) 管道,包括 Google Cloud 的自然语言处理 (NLP) 分类 API 和 OpenAI 的 ChatGPT,在激活工具提示逻辑之前将每个访问的页面分类为技术相关,从而减少误报检测。一项包含 25 名参与者的混合方法研究评估了该工具对数字素养较低到中等的用户的阅读理解和信息检索时间的影响。结果表明,92% 的参与者表示提高了对技术术语的理解,96% 的参与者确认节省了手动网络搜索的时间,并且所有参与者都认为工具提示不会造成干扰。基于词典的定义平均附加时间为 2135 毫秒,而 AI 生成的定义为 16429 毫秒,每个首字母缩写词的平均手动搜索时间为 17200 毫秒。这项工作展示了一种实用的、实时的弥合数字素养差距的方法,并指出可以将上下文帮助扩展到其他领域,如医学、法律和金融。
🔬 方法详解
问题定义:该论文旨在解决数字素养较低的用户在浏览包含大量技术术语的网页时,难以快速理解这些术语含义的问题。现有方法,如手动搜索,耗时且打断阅读流程,影响用户体验。
核心思路:核心思路是利用浏览器扩展程序,结合预定义的专业词典和大型语言模型,在用户悬停在技术术语上时,实时提供上下文相关的解释。这种按需式的帮助能够显著减少用户手动搜索的时间和精力。
技术框架:该扩展程序包含以下主要模块:1) 页面分类模块:使用Google Cloud NLP API和ChatGPT对网页内容进行分类,判断是否为技术相关页面。2) 术语识别模块:识别网页中的技术术语和缩略语。3) 定义检索模块:首先查找预定义的词典,如果词典中没有,则调用OpenAI的LLM生成定义。4) 工具提示显示模块:将检索到的定义以工具提示的形式显示给用户。
关键创新:该论文的关键创新在于将预定义词典和LLM相结合,实现快速且准确的术语解释。预定义词典保证了常用术语的快速响应,而LLM则能够处理词典中未包含的术语,提高了覆盖率。双层AI管道减少了误报,保证了工具提示的准确性。
关键设计:页面分类模块使用Google Cloud NLP API和ChatGPT进行两阶段判断,提高准确率。定义检索模块优先使用预定义词典,以保证速度。LLM生成定义时,采用了合适的prompt工程,以确保生成的定义简洁明了。
📊 实验亮点
实验结果表明,92%的参与者表示该工具提高了他们对技术术语的理解,96%的参与者确认节省了手动搜索的时间。基于词典的定义平均响应时间为2135毫秒,而AI生成的定义为16429毫秒,均远低于手动搜索的17200毫秒。所有参与者都认为工具提示不会造成干扰。
🎯 应用场景
该研究成果可广泛应用于在线教育、技术文档阅读、专业知识学习等领域。通过提供即时、上下文相关的术语解释,可以显著提升用户的学习效率和阅读体验,尤其对数字素养较低的用户群体具有重要意义。未来可扩展到医学、法律、金融等其他专业领域。
📄 摘要(原文)
This paper describes the design, implementation, and evaluation of a browser extension that provides contextual help to users who hover over technological acronyms and abbreviations on web pages. The extension combines a curated technical dictionary with OpenAI's large language model (LLM) to deliver on-demand definitions through lightweight tooltip overlays. A dual-layer artificial intelligence (AI) pipeline, comprising Google Cloud's Natural Language Processing (NLP) taxonomy API and OpenAI's ChatGPT, classifies each visited page as technology-related before activating the tooltip logic, thereby reducing false-positive detections. A mixed-methods study with 25 participants evaluated the tool's effect on reading comprehension and information-retrieval time among users with low to intermediate digital literacy. Results show that 92% of participants reported improved understanding of technical terms, 96% confirmed time savings over manual web searches, and all participants found the tooltips non-disruptive. Dictionary-based definitions were appended in an average of 2135 ms, compared to 16429 ms for AI-generated definitions and a mean manual search time of 17200 ms per acronym. The work demonstrates a practical, real-time approach to bridging the digital literacy gap and points toward extending contextual help to other domains such as medicine, law, and finance.