Variability-Driven User-Story Generation using LLM and Triadic Concept Analysis

📄 arXiv: 2504.08666v1 📥 PDF

作者: Alexandre Bazin, Alain Gutierrez, Marianne Huchard, Pierre Martin, Yulin, Zhang

分类: cs.SE, cs.AI

发布日期: 2025-04-11

备注: 20th International Conference on Evaluation of Novel Approaches to Software Engineering April 4-6, 2025, in Porto, Portugal

期刊: Proceedings of ENASE 2025; SciTePress, pages 618-625 (2025)

DOI: 10.5220/0013360500003928


💡 一句话要点

结合TCA和LLM,提出一种基于变异性的用户故事生成方法,用于软件产品线需求工程。

🎯 匹配领域: 支柱九:具身大模型 (Embodied Foundation Models)

关键词: 用户故事生成 软件产品线 三元概念分析 大型语言模型 需求工程

📋 核心要点

  1. 软件产品线需求工程面临为相似系统家族生成用户故事集的挑战,传统方法难以有效利用系统间的变异性。
  2. 该方法结合TCA提取系统家族的变异性规则,并利用LLM根据设计者的选择生成和完善用户故事集。
  3. 通过对67个网站用户故事集的评估,验证了该方法在生成用户故事方面的有效性。

📝 摘要(中文)

本文提出了一种结合三元概念分析(TCA)和大型语言模型(LLM)提示的方法,用于为软件产品线中的新系统生成用户故事集。该方法利用现有系统家族的变异性逻辑,首先计算三维变异性,将其表达为TCA蕴涵集。然后,为设计者提供可理解的设计选项,并捕获设计者的选择。接着,根据第一步中识别的蕴涵关系,提出一个初步的用户故事集,并验证其有效性,必要时进行补充。最后,利用LLM生成更全面的网站。该过程使用包含67个类似用途网站的用户故事集的数据集进行了评估。

🔬 方法详解

问题定义:论文旨在解决软件产品线中,如何利用现有系统家族的变异性逻辑,为新系统自动生成用户故事集的问题。现有方法通常难以有效捕捉和利用系统间的变异性,导致生成的用户故事集不够全面或与系统需求不符。

核心思路:论文的核心思路是结合三元概念分析(TCA)和大型语言模型(LLM)。TCA用于提取系统家族的变异性规则,LLM用于根据这些规则生成和完善用户故事集。通过这种方式,可以更好地利用现有系统的知识,提高用户故事生成的效率和质量。

技术框架:该方法包含以下几个主要阶段:1) 使用TCA计算三维变异性,将其表达为TCA蕴涵集;2) 向设计者提供可理解的设计选项;3) 捕获设计者的选择;4) 提出一个初步的用户故事集,该集合对应于设计者的选择;5) 根据第一步中识别的蕴涵关系,验证用户故事集的有效性,并在必要时进行补充;6) 利用LLM生成更全面的网站。

关键创新:该方法的主要创新在于将TCA和LLM结合起来,用于用户故事生成。TCA能够有效地提取系统家族的变异性规则,而LLM则能够根据这些规则生成和完善用户故事集。这种结合使得该方法能够更好地利用现有系统的知识,提高用户故事生成的效率和质量。

关键设计:TCA的具体实现依赖于对系统、角色和功能的三元关系进行分析,提取蕴涵关系。LLM的使用方式是通过prompt工程,将TCA提取的规则和设计者的选择作为prompt输入,引导LLM生成符合要求的用户故事。具体的prompt设计和LLM的选择(未知)是影响最终效果的关键因素。

📊 实验亮点

该方法使用包含67个类似用途网站的用户故事集的数据集进行了评估,结果表明该方法能够有效地生成用户故事集,并能够根据设计者的选择进行定制。具体的性能数据和对比基线(未知),但实验结果验证了该方法的可行性。

🎯 应用场景

该研究成果可应用于软件产品线工程、需求工程等领域,帮助开发人员快速生成满足特定需求的软件系统用户故事集,降低开发成本,缩短开发周期。尤其适用于需要快速定制和迭代的软件产品开发场景,具有重要的实际应用价值。

📄 摘要(原文)

A widely used Agile practice for requirements is to produce a set of user stories (also called ``agile product backlog''), which roughly includes a list of pairs (role, feature), where the role handles the feature for a certain purpose. In the context of Software Product Lines, the requirements for a family of similar systems is thus a family of user-story sets, one per system, leading to a 3-dimensional dataset composed of sets of triples (system, role, feature). In this paper, we combine Triadic Concept Analysis (TCA) and Large Language Model (LLM) prompting to suggest the user-story set required to develop a new system relying on the variability logic of an existing system family. This process consists in 1) computing 3-dimensional variability expressed as a set of TCA implications, 2) providing the designer with intelligible design options, 3) capturing the designer's selection of options, 4) proposing a first user-story set corresponding to this selection, 5) consolidating its validity according to the implications identified in step 1, while completing it if necessary, and 6) leveraging LLM to have a more comprehensive website. This process is evaluated with a dataset comprising the user-story sets of 67 similar-purpose websites.