基于多源数据的微服务系统失败测试用例诊断

简介

本文介绍由南开大学、华为云及清华大学共同合作的论文:基于多源数据的微服务系统失败测试用例诊断。该论文已被FSE 2024(The ACM International Conference on the Foundations of Software Engineering) 会议录用,论文标题为: Fault Diagnosis for Test Alarms in Microservices Through Multi-source Data。

作者:张圣林,朱俊,郝博文,孙永谦,聂晓辉,朱静雯,刘喜临,李小倩,马宇驰,裴丹


随着微服务系统规模的扩张,保障微服务系统的稳定性愈发重要,大量的测试用例被设计用于检测微服务系统相关功能的可靠性,随之而来的是测试用例失败产生的大量测试告警。手动诊断这些告警对测试人员来说非常耗时耗力,因此自动化的测试告警故障诊断应运而生。测试告警中的故障诊断包括测试失败的故障分类和根因定位,能够帮助测试人员更加高效地处理日益增多的失败测试用例。然而,由于微服务系统的复杂性,已有的诊断测试告警的方法无法满足测试人员对于诊断准确度和精度的要求。

因此,文章提出了一种针对微服务测试告警的新型故障诊断框架 SynthoDiag ,通过知识图谱联合分析微服务系统测试过程中产生的多源日志(执行机日志、Trace日志和测试用例信息等)进行故障诊断。同时提出了根因关联和位置价值(EFA-PV)算法,用于定位与测试告警相关的日志行,减少测试人员的分析量。此外,文章采用一种高效的基于日志块的过滤方法,筛除测试过程中与故障无关的日志内容,显著提升了故障诊断的整体性能。SynthoDiag在来自华为云的大规模数据集上进行了系统评估。结果显示,SynthoDiag在故障分类的Micro-F1和Macro-F1评分上分别比基线方法提高了21%和30%,并且在故障定位的Top-5准确率达到了81.9%,显著超过了之前的方法。

背 景

系统集成测试(SIT)阶段的测试用例,包括一系列操作及其相应的检查点,每个测试用例用于测试系统的特定功能或面对特定情况的处理能力。在SIT中,当测试操作的结果与预期不符时,测试用例视为失败并会触发告警。测试失败可能是由于不同的因素导致的,包括但不限于:网络环境不稳定、测试步骤设计错误或系统故 障等。而针对不同的失败原因,存在相应的处理方案,因此将失败的测试用例按照失败的原因进行分类, 能够帮助测试人员快速确定处理优先级和选择解决方案。

按照失败原因可以将失败测试用例分为四个类别:环境问题、脚本缺陷、工具缺陷和服务问题。环境问题涉及外部环境因素导致的故障,而脚本缺陷是由测试脚本设计的不合理引起的,而工具缺陷主要是由于测试工具的故障,这里三类问题并不会暴露系统自身的潜在问题,通常需要调试测试环境、更正测试脚本、更新测试工具等方式进行处理。服务问题是最关键的类别,主要是由于微服务系统本身的缺陷所导致的,深入分析这类失败测试用例,有助于发现潜在的服务问题并采取预防措施以避免严重事件。

微服务系统中的多源日志在诊断过程中起着关键作用,因为它们提供了有关服务和操作的信息。每个测试用例会生成三种来源的日志,如图1所示:位于用户侧的执行机日志、位于服务器侧的 Trace 日志和测试人员预先编写的测试用例信息。有效地对这三种来源的日志进行联合分析,将能够更加全面有效地对失败测试用例进行建模,并在此基础上实现更加精准的故障诊断。本文的故障诊断包含对失败测试用例进行故障分类和定位,其中故障分类是确定新用例属于哪一个现有的故障类别,而故障定位是识别和突出显示最有可能与根本原因相关的特定日志内容,从而帮助测试人员快速识别和解决故障。

图1:多源日志样例
图1:多源日志样例

研究挑战

挑战1:日志格式不统一

不同格式的多源日志使得之前的方法在利用这些日志上效果不佳,尤其是在整合半结构化的执行机日志与具有跨度的树结构化的 Trace日志时。

挑战2:失败无关日志内容的干扰

在失败的测试用例的日志中,并非所有日志内容都与测试失败相关。这些与测试失败无关的日志内容占了很大比例,会干扰提取故障特征。而现有方法不能有效地过滤掉这些无关的日志内容的同时保留相关的日志内容。

挑战3:失败相关日志内容定位不准确

由于微服务系统及其测试脚本频繁的软件升级和配置变更,即使是同一故障类别的测试用例,其故障日志的内容也可能不同。因此,历史测试用例中的故障日志内容可能与新失败的测试用例中的不同,导致现有方法无法提供足够的参考信息,以便在新失败的测试用例中定位故障日志。

结构设计

SynthoDiag框架包括三个主要组成部分:日志过滤、用例嵌入和故障诊断,如图2所示。在解析失败测试用例的日志时,SynthoDiag首先基于日志块过滤掉与测试失败无关的日志内容(解决挑战2)。然后,基于过滤后与测试失败相关的日志内容构建失败测试用例的知识图谱,有效整合不同来源的日志内容(解决挑战1)。接下来,SynthoDiag利用语义信息通过知识图嵌入技术将每个失败的测试用例嵌入到一个向量中,并将历史失败的测试用例的向量和标签将存储在用例分类库中。当需要诊断新的失败测试用例时,SynthoDiag使用相同的步骤获取该测试用例的用例向量和知识图谱,然后输出故障类别并定位测试用例中指示故障的日志内容(解决挑战3)。

在这里插入图片描述

图2:SynthoDiag整体工作流程

实验评估

文章将提出的 SynthoDiag 与四种基线方法在华为云某产品数据集上的应用进行比较分析,以评估方法的有效性。图3展示了 SynthoDiag与基线方法在F1分数、Top-5准确率方面的差异。总体来说,SynthoDiag 在所有基线方法中表现最佳,Micro-F1分数为 0.872,Macro-F1分数为0.891。这些分数比最佳基线方法分别高出21%的Micro-F1分数和30%的Macro-F1分数。具体而言,尽管 CAM 的 Micro-F1 分 数为 0.761,其Macro-F1分数为 0.587 较低,其他三个基线方法在 Macro-F1 分数上的表现也较 差,这显示了SynthoDiag在故障分类工作上的优越性。同时,SynthoDiag 在故障定位上也展示出最佳性能,Top-5 准确率为0.819,说明基于模板或基于字符串的定位方法不适合在微服务系统的失败测试用例中定位故障日志内容。

图片

图3:实验结果

总 结

为了提高针对微服务系统测试的测试用例失败告警故障诊断能力,文章提出的新型故障诊断框架SynthoDiag,利用测试过程中产生的多源日志进行故障分类和定位。SynthoDiag利用知识图谱整合执行机日志、Trace日志和测试用例信息,通过根因关联和位置价值(EFA-PV)来精确定位故障指示日志内容。该框架还采用了基于日志块的过滤策略来过滤掉与故障无关的日志内容,显著提升了故障诊断的整体性能。在华为云的一个大规模实际数据集上进行的系统评估显示,SynthoDiag在故障分类上的Micro-F1和 Macro-F1分数分别比基线方法提高了21%和30%,并且在故障定位的Top-5准确率达到了81.9%,显著优于以前的方法。总体而言,SynthoDiag通过创新地使用知识图谱技术联合分析测试过程中产生的多源日志,为微服务系统中的测试用例故障诊断提供了有效的解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/653725.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

JS中的数组很重要,怎样定义(声明)

为什么呢?在java中有集合,数组的作用就弱了,其高光时刻基本都被集合代替了。在JS中没有集合,数组就有点忙不过来了。你说它重要不重要?! 在JS中,怎样定义一个数组呢? 数组的声明方…

动手学操作系统(二、编写MBR主引导记录)

动手学操作系统(二、编写MBR主引导记录) 文章目录 动手学操作系统(二、编写MBR主引导记录)1. 实模式和保护模式2. BIOS与MBR3. MBR程序Reference 在之前的学习内容中,我们已经实现了基本的仿真环境bochs的搭建&#xf…

【Linux】数据链路层协议+ICMP协议+NAT技术

欢迎来到Cefler的博客😁 🕌博客主页:折纸花满衣 🏠个人专栏:Linux 目录 👉🏻数据链路层👉🏻以太网以太网帧格式网卡Mac地址对比ip地址 👉🏻MTUMTU…

员工管理和激励怎么做?试试场景化激励解决方案!

截止到2020年底,中国企业主体数量达3858.3万,同比增速达11.1%。如何留住人才、激励人才以强化人才与企业“黏性”,最大化提升员工的忠诚度与敬业度,成为企业未来人才发展战略的主要方向之一。 一、传统激励方式存在哪些不足 传统的…

【NumPy】权威指南:使用NumPy的percentile函数进行百分位数计算

🧑 博主简介:阿里巴巴嵌入式技术专家,深耕嵌入式人工智能领域,具备多年的嵌入式硬件产品研发管理经验。 📒 博客介绍:分享嵌入式开发领域的相关知识、经验、思考和感悟,欢迎关注。提供嵌入式方向…

计算机找不到msvcr110.dll如何解决,总结5种简单靠谱的方法

在日常使用电脑的过程中,我们可能会遇到一些错误提示,其中之一就是“msvcr110.dll丢失”。这个错误通常会导致某些程序无法正常运行,为了解决这个问题,下面我将介绍5种有效的解决方法。 一,了解msvcr110.dll是什么 ms…

网络之再谈体系结构

大家都知道的是网络的体系结构,现代软件常用的体系结构无非是TCP/IP协议栈,OSI因为实现复杂并且效率没有TCP/IP协议栈好,所以不用OSI,但是,最近在复习网络知识的时候,发现了一些奇怪的地方,那就…

TinyEngine 低代码引擎:带你5分钟高效构建游戏登录界面

本文由体验技术团队 TinyEngine 项目成员李旭宏创作,欢迎大家实操体验,本体验项目基于 TinyEngine 低代码引擎提供的环境,通过体验简单拖、拉、拽的形式帮助开发者快速了解低代码引擎的使用流程,达到快速开发游戏登录界面的效果。…

yolox-何为混合精度计算AMP?

何为AMP? 全称:Automatic mixed precision自动混合精度。 功能:在神经网络推理过程中,实现针对不同层采用不同的数据精度进行计算,从而实现节省显存和加速训练的目的。 此处提到的不同数据精度包括:32位浮…

每日两题 / 131. 分割回文串 42. 接雨水(LeetCode热题100)

131. 分割回文串 - 力扣&#xff08;LeetCode&#xff09; 数据量较小&#xff0c;考虑直接暴力&#xff0c;每次dfs&#xff1a;以bg作为左区间&#xff0c;往右遍历&#xff0c;找到一段回文串区间后&#xff0c;将回文串插入vector<string>&#xff0c;并以下一个下标…

适合下班做的副业兼职、1天挣300,7天涨粉2万

最近小红书上有类视频火了&#xff01; 周周近财&#xff1a;让网络小白少花冤枉钱&#xff0c;赚取第一桶金 利用AI制作的漫画解说历史小说视频。视频以《明朝那些事儿》为蓝本&#xff0c;一上线就疯狂吸粉&#xff0c;多条视频内容都大爆了。 就是这个账号&#xff0c;仅仅…

POLARDB:新零售用户MySQL上云最佳选择

什么是云数据库POLARDB&#xff1f; POLARDB是阿里云自主研发的最新一代RDS关系型数据库&#xff0c;是特别针对互联网场景设计的Cloud-Native 云原生数据库。POLARDB for MySQL版本&#xff0c;在提供100%兼容MySQL5.6/8.0的关系型事务处理ACID特性之上&#xff0c;能够提供完…

MySQL:CRUD初阶(有图有实操)

文章目录 &#x1f4d1;1. 数据库的操作&#x1f324;️1.1 显示当前的数据库&#x1f324;️1.2 创建数据库&#x1f324;️1.3 选中数据库&#x1f324;️1.4 删除数据库 &#x1f4d1;2. 表的操作&#x1f324;️2.1 查看表结构&#x1f324;️2.2 创建表&#x1f324;️2.3…

实战指南:Vue 2基座 + Vue 3 + Vite + TypeScript微前端架构实现动态菜单与登录共享

实战指南&#xff1a;Vue 2基座 Vue 3 Vite TypeScript子应用vue2微前端架构实现动态菜单与登录共享 导读&#xff1a; 在当今的前端开发中&#xff0c;微前端架构已经成为了一种流行的架构模式。本文将介绍如何结合Vue 2基座、Vue 3子应用、Vite构建工具和TypeScript语言…

【IC】partial good

假设单core良率80%&#xff0c;core pass 数量分布呈二项分布。 16个core全pass的概率为&#xff1a; 有n个core pass的概率为&#xff1a; 分布如下&#xff1a; 当np>5且nq>5时&#xff0c;二项分布近似服从正态分布

Python魔法之旅-魔法方法(01)

目录 一、概述 1、定义 2、作用 二、主要应用场景 1、构造和析构 2、操作符重载 3、字符串和表示 4、容器管理 5、可调用对象 6、上下文管理 7、属性访问和描述符 8、迭代器和生成器 9、数值类型 10、复制和序列化 11、自定义元类行为 12、自定义类行为 13、类…

Postman入门 - 环境变量和全局变量

&#x1f345; 视频学习&#xff1a;文末有免费的配套视频可观看 &#x1f345; 点击文末小卡片&#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 一、发送请求 二、设置并引用环境变量 比如&#xff1a;我建的这个生产环境 使用环境有两个方式&…

怎么做图片海报二维码?扫码查看图片内容

现在很多的宣传推广海报会放入二维码中&#xff0c;然后将二维码分享给用户后&#xff0c;通过扫码的方式来查看图片内容&#xff0c;从而获取自己需要的信息&#xff0c;经常在活动宣传、商品推广、旅游攻略等场景下使用。二维码可以提供更加便捷的内容获取方式&#xff0c;让…

Vivado打开之前项目仿真过的波形文件

第一步&#xff1a;顶部菜单 点击&#xff1a;Open Static Simulation 然后在弹出的窗口找到.sim结尾的文件夹&#xff0c;在里面找到wdb结尾的文件&#xff0c;点击ok 第二步&#xff1a;依次点击下方红圈 找到wcfg结尾的文件&#xff0c;点击ok即可

echart图表legend每列固定宽度

修改前&#xff1a; 修改后&#xff1a; 关键代码&#xff1a; 设置一个背景并使之透明&#xff0c;否则宽度不生效&#xff0c;配合formatter使用 formatter: {a|{name}},rich:{a: {width: 48,fontSize: 12,backgroundColor: "rgba(11, 39, 52, 0)" // 关键代码&a…