《解锁计算机视觉智慧:编程实现图片场景文字描述的开源宝藏》

《解锁计算机视觉智慧:编程实现图片场景文字描述的开源宝藏》

  • 一、MiniGPT-4:小模型撬动大视觉理解
    • (一)项目概览
    • (二)核心亮点
    • (三)上手体验
  • 二、ClipCap-Chinese:中文场景描述的专属利器
    • (一)聚焦中文场景
    • (二)功能特性剖析
    • (三)协同共创力量
  • 三、UnrealText:三维引擎驱动的文本图像盛宴
    • (一)三维合成魔法
    • (二)多样特性集萃
    • (三)更新迭代之路
  • 四、Stable Diffusion:文本图像跨界的全能选手
    • (一)模型革新之力
    • (二)多元应用潜能
    • (三)生态拓展版图
  • 五、项目选用秘籍与进阶指南
    • (一)选型关键考量
    • (二)深度优化锦囊
    • (三)合规风险防范
  • 六、展望:代码书写视觉新未来

开篇:AI 视觉新潮流,代码诠释画面
在当今数字化浪潮中,AI 技术正以前所未有的速度重塑着我们的生活与工作方式。其中,图片场景文字描述生成技术犹如一颗璀璨的新星,备受瞩目。无论是社交媒体上的趣味分享、电商平台的商品展示,还是辅助视障人士感知世界,这项技术都展现出了巨大的实用价值。它能够精准剖析图片中的元素、动作、环境等诸多细节,并用生动、准确的文字将视觉信息转化为可阅读的描述,让人们得以从全新维度理解图像内涵。
而开源项目,作为技术创新的前沿阵地,为开发者们提供了深入探索、自由定制该技术的绝佳机会。这些项目凝聚着全球开发者的智慧,以开放包容之姿,邀请每一位编程爱好者参与其中,共同雕琢、完善。接下来,就让我们一同走进几个极具特色的开源项目,开启这场代码赋能图像的奇妙之旅。

一、MiniGPT-4:小模型撬动大视觉理解

(一)项目概览

MiniGPT-4 宛如一颗闪耀的新星,在开源的浩瀚星空中崭露头角。它依托先进的大型语言模型(LLM),致力于强化视觉理解能力,让机器能像人类一样 “看懂” 图片,并精准地用文字进行阐释。这个项目是由来自沙特阿拉伯阿卜杜拉国王科技大学的精英研究团队精心打造,采用 Python 编程语言编写,代码结构清晰,易于研读与二次开发。其开源地址在 GitHub 上广受关注,短短时间内便斩获大量星标,成为众多开发者热议的焦点项目。

(二)核心亮点

精准图文转换:MiniGPT-4 能够对各类图片进行深度解析,无论是风景、人物、物品还是场景,都能给出极为精准、细腻的文字描述。例如,面对一幅夕阳下海边的图片,它可以描绘出 “在金色余晖的轻抚下,海浪轻柔地拍打着沙滩,远处的海平面与橙红色的天空完美交融,岸边的棕榈树随风摇曳,似在低语着大海的故事”,这般诗意且精准的描述,将画面的美感与意境展露无遗。
多体裁创作:不仅限于简单描述,它还能依据图片内容进行多体裁创作。给定一张猫咪慵懒趴在窗台的图片,它既能生成温馨有趣的小故事,如 “阳光透过纱帘,洒在小猫毛茸茸的背上,它半眯着眼,回味着刚刚那场与毛线球的激战,窗台虽小,却是它的专属冒险天地”;又能创作优美动人的诗歌,“暖光栖窗台,喵影静入怀。尘世纷扰外,悠然梦蓬莱”,展现出极强的创作才华。
复杂场景理解:在面对复杂场景时,MiniGPT-4 也毫不逊色。像是城市街头的车水马龙、热闹集市的熙熙攘攘,它都能敏锐捕捉画面关键元素,准确解读人物关系、动作意图,给出条理清晰的文字说明,让人惊叹其对复杂视觉信息的强大处理能力。

(三)上手体验

对于新手而言,上手 MiniGPT-4 并非难事。首先,要确保系统安装了 Python 3.8 及以上版本、CUDA 11.1 或更高版本、PyTorch 1.8 或更高版本等基础依赖。接着,通过简单的命令 “git clone https://github.com/Vision-CAIR/MiniGPT-4.git” 克隆项目仓库,再使用 “pip install -r requirements.txt” 安装所需的 Python 包。运行示例时,对于 MiniGPT-4(Vicuna 版本),执行 “python demo.py --cfg-path eval_configs/minigpt4_eval.yaml --gpu-id 0” 即可开启奇妙的图像文字之旅。在社区中,众多开发者分享了自己的实战经验,有的通过微调模型参数,让 MiniGPT-4 在特定领域图片描述上更加专业精准;还有的将其与其他应用巧妙结合,如开发图像辅助写作插件,为创作者提供源源不断的灵感,拓展了 MiniGPT-4 的无限可能。

二、ClipCap-Chinese:中文场景描述的专属利器

(一)聚焦中文场景

在多模态技术蓬勃发展的当下,ClipCap-Chinese 宛如一颗为中文语境量身定制的璀璨明珠,脱颖而出。它深度聚焦于中文用户对图片场景文字描述的需求,基于强大的 DALL-E 2 模型架构,精心优化打磨,致力于攻克中文语义理解与精准表达的难关。与诸多通用型模型不同,它充分考量中文的语法规则、词汇特点、文化内涵等诸多要素,让生成的描述更贴合中文使用者的阅读习惯,无论是古韵悠扬的诗意描绘,还是简洁明了的新闻叙事,都能拿捏得恰到好处。

(二)功能特性剖析

多语言灵活输出:不仅擅长中文描述,还兼顾英文等多语言表达。对于一张展现传统中式园林的图片,它既能用优美的中文勾勒出 “曲径通幽处,亭台水榭间,繁花似锦映清泉,古韵四溢惹人醉” 这般充满意境的画面,又能以流畅的英文阐述 “A winding path leads to secluded places, with pavilions, waterside pavilions and blooming flowers reflecting clear springs, full of ancient charm”,为全球文化交流、跨平台分享提供有力支持。
便捷易用接口:为开发者提供了简洁直观的 API 和命令行工具。只需简单几行代码,就能将其集成到各类应用中。例如,在开发一款旅游分享 APP 时,通过调用 ClipCap-Chinese 的 API,用户上传旅行照片后,瞬间便能获取精美的文字介绍,为游记增添色彩,极大提升用户体验,降低开发门槛。
持续迭代更新:其背后的开发团队秉持着精益求精的态度,密切关注前沿技术发展与用户反馈。定期引入新的训练数据,优化模型架构,不断提升对复杂场景、新兴事物的理解与描述能力。像随着元宇宙概念爆火,面对相关虚拟场景图片,新版本能迅速给出精准且富有前瞻性的描述,紧跟时代潮流。
在实际应用场景中,它更是大放异彩。于新闻媒体领域,编辑们借助它为时事图片快速生成吸睛标题与概要,如在报道一场科技创新展会时,根据现场展品图片迅速生成 “科技展亮点纷呈:智能机器人灵活舞动,前沿芯片闪耀登场” 的文字,提升新闻产出效率;在教育行业,教师们利用它解读历史文物、科学实验图示,帮助学生跨越认知鸿沟,将抽象知识具象化,如对着细胞分裂图给出详细的动态过程描述,辅助课堂教学。

(三)协同共创力量

ClipCap-Chinese 的开源特性汇聚了来自五湖四海开发者的智慧。社区成员积极投身于项目建设,有人自发翻译英文文档为中文,降低国内开发者的学习成本;有人细心排查 BUG,提交修复方案,保障项目稳定运行;还有的结合自身专业领域,如医学、艺术等,贡献全新的数据集,让模型在专业场景描述上更加得心应手。大家在 GitHub 等开源平台交流互动,分享实战经验、优化技巧,形成一个生机勃勃、不断进化的开源生态,持续推动着项目向更高峰攀登,为中文视觉语言处理开辟广阔天地。

三、UnrealText:三维引擎驱动的文本图像盛宴

(一)三维合成魔法

UnrealText 仿若一位神奇的 “视觉魔法师”,以三维图形引擎为魔杖,在虚拟世界中挥洒创意,合成出无比逼真的场景文本图像。该项目由专业的 Jyouhou 团队精心维护,巧妙融合 C++ 与 Python 编程语言,充分发挥二者优势。C++ 负责底层核心的图形渲染、资源管理等高性能需求模块,保障画面的流畅与精细;Python 则用于上层的脚本控制、参数配置等灵活交互环节,让使用者能便捷驾驭整个合成流程。无论是繁华都市的街头招牌、古老城堡的神秘符文,还是未来科幻场景的闪烁字幕,它都能栩栩如生地呈现,为视觉文本研究与应用开辟全新维度。

(二)多样特性集萃

多语种的文本天地:支持拉丁文、英文等多种主流语言,还积极拓展至多语种领域,无论是亚洲的日文、韩文,还是欧洲的法文、德文等,都能精准生成对应文本图像,满足全球多元化场景需求。在跨国广告设计、多语言教育资料制作中,它大显身手,轻松跨越语言壁垒。
丰富的数据集宝藏:项目慷慨分享大规模合成场景文本数据集,涵盖日常生活、商业广告、工业制造等海量场景类别,为研究者提供了肥沃的 “数据土壤”。基于这些数据,科研人员能训练出更强大的文本识别模型,推动 OCR 技术迈向新高峰。
严谨的评估体系:配备重新注释的场景文本识别数据集,为合成文本图像的性能评估立下精准标尺。通过准确率、召回率、F1 值等多维度指标衡量,确保生成的图像质量可靠,经得起学术与实践的严苛检验。诸多前沿学术研究频繁引用 UnrealText,足见其在学界的权威性与影响力。

(三)更新迭代之路

UnrealText 始终奔跑在创新前沿,持续优化升级。在性能优化上,对合成算法深度打磨,采用更高效的渲染管线、智能的资源调度策略,让图像生成速度大幅跃升,原本耗时良久的复杂场景构建如今转瞬即成;数据集扩充方面,定期采集新的场景素材、融入新兴文本样式,如社交媒体流行的 emoji 文本、电子竞技专属术语等,紧跟时代潮流;文档与示例更新也从未停歇,详细阐释新特性、新用法,新增的示例项目涵盖虚拟现实、增强现实等前沿领域,助力开发者快速上手,轻松玩转最新功能。对比过往版本,如今的 UnrealText 在图像真实感、生成效率、适用场景广度上实现了质的飞跃,宛如一位不断进化的勇士,持续开拓文本图像融合的新疆域。

四、Stable Diffusion:文本图像跨界的全能选手

(一)模型革新之力

Stable Diffusion 可谓是 AI 绘画领域的 “传奇巨星”,它脱胎于 Latent Diffusion 项目,由慕尼黑大学 CompVis 小组、Runway 研究人员携手打造,Stability AI 全力支持并提供海量计算资源。自 2022 年惊艳亮相以来,其代码与模型权重在 GitHub 和 Hugging Face 上大方开源,瞬间点燃全球开发者的热情。
其核心架构 Latent Diffusion 模型独具匠心,引入变分自动编码器(VAE)将图像压缩至低维潜在空间,极大降低计算成本。U-Net 模块搭配先进的跨注意机制,如同拥有 “火眼金睛”,精准捕捉文本提示中的关键信息,引导去噪过程,逐步将随机噪声转化为惊艳图像。与传统扩散模型相比,它在生成质量、效率、可控性上实现质的飞跃,能在消费级 GPU 上轻松运行,让 AI 绘画走进千家万户。

(二)多元应用潜能

文本 - 图像生成:这是 Stable Diffusion 的 “看家本领”,输入一段充满诗意的文本,如 “月光洒在古老城堡的城墙上,藤蔓蜿蜒攀爬,神秘符文闪烁微光”,转瞬之间,一幅氛围感拉满的精美画作跃然眼前,细节丰富、意境悠远,仿佛带人穿越时空,置身于神秘幻境。
图像风格转换:它能像一位神奇的画师,轻松将照片转换为不同艺术风格。上传一张日常街景照片,选择梵高风格,瞬间画面便充满了浓郁的后印象派笔触,色彩浓烈、线条奔放;切换至浮世绘风格,又呈现出简洁明快的线条、鲜艳扁平的色彩,人物与场景别具韵味,实现跨文化艺术碰撞。
辅助创意设计:在平面设计、UI 设计领域,Stable Diffusion 更是设计师们的得力助手。构思海报时,输入主题、色彩偏好、元素要求等文本,它快速生成多款创意草图,为设计师提供灵感源泉,加速设计流程,让创意不再受限。
在艺术创作领域,它更是大放异彩。诸多创作者凭借 Stable Diffusion 生成的作品斩获各类大奖,从数字艺术展到摄影赛事,都有它的身影。在巴拉瑞特摄影双年展上,瑞典摄影师诺登斯基尔德用其创作的《相爱的双胞胎姐妹》一举夺冠,引发全球对 AI 艺术创作边界与潜力的热议,不断拓展艺术表达新边界。

(三)生态拓展版图

Stable Diffusion 周边生态繁荣昌盛,以 DreamStudio 为代表的 API 服务,为开发者与企业提供便捷接入通道,可轻松将图像生成能力嵌入各类应用,无论是电商产品展示、社交媒体滤镜,还是在线教育配图,都能无缝融合。
社区中,丰富多样的插件如雨后春笋般涌现。ControlNet 插件赋予用户精准控制图像姿态、布局、深度等细节的能力,实现所想即所得;OpenPose Editor 插件专注人物姿态编辑,让人物画面更加生动自然。还有各种风格模型百花齐放,动漫风格、写实风格、复古风格应有尽有,满足不同审美需求。开发者们将 Stable Diffusion 与其他前沿技术融合,如与强化学习结合探索智能图像生成,与 3D 建模联动打造沉浸式虚拟场景,持续拓展其应用边界,开创 AI 视觉无限可能。

五、项目选用秘籍与进阶指南

(一)选型关键考量

面对琳琅满目的开源项目,精准选型至关重要。若专注于中文社交媒体内容生成,ClipCap-Chinese 凭借其对中文语境的深度理解、优美的文案创作能力脱颖而出;若从事科研,需要合成大量带标注文本图像用于模型训练,UnrealText 丰富的数据集与精准评估体系无疑是首选;追求艺术创作、探索图像风格多元变换,Stable Diffusion 及其周边强大插件生态能极大激发灵感;而对于新手入门、快速搭建图像描述原型,MiniGPT-4 清晰的代码结构、较低的上手门槛是理想之选。
精度与速度方面,Stable Diffusion 在生成高质量复杂图像时表现卓越,但对硬件要求较高,耗时相对较长;MiniGPT-4 则在文本描述精准度上可圈可点,且依托高效的模型架构,能快速给出简洁而准确的答案。语言支持上,ClipCap-Chinese 对中文语义把握精准,多语言输出灵活;UnrealText 在多语种文本图像合成领域独树一帜,适配全球多元场景。场景适配性,如电商场景需要精准的产品细节描述,MiniGPT-4 可精准提炼卖点;游戏开发场景,UnrealText 生成的逼真场景文本图像能完美融入虚拟世界。学习成本考量,MiniGPT-4 文档完善、社区活跃,新手能迅速融入;Stable Diffusion 虽功能强大,但因其复杂的插件体系与模型参数,进阶学习曲线较陡。

(二)深度优化锦囊

选定项目后,优化是进阶必经之路。以 MiniGPT-4 为例,微调预训练模型可显著提升特定领域表现。收集电商产品图片及对应专业描述文本,精心清洗、标注后,利用迁移学习技术微调模型,使其在产品推广文案生成上更加专业、吸睛。融合多模型策略亦成效斐然,将 Stable Diffusion 的图像生成能力与 ClipCap-Chinese 的精准中文描述相结合,输入创意文本,先由 Stable Diffusion 生成惊艳图像,再由 ClipCap-Chinese 赋予其贴合中文语境的生动阐释,打造全新的图文创作流水线。
硬件加速层面,对于计算密集型的图像生成任务,采用 GPU 集群或云端 TPU 资源能大幅缩短生成时间。合理配置 CUDA 环境,优化内存使用,利用英伟达的 TensorRT 对模型进行推理加速,让项目在性能上实现飞跃,轻松应对高并发、实时性强的应用需求。

(三)合规风险防范

在开源项目使用中,合规是不可逾越的红线。数据版权方面,确保使用的训练数据来源合法,未侵犯他人知识产权。对于从网络抓取的图片、文本,需严格审查版权信息,遵循知识共享协议。若用于商业用途,更要审慎核实数据授权范围,避免潜在法律纠纷。隐私保护同样关键,尤其在涉及用户上传图片、个人信息的应用场景中,采用加密传输、存储技术,遵循 GDPR 等隐私法规,对敏感数据匿名化处理,确保用户隐私安全无虞。定期开展合规审计,跟踪开源许可证变更,维护项目合法、健康发展。

六、展望:代码书写视觉新未来

随着技术的迅猛发展,图片场景文字描述生成开源项目的未来充满无限可能。在医疗领域,它们有望助力医生更高效地解读影像,自动生成精准诊断报告,让疾病无处遁形;教育行业中,能将复杂知识以图文并茂的形式呈现,为学生打造沉浸式学习体验,激发探索欲;娱乐产业里,从影视创作的灵感启发,到游戏场景的智能构建,全方位拓展创意边界。
而这一切的推进,离不开每一位开发者的参与。无论你是初出茅庐的编程新手,还是经验丰富的技术大咖,都能在这些开源项目中找到属于自己的舞台。大胆尝试、积极创新、踊跃贡献,让我们携手以代码为笔,绘就智能视觉的壮丽新画卷,共同迈向人机协同、智慧闪耀的新纪元。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/951102.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

AI赋能服装零售:商品计划智能化,化危机为转机

在服装零售这片竞争激烈的战场上,每一个细微的决策都可能成为品牌兴衰的关键。当市场波动、消费者口味变化、供应链挑战接踵而至时,许多品牌往往将危机归咎于外部环境。然而,真相往往更为深刻——“危机不是外部的,而是你的商品计…

Flutter:吸顶效果

在分页中,实现tab吸顶。 TDNavBar的screenAdaptation: true, 开启屏幕适配。 该属性已自动对不同手机状态栏高度进行适配。我们只需关注如何实现吸顶。 view import package:ducafe_ui_core/ducafe_ui_core.dart; import package:flutter/material.dart; import p…

企业级PHP异步RabbitMQ协程版客户端 2.0 正式发布

概述 workerman/rabbitmq 是一个异步RabbitMQ客户端,使用AMQP协议。 RabbitMQ是一个基于AMQP(高级消息队列协议)实现的开源消息组件,它主要用于在分布式系统中存储和转发消息。RabbitMQ由高性能、高可用以及高扩展性出名的Erlan…

信号弱开启手机Wifi通话,MIUI显示/隐藏5G开关的方法

1.开启手机Wi-Fi通话,提升无信号或弱信号时的通话质量 Wi-Fi 通话(Wi-Fi calling),又称VoWiFi,是一项名为“ Voice over Wi-Fi ”的服务,它允许手机用户使用他们的智能手机使用 Wi-Fi网络拨打电话,即在Wi-Fi环境下就能…

Echarts的认识和基本用法

Echarts介绍和使用 Echarts介绍 官网地址:Apache ECharts Echarts是一个基于JavaScript的开源可视化图表库,由百度前端开发团队研发和维护。它提供了丰富的图表类型、数据统计分析、动态数据更新、多维数据展示等功能,可以帮助开发人员在 W…

在JavaScript开发中,如何判断对象自身为空?

前言 如何判断一个对象为空是我们在开发中经常会遇到的问题,今天我们来聊聊几种经常使用的方法,以及在不同的场景下我们如何去使用。 1. JSON.stringify JSON.stringify 方法可以使对象序列化,转为相应的 JSON 格式。 const obj {};cons…

大语言模型训练的数据集从哪里来?

继续上篇文章的内容说说大语言模型预训练的数据集从哪里来以及为什么互联网上的数据已经被耗尽这个说法并不专业,再谈谈大语言模型预训练数据集的优化思路。 1. GPT2使用的数据集是WebText,该数据集大概40GB,由OpenAI创建,主要内…

Wireshark 学习笔记1

1.wireshark是什么 wireshark是一个可以进行数据包的捕获和分析的软件 2.基本使用过程 (1)选择合适的网卡 (2)开始捕获数据包 (3)过滤掉无用的数据包 (4)将捕获到的数据包保存为文件…

RK3568平台(USB篇)禁用USB端口

一.linux中怎样查看usb的端口号 在USB口插入U盘: [ 198.141319][ T106] usb 3-1.3: new SuperSpeed Gen 1 USB device number 5 using xhci-hcd [ 198.161695][ T106] usb 3-1.3: New USB device found, idVendor=0781, idProduct=5591, bcdDevice= 1.00 [ 198.161721]…

3298.统计重新排列后包含另一个字符串的字符串数目 I II滑动窗口 优化思路解析全网最详细

II相比于I是数据范围变成了10的6次方了 我们来维护大小关系,把不用的都去掉,优化到O(26n) 首先判断一下要找子字符串的s长度是否小于t字符串,如果小于的话直接返回0 初始答案变量和left左指针为0 用Counter来记录t中所…

双向导航和单向导航

目录 双向导航 单向导航 迁移数据库异常 解决办法 1.导航属性改为空 2.使用 ON DELETE NO ACTION 或 ON UPDATE NO ACTION 选择 双向导航 一对多:一个Article有多个Comment class Article {public long Id { get; set; }public string Title { get; set; }pu…

静态路由配置与调试——计算机网络实训day1

TOC 软件及基本配置下载 通过网盘分享的文件:计网实训 链接: https://pan.baidu.com/s/1AY5qNSN1dnw5Vy1OtwdJGg?pwdijde 提取码: ijde 操作前准备 1.下载软件 2.双击1.基本配置.pkt 3.进入实验环境 一、实验目的 1、掌握路由器的基本配置; 2、掌握…

EasyExcel上传校验文件错误信息放到文件里以Base64 返回给前端

产品需求: 前端上传个csv 或 excel 文件,文件共4列,验证文件大小,类型,文件名长度,文件内容,如果某行某个单元格数据验证不通过,就把错误信息放到这行第五列,然后把带有…

EtherCAT转Modbus网关与TwinCAT3的连接及配置详述

在工业自动化控制系统中,常常需要整合不同的通信协议设备。本案例旨在展示如何利用捷米特JM-ECT-RTU协议转换网关模块,实现 EtherCAT 网络与 Modbus 设备之间的无缝连接,并在 TwinCAT3 环境中进行有效配置,以构建一个稳定可靠的自…

Linux 工作队列

系列文章目录 Linux内核学习 Linux 知识(1) Linux 知识(2) Linux 工作队列 Linux 内核源代码情景分析(一) Linux 设备驱动程序(二) 文章目录 系列文章目录综述工作(work_…

如何评价deepseek-V3 VS OpenAI o1 自然语言处理成Sql的能力

DeepSeek-V3 介绍 在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。 准备工作: 笔者只演示实例o1 VS DeepSeek-V3两个模型,大家可以自行验证结果或者实验更多场景,同时…

【UI自动化测试】selenium八种定位方式

🏡个人主页:謬熙,欢迎各位大佬到访❤️❤️❤️~ 👲个人简介:本人编程小白,正在学习互联网求职知识…… 如果您觉得本文对您有帮助的话,记得点赞👍、收藏⭐️、评论💬&am…

百度视频搜索架构演进

导读 随着信息技术的迅猛发展,搜索引擎作为人们获取信息的主要途径,其背后的技术架构也在不断演进。本文详细阐述了近年来视频搜索排序框架的重大变革,特别是在大模型技术需求驱动下,如何从传统的多阶段级联框架逐步演变为更加高…

sequelize-cli 多对多关系处理 及某一单项游戏根据成绩降序排名

一、生成模型 Game(游戏表)GameGrades(游戏成绩表)GameUser(用户表) 1.1 对非中间表 做多对多逻辑处理 Game模型 static associate(models) {// define association heremodels.GameUser.belongsToMany(models.Game, {through: models.GameGrade,fore…

调整Python+Pytest+Allure+Yaml+Pymysql框架中需要执行的用例顺序

当pytest框架中有时时候会因为用例的前后关联关系需要调整用例执行顺序时则可以跟进具体的要求调整pytest.ini配置文件中执行用例文件夹的前后顺序 当如果是需要调整某个文件夹中用例的执行顺序时,则跟进具体的文件调整对应testcases中test_*.py文件中的执行顺序