YOLOv8目标检测(六)_封装API接口

YOLOv8目标检测(一)_检测流程梳理:YOLOv8目标检测(一)_检测流程梳理_yolo检测流程-CSDN博客

YOLOv8目标检测(二)_准备数据集:YOLOv8目标检测(二)_准备数据集_yolov8 数据集准备-CSDN博客

YOLOv8目标检测(三)_训练模型:YOLOv8目标检测(三)_训练模型_yolo data.yaml-CSDN博客

YOLOv8目标检测(三*)_最佳超参数训练:YOLOv8目标检测(三*)_最佳超参数训练_yolo 为什么要选择yolov8m.pt进行训练-CSDN博客

YOLOv8目标检测(四)_图片推理:YOLOv8目标检测(四)_图片推理-CSDN博客

YOLOv8目标检测(五)_结果文件(run/detrct/train)详解:YOLOv8目标检测(五)_结果文件(run/detrct/train)详解_yolov8 yolov8m.pt可以训练什么-CSDN博客

YOLOv8目标检测(六)_封装API接口:YOLOv8目标检测(六)_封装API接口-CSDN博客

YOLOv8目标检测(七)_AB压力测试:YOLOv8目标检测(七)_AB压力测试-CSDN博客

在Python中将YOLOv8模型封装为API接口后,用户可以通过调用该接口上传自定义的测试图片,并获取识别结果

为什么要封装成API接口使用?

  • 模块化和可重用性:封装成API后,模型可以独立于其他代码运行,使得它更容易被其他应用或服务调用,而不需要直接依赖模型的具体实现细节。
  • 易于扩展:API接口可以方便地进行版本管理和功能扩展。如果未来需要替换或升级YOLOv8模型,可以通过修改API内部实现而不影响其他依赖该API的系统。
  • 跨平台兼容性:通过API,可以让不同平台或不同编程语言的应用访问和使用YOLOv8模型,而无需关心底层的实现细节。比如,前端应用可以通过HTTP请求访问API,得到模型的推理结果。
  • 简化部署与维护:API接口使得模型部署变得更加标准化和可管理。你可以将模型托管在服务器上,任何需要使用该模型的用户或系统都可以通过API进行交互,方便维护和监控。
  • 灵活性:API接口可以通过参数化设计,支持不同的输入输出形式,甚至可以根据请求动态调整模型的行为(如使用不同的推理参数、处理不同类型的输入等)。
  • 分离前后端:对于Web应用来说,封装成API接口可以将前端和后端分离,前端只需要通过HTTP请求和API进行交互,无需了解YOLOv8模型的具体实现。

注:笔者的情况是模型和API代码都在服务器(linux)Docker容器中,在容器中起服务,本地调用服务推理图片。

1.Python封装API

服务器中操作

app.py具体代码如下

import json
import numpy as np
from flask import Flask, request, jsonify
from loguru import logger
import base64
import cv2
from ultralytics import YOLO

app = Flask(__name__)

# 只处理 base64 编码图像
def read_img_cv(base64_str):
    try:
        img_data = base64.b64decode(base64_str)
        img = np.frombuffer(img_data, np.uint8)
        return cv2.imdecode(img, cv2.IMREAD_COLOR)
    except Exception:
        return None

def invasion(xyxy, points):
    # 检查目标框中心是否在给定区域内
    center_x, center_y = (xyxy[0] + xyxy[2]) / 2, (xyxy[1] + xyxy[3]) / 2
    return any(point[0] < center_x < point[2] and point[1] < center_y < point[3] for point in points)

# 设置日志记录
logger.add("./logs/{0}".format("log.log"), rotation="10 MB")

# 自定义标签列表
custom_labels = {
    0: 'backpack',
    1: 'plastic bag',
    2: 'shoulder bag', 
    3: 'person',
    4: 'handbag',
    5: 'suitcase'
    # 根据你的标签数目和顺序调整
}

# 参数设置
def set_parameters():
    return {'device': 'cuda', 'port': 5000}

args = set_parameters()
logger.info("start load Model!")
model = YOLO('/your_path/best.pt')  # 修改为你自己的路径

@app.route('/predict', methods=['POST'])
def predict():
    if request.method == 'POST':
        try:
            data = request.get_json()
            img_object = data.get('image')
            minScore = float(data.get('minScore', 0.45))
            maxScore = float(data.get('maxScore', 1.0))
            customerID = data.get('customerID')
            imageID = data.get('imageID')
            axisall = data.get('axis', [])

            # 校验置信度范围
            if not (0 <= minScore <= 1 and 0 <= maxScore <= 1 and minScore <= maxScore):
                return jsonify({'customerID': customerID, 'imageID': imageID, 'code': 1, 'msg': '置信度错误', "marks": None, "result": None})

            # 解码图像
            img0 = read_img_cv(img_object)
            if img0 is None:
                return jsonify({'customerID': customerID, 'imageID': imageID, 'code': 1, 'msg': '图片解码出错', "marks": None, "result": None})

            w, h = img0.shape[:2]
            if axisall:
                axisall = [[max(0, a[0]), max(0, a[1]), min(w, a[2]), min(h, a[3])] for a in axisall]

            det_list = []
            try:
                # 使用YOLO模型进行预测
                annos = model(img0, conf=minScore)
                annos = annos[0].boxes.data.clone().cpu().detach().tolist()

                if annos:
                    for cls, *xyxy, conf in zip(np.array(annos)[:, -1], np.array(annos)[:, :-2], np.array(annos)[:, -2]):
                        category = str(int(cls))
                        # 映射到自定义标签
                        custom_category = custom_labels.get(int(cls), "未知")
                        x0, y0, x1, y1 = map(int, xyxy[0])
                        info = {"cls": custom_category, "axis": [x0, y0, x1, y1], "score": round(conf, 2)}
                        if axisall and not invasion(xyxy[0], axisall):
                            continue
                        det_list.append(info)

            except Exception:
                return jsonify({'customerID': customerID, 'imageID': imageID, 'code': 1, 'msg': '内部错误', "marks": None, "result": None})

            out = {'customerID': customerID, 'imageID': imageID, 'code': 0, 'msg': 'OK', "marks": det_list, "result": bool(det_list)}
            logger.info(f'outputs: {out}')
            return jsonify(out)

        except Exception:
            return jsonify({'customerID': None, 'imageID': None, 'code': 1, 'msg': '未知错误', "marks": None, "result": None})

if __name__ == "__main__":
    app.run(host='0.0.0.0', port=args['port'], debug=True)

2.起服务

服务器中操作

运行python app.py,成功截图如下:

3.推理

本地操作

也可以上传数据到你的服务器操作(参考https://blog.csdn.net/weixin_48870215/article/details/144425479?fromshare=blogdetail&sharetype=blogdetail&sharerId=144425479&sharerefer=PC&sharesource=weixin_48870215&sharefrom=from_link),那样需要频繁的导入导出,笔者觉得麻烦。

注:这个模型best.pt是检测人和背包的。

(1)准备测试图片

(2)请求服务器处理代码

client.py具体代码如下:

import os
import base64
import cv2
import requests
from pathlib import Path

# 设置输入图片文件夹和输出文件夹
input_folder = r"D:\\Desktop/857"
output_folder = r"D:\\Desktop/857_123"
url = "<http://12.345.678.101:8888/predict>" #你的服务器ip和端口

# 确保输出文件夹存在
os.makedirs(output_folder, exist_ok=True)

# 类别颜色映射
class_colors = {
    "person": (0, 255, 0),  # 绿色
    "bag": (255, 0, 0),     # 蓝色
    "car": (0, 0, 255),     # 红色
    "phone": (255, 255, 0), # 黄色
    # 可以继续添加其他类别的颜色
}

# 将图片转换为base64格式
def image_to_base64(image_path):
    with open(image_path, 'rb') as f:
        img_byte = f.read()
    img_b64 = base64.b64encode(img_byte)
    return img_b64.decode()

# 从接口返回的结果画框和置信度
def draw_predictions(image, marks):
    for mark in marks:
        cls = mark["cls"]  # 获取类别
        x1, y1, x2, y2 = map(int, mark["axis"])  # 获取坐标
        score = mark["score"]  # 获取置信度
        label = f'{cls}: {score:.2f}'  # 标注类别和置信度

        # 获取类别颜色,如果没有指定颜色则使用默认颜色(白色)
        color = class_colors.get(cls, (255, 255, 255))

        # 画框
        cv2.rectangle(image, (x1, y1), (x2, y2), color, 5)

        font_scale = 0.8

        # 计算标签的大小
        label_size = cv2.getTextSize(label, cv2.FONT_HERSHEY_SIMPLEX, font_scale, 2)[0]
        label_x, label_y = x1, y1 - 10

        # 检查标签是否会超出图像或框的顶部
        if label_y - label_size[1] - 5 < 0:  
            label_y = y1 + 10  # 将标签位置调整到框的下方

        # 绘制背景色以便突出显示类别标签
        cv2.rectangle(image, (label_x, label_y - label_size[1] - 5), 
                      (label_x + label_size[0], label_y), color, -1)

        # 在框上方标注类别和置信度
        cv2.putText(image, label, (label_x, label_y - 5), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 0), 2, cv2.LINE_AA)

    return image

# 处理每一张图片
for image_name in os.listdir(input_folder):
    image_path = os.path.join(input_folder, image_name)

    # 跳过非图片文件
    if not image_name.lower().endswith(('.png', '.jpg', '.jpeg', '.bmp')):
        print(f"跳过非图片文件: {image_name}")
        continue

    print(f'正在处理图片: {image_name}')
    try:
        # 读取图片并转换为base64
        image_base64 = image_to_base64(image_path)

        # 构建POST请求的JSON数据
        payload = {
            "customerID": "abc_123",
            "imageID": image_name,
            "minScore": 0.35,
            "maxScore": 0.99,
            "timeStamp": "1234455",
            "flexibleParams": "",
            "image": image_base64
        }

        # 调用接口
        response = requests.post(url, json=payload, timeout=10)
        print("Response status code:", response.status_code)

        if response.status_code == 200:
            try:
                response_data = response.json()  # 尝试解析 JSON 数据
                print("Response JSON:", response_data)

                # 读取原始图片
                image = cv2.imread(image_path)

                # 获取并画出预测结果
                if response_data.get("marks"):
                    image = draw_predictions(image, response_data["marks"])

                # 保存处理后的图片
                output_path = os.path.join(output_folder, image_name)
                cv2.imwrite(output_path, image)
                print(f"Processed and saved: {output_path}")
            except requests.exceptions.JSONDecodeError:
                print(f"JSON 解码失败,服务器返回内容: {response.text}")
        else:
            print(f"服务器返回错误状态码: {response.status_code}, 内容: {response.text}")

    except requests.exceptions.RequestException as e:
        print(f"请求失败: {e}")
    except Exception as e:
        print(f"处理图片时发生错误: {e}")

(3)查看结果

app.py服务器返回结果:

client返回结果:

图片返回结果:

看过这六期文章,恭喜你基本掌握了YOLOv8实战流程:数据处理、数据集制作、模型训练、API封装、调用API推理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/939496.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

中后台管理信息系统:Axure12套高效原型设计框架模板全解析

中后台管理信息系统作为企业内部管理的核心支撑&#xff0c;其设计与实现对于提升企业的运营效率与决策能力具有至关重要的作用。为了满足多样化的中后台管理系统开发需求&#xff0c;一套全面、灵活的原型设计方案显得尤为重要。本文将深入探讨中后台管理信息系统通用原型方案…

uniapp使用腾讯地图接口的时候提示此key每秒请求量已达到上限或者提示此key每日调用量已达到上限问题解决

要在创建的key上添加配额 点击配额之后进入分配页面&#xff0c;分配完之后刷新uniapp就可以调用成功了。

【一篇搞定配置】如何在Ubuntu上配置单机/伪分布式Hadoop

&#x1f308; 个人主页&#xff1a;十二月的猫-CSDN博客 &#x1f525; 系列专栏&#xff1a; &#x1f3c0;各种软件安装与配置_十二月的猫的博客-CSDN博客 &#x1f4aa;&#x1f3fb; 十二月的寒冬阻挡不了春天的脚步&#xff0c;十二点的黑夜遮蔽不住黎明的曙光 目录 1.…

利用Python爬虫实现数据收集与挖掘

Python爬虫是一种自动化程序&#xff0c;可以模拟浏览器行为&#xff0c;自动地从互联网上抓取、分析和收集数据。Python爬虫通常使用requests、selenium等库来发送HTTP请求&#xff0c;获取网页内容&#xff0c;并使用BeautifulSoup、lxml等库来解析网页&#xff0c;提取所需的…

语音识别失败 chrome下获取浏览器录音功能,因为安全性问题,需要在localhost或127.0.0.1或https下才能获取权限

环境&#xff1a; Win10专业版 谷歌浏览器 版本 131.0.6778.140&#xff08;正式版本&#xff09; &#xff08;64 位&#xff09; 问题描述&#xff1a; 局域网web语音识别出现识别失败 chrome控制台出现下获取浏览器录音功能&#xff0c;因为安全性问题&#xff0c;需要在…

springboot444新冠物资管理系统的设计与实现(论文+源码)_kaic

摘 要 传统办法管理信息首先需要花费的时间比较多&#xff0c;其次数据出错率比较高&#xff0c;而且对错误的数据进行更改也比较困难&#xff0c;最后&#xff0c;检索数据费事费力。因此&#xff0c;在计算机上安装新冠物资管理系统软件来发挥其高效地信息处理的作用&#x…

arcgisPro将面要素转成CAD多段线

1、说明&#xff1a;正常使用【导出为CAD】工具&#xff0c;则导出的是CAD三维多线段&#xff0c;无法进行编辑操作、读取面积等。这是因为要素面中包含Z值&#xff0c;导出则为三维多线段数据。需要利用【复制要素】工具禁用M值和Z值&#xff0c;再导出为CAD&#xff0c;则得到…

当我用影刀AI Power做了一个旅游攻略小助手

在线体验地址&#xff1a;旅游攻略小助手https://power.yingdao.com/assistant/ca1dfe1c-9451-450e-a5f1-d270e938a3ad/share 运行效果图展示&#xff1a; 话不多说一起看下效果图&#xff1a; 智能体的截图&#xff1a; 工作流截图&#xff1a; 搭建逻辑&#xff1a; 其实这…

计算机组成原理的学习笔记(2)--数据的表示和运算·其一

学习笔记 前言 本文主要是对于b站尚硅谷的计算机组成原理的学习笔记&#xff0c;仅用于学习交流。 正文 1. 浮点数表示 浮点数结构&#xff1a; 符号位&#xff08;1 位&#xff09;&#xff1a;表示数值的正负。 阶码&#xff08;8 位&#xff09;&#xff1a;表示指数部…

网络安全渗透有什么常见的漏洞吗?

弱口令与密码安全问题 THINKMO 01 暴力破解登录&#xff08;Weak Password Attack&#xff09; 在某次渗透测试中&#xff0c;测试人员发现一个网站的后台管理系统使用了非常简单的密码 admin123&#xff0c;而且用户名也是常见的 admin。那么攻击者就可以通过暴力破解工具&…

【AI图像生成网站Golang】项目测试与优化

AI图像生成网站 目录 一、项目介绍 二、雪花算法 三、JWT认证与令牌桶算法 四、项目架构 五、图床上传与图像生成API搭建 六、项目测试与优化 六、项目测试与优化 在开发过程中&#xff0c;性能优化是保证项目可扩展性和用户体验的关键步骤。本文将详细介绍我如何使用一…

数据库与缓存数据一致性方案【终极版】

核心流程 1. 删除数据库同步删除缓存&#xff1a; 缩小可能发生脏数据的时间窗 2. Binlog MQ删除缓存&#xff1a; 兜底所有入口&#xff0c;避免遗漏删除缓存场景&#xff0c;同时通过MQ的消息重试保证缓存一定删除成功 3. 监听Binlog延迟N秒进行数据一致性校验&#xf…

RK3576 介绍

RK3576 介绍 1 介绍1.1 概述1.2 RK3576、RK3588、RK3568 和 RK3399 的参数对比 2 DataSheet2.1 RK35762.2 RK35882.3 RK35682.4 RK3399 参考 1 介绍 1.1 概述 ARM 64位高性能八核通用处理器&#xff0c;丰富的PCIE/USB3.0/SATA/GMAC等各类高速及CAN FD/DSMC/UART/SPI/I2C/I3C…

01、NodeJS学习笔记,第一节:Node.js初识与内置模块

一、初识Node.js与内置模块 ##网址 https://nodejs.org##npm包 https://www.npmjs.com/ &#xff08;搜索&#xff09;https://registry.npmjs.org/ &#xff08;下载&#xff09;1、初识Node.js ##思考&#xff1a;为什么JavaScript可以在浏览器中被执行因为浏览器…

【数据集】50种汽车零件分类识别数据集10382张YOLO+VOC格式(已增强)

数据集格式&#xff1a;VOC格式YOLO格式 压缩包内含&#xff1a;3个文件夹&#xff0c;分别存储图片、xml、txt文件 JPEGImages文件夹中jpg图片总计&#xff1a;10382 Annotations文件夹中xml文件总计&#xff1a;10382 labels文件夹中txt文件总计&#xff1a;10382 标签种类数…

深度学习0-前置知识

一、背景 AI最大&#xff0c;它的目的是通过让机器模仿人类进而超越人类&#xff1b; ML次之&#xff0c;它是AI的一个分支&#xff0c;是让机器模仿人类的一种方法。开发人员用大量数据和算法“训练”机器&#xff0c;让机器自行学会如何执行任务&#xff0c;它的成功取决于…

arcgis for js实现地图截图、地图打印

地图截图 效果 实现 复制运行即可 要实现复杂的截图保存可以参考 官网案例 <!DOCTYPE html> <html lang"zn"><head><meta charset"UTF-8" /><meta http-equiv"X-UA-Compatible" content"IEedge" />…

如何用上AI视频工具Sora,基于ChatGPT升级Plus使用指南

没有GPT&#xff0c;可以参考这个教程&#xff1a;详情移步至底部参考原文查看哦~ 1.准备工作 详情移步至底部参考原文查看哦~ 详情移步至底部参考原文查看哦~ 4.Sora使用 详情移步至底部参考原文查看哦 参考文章&#xff1a;【包教包会】如何用上AI视频工具Sora&#xff…

FFmpeg 安装教程(Windows 系统)

1. 前言 FFmpeg 是一个用于处理视频、音频等多媒体文件的开源工具包。它支持几乎所有的多媒体格式转换、剪辑和编辑&#xff0c;是开发者和多媒体工作者必备的工具。本文详细讲解如何在 Windows 系统上安装 FFmpeg 并进行基本配置。 2. 下载 FFmpeg 安装包 打开 Dpwnload FFmp…

#渗透测试#红队全栈 powshell基础使用

声明&#xff01; 学习视频来自B站up主 泷羽sec&#xff0c;任何违法事件与本人以及泷羽sec团队无关&#xff0c;切勿触碰法律底线&#xff0c;否则后果自负&#xff01;&#xff01;&#xff01;&#xff01; 目录标题 认识powsehll打开方式 使用方式美化自己的powershell简单…