经典目标检测YOLO系列(一)复现YOLOV1(3)正样本的匹配及损失函数的实现

经典目标检测YOLO系列(一)复现YOLOV1(3)正样本的匹配及损失函数的实现

之前,我们依据《YOLO目标检测》(ISBN:9787115627094)一书,提出了新的YOLOV1架构,并解决前向推理过程中的两个问题,继续按照此书进行YOLOV1的复现。
经典目标检测YOLO系列(一)YOLOV1的复现(1)总体架构

经典目标检测YOLO系列(一)复现YOLOV1(2)反解边界框及后处理

1、正样本的匹配

1.1 正样本匹配思路

YOLOV1中,正样本的匹配算法很简单,就是目标边界框的中心落到feature map的哪个网格中,哪个网格就是正样本。如下图,黄色网格就是正样本。

在这里插入图片描述

后面会利用pytorch读取VOC数据集:

  • 一批图像数据的维度是 [B, 3, H, W] ,分别是batch size,色彩通道数,图像的高和图像的宽。

  • 标签数据是一个包含 B 个图像的标注数据的python的list变量(如下所示),其中,每个图像的标注数据的list变量又包含了 M 个目标的信息(类别和边界框)。

  • 获得了这一批数据后,图片是可以直接喂到网络里去训练的,但是标签不可以,需要再进行处理一下。

    [
        {
            'boxes':     tensor([[ 29., 230., 148., 321.]]),  # bbox的坐标(xmin, ymin, xmax, ymax)
            'labels':    tensor([18.]),                       # 标签
            'orig_size': [281, 500]                           # 图片的原始大小
        }, 
        {
            'boxes':      tensor([[  0.,  79., 416., 362.]]), 
            'labels':     tensor([1.]),
            'orig_size': [375, 500]
        }
    ]
    
  • 标签处理主要包括3个部分,

    • 一是将真实框中心所在网格的置信度置为1,其他网格默认为0
    • 二是真实框的标签类别为1,其他类别设置为0
    • 三是真实框的bbox信息。
    # 处理好的shape如下:
    # gt_objectness  
    torch.Size([2, 169, 1])  # 169=13×13
    # gt_classes
    torch.Size([2, 169, 20])
    # gt_bboxes
    torch.Size([2, 169, 4])
    

1.2 具体实现代码

# RT-ODLab/models/detectors/yolov1/matcher.py

import torch
import numpy as np


# YoloV1 正样本制作
class YoloMatcher(object):
    def __init__(self, num_classes):
        self.num_classes = num_classes


    @torch.no_grad()
    def __call__(self, fmp_size, stride, targets):
        """
            fmp_size: (Int) input image size                 用于最终检测的特征图的空间尺寸,即划分网格的尺寸
            stride: (Int) -> stride of YOLOv1 output.        特征图的输出步长
            targets: (Dict) dict{'boxes': [...], 
                                 'labels': [...], 
                                 'orig_size': ...}           一批数据的标签
            targets是List类型的变量,每一个元素都是一个Dict类型,
                                  包含boxes和labels两个key,
                                  对应的value就是【一张图片中的目标框的尺寸】和【类别标签】。
        """
        # prepare
        # 准备一些空变量,后续我们会将正样本的数据存放到其中,比如gt_objectness,其shape就是[B, fmp_h, fmp_w, 1],
        # 其中,B就是batch size,
        #      [fmp_h, fmp_w] 就是特征图尺寸,即网格,
        #      1就是objectness的标签值
        # 所有网格的值都会初始化为0,即负样本或背景,在后续的处理中,我们会一一确定哪些网格是正样本区域。
        bs = len(targets)
        fmp_h, fmp_w = fmp_size
        gt_objectness = np.zeros([bs, fmp_h, fmp_w, 1]) 
        gt_classes = np.zeros([bs, fmp_h, fmp_w, self.num_classes]) 
        gt_bboxes = np.zeros([bs, fmp_h, fmp_w, 4])

        # 第一层for循环遍历每一张图像的标签
        for batch_index in range(bs):
            # targets_per_image是python的Dict类型
            targets_per_image = targets[batch_index]
            # [N,]  N表示一个图像中有N个目标对象
            tgt_cls = targets_per_image["labels"].numpy()
            # [N, 4]
            tgt_box = targets_per_image['boxes'].numpy()

            # 第二层for循环遍历这张图像标签的每一个目标数据
            for gt_box, gt_label in zip(tgt_box, tgt_cls):
                x1, y1, x2, y2 = gt_box
                # xyxy -> cxcywh
                xc, yc = (x2 + x1) * 0.5, (y2 + y1) * 0.5
                bw, bh = x2 - x1, y2 - y1

                # check
                if bw < 1. or bh < 1.:
                    continue    

                # grid 计算这个目标框中心点所在的网格坐标
                xs_c = xc / stride
                ys_c = yc / stride
                grid_x = int(xs_c)
                grid_y = int(ys_c)

                if grid_x < fmp_w and grid_y < fmp_h:
                    # objectness标签,采用0,1离散值
                    gt_objectness[batch_index, grid_y, grid_x] = 1.0
                    # classification标签,采用one-hot格式
                    cls_ont_hot = np.zeros(self.num_classes)
                    cls_ont_hot[int(gt_label)] = 1.0
                    gt_classes[batch_index, grid_y, grid_x] = cls_ont_hot
                    # box标签,采用目标框的坐标值
                    gt_bboxes[batch_index, grid_y, grid_x] = np.array([x1, y1, x2, y2])

        # [B, M, C]
        gt_objectness = gt_objectness.reshape(bs, -1, 1)
        gt_classes = gt_classes.reshape(bs, -1, self.num_classes)
        gt_bboxes = gt_bboxes.reshape(bs, -1, 4)

        # to tensor
        gt_objectness = torch.from_numpy(gt_objectness).float()
        gt_classes = torch.from_numpy(gt_classes).float()
        gt_bboxes = torch.from_numpy(gt_bboxes).float()

        return gt_objectness, gt_classes, gt_bboxes


if __name__ == '__main__':
    matcher = YoloMatcher(num_classes=20)
    targets = [
    {
        'boxes':     torch.tensor([[ 29., 230., 148., 321.]]),  # bbox的坐标(xmin, ymin, xmax, ymax)
        'labels':    torch.tensor([18.]),                       # 标签
        'orig_size': [281, 500]                                 # 图片的原始大小
    },
    {
        'boxes':      torch.tensor([[  0.,  79., 416., 362.]]),
        'labels':     torch.tensor([1.]),
        'orig_size': [375, 500]
    }
]
    gt_objectness, gt_classes, gt_bboxes = matcher(fmp_size=(13, 13),stride=32, targets=targets )
    print(gt_objectness.shape)
    print(gt_classes.shape)
    print(gt_bboxes.shape)

关键代码解释:

  • 对于bbox标签,我们没有去计算中心点偏移量和宽高的log值,而是直接赋予了原始的坐标值。这是因为后续在计算损失的时候,我们将会采用当下流行的GIoU损失,届时会计算预测的边界框坐标值和真实的目标框坐标值之间的GIoU。
  • 之前,已经给出了我们的YOLOv1在结算坐标时用到的公式,尽管没有直接给出中心点偏移量和log处理后的宽高值的标签,但在回归时,我们已经用sigmoid和exp约束了模型的预测的偏移量。因此,在训练时,模型仍旧会学习到我们希望他们能学习的正确形式,即预测的偏移量在sigmoid和exp处理后会是合理的值。
  • 两层for循环全部执行完毕后,准备好的空变量中就已经存好了正样本的标签。此前,我们已经将模型的预测都从[B, C, H, W]的格式reshape成了的[B, M, C] 的格式,即将空间的二维尺寸拉平了,为了方便后续的计算,我们也对标签数据做这样的处理,也得到对应的[B, M, C]的格式。最后,我们将这些标签数据都转换成torch.Tensor类型输出即可。
  • 以上就是训练阶段制作正样本的方法,对于某次训练迭代所给的一批标签,经过YoloMatcher类的处理后,我们得到了包含objectness标签、classification标签、bbox标签的变量:gt_objectness、gt_classes、gt_bboxes 。下面,我们就可以编写计算训练的损失的代码。

2、损失函数的实现

2.1 损失函数的实现

这里修改损失函数,将YOLOV1原本的MSE loss,分类分支替换为BCE loss,回归分支替换为GIou loss。

  • 对于objectness损失,所有的正样本和负样本都要参与进来计算
  • 对于classification损失,我们只计算正样本处的这部分损失
  • 对于bbox损失,同样只取出正样本处的预测和标签,然后计算损失
# RT-ODLab/models/detectors/yolov1/loss.py

import torch
import torch.nn.functional as F
from .matcher import YoloMatcher
from utils.box_ops import get_ious
from utils.distributed_utils import get_world_size, is_dist_avail_and_initialized


class Criterion(object):
    def __init__(self, cfg, device, num_classes=80):
        self.cfg = cfg
        self.device = device
        self.num_classes = num_classes
        self.loss_obj_weight = cfg['loss_obj_weight']
        self.loss_cls_weight = cfg['loss_cls_weight']
        self.loss_box_weight = cfg['loss_box_weight']

        # matcher
        self.matcher = YoloMatcher(num_classes=num_classes)


    def loss_objectness(self, pred_obj, gt_obj):
        # 此函数内部会自动做数值稳定版本的sigmoid操作
        # 因此,输入给该函数的预测值不需要预先做sigmoid函数处理,这也就是为什么在此前搭建的YOLOv1模型中的forward函数中看不到对objectness预测和classification预测做sigmoid处理,
        # 当然,在推理时,我们还是要这么手动做的,这一点也能够在YOLOv1模型的inference函数中看到。
        loss_obj = F.binary_cross_entropy_with_logits(pred_obj, gt_obj, reduction='none')

        return loss_obj
    

    def loss_classes(self, pred_cls, gt_label):
        loss_cls = F.binary_cross_entropy_with_logits(pred_cls, gt_label, reduction='none')

        return loss_cls


    def loss_bboxes(self, pred_box, gt_box):
        # regression loss
        ious = get_ious(pred_box,
                        gt_box,
                        box_mode="xyxy",
                        iou_type='giou')
        loss_box = 1.0 - ious

        return loss_box


    def __call__(self, outputs, targets, epoch=0):
        device = outputs['pred_cls'][0].device
        stride = outputs['stride']
        fmp_size = outputs['fmp_size']
        (
            gt_objectness, 
            gt_classes, 
            gt_bboxes,
            ) = self.matcher(fmp_size=fmp_size, 
                             stride=stride, 
                             targets=targets)
   
        # List[B, M, C] -> [B, M, C] -> [BM, C]
        # 为了方便后续的计算,将预测和标签的shape都从[B, M, C]调整成[BM, C],
        # 这一步没有任何数学意义,仅仅是出于计算的方便。
        pred_obj = outputs['pred_obj'].view(-1)                     # [BM,]
        pred_cls = outputs['pred_cls'].view(-1, self.num_classes)   # [BM, C]
        pred_box = outputs['pred_box'].view(-1, 4)                  # [BM, 4]
       
        
        gt_objectness = gt_objectness.view(-1).to(device).float()               # [BM,]
        gt_classes = gt_classes.view(-1, self.num_classes).to(device).float()   # [BM, C]
        gt_bboxes = gt_bboxes.view(-1, 4).to(device).float()                    # [BM, 4]

        pos_masks = (gt_objectness > 0)
        num_fgs = pos_masks.sum()         # 正样本的数量

        if is_dist_avail_and_initialized():
            torch.distributed.all_reduce(num_fgs)
        # 考虑到我们可能会用到多张GPU,因此我们需要将所有GPU上的正样本数量num_fgs做个平均。    
        num_fgs = (num_fgs / get_world_size()).clamp(1.0)

        # obj loss
        # objectness损失,由于这一损失是全局操作,即所有的正样本和负样本都要参与进来,因此没有特殊的操作,直接计算即可,然后做归一化。
        loss_obj = self.loss_objectness(pred_obj, gt_objectness)
        loss_obj = loss_obj.sum() / num_fgs

        # cls loss
        # 对于classification损失,我们只计算正样本处的这部分损失
        # 因此,我们需要先使用先前得到的pos_masks取出正样本处的预测和标签,然后再去计算损失和归一化。
        pred_cls_pos = pred_cls[pos_masks]
        gt_classes_pos = gt_classes[pos_masks]
        loss_cls = self.loss_classes(pred_cls_pos, gt_classes_pos)
        loss_cls = loss_cls.sum() / num_fgs

        # box loss
        # 对于bbox损失,操作基本同上,取出正样本处的预测和标签,然后计算损失,最后再做一次归一化。
        pred_box_pos = pred_box[pos_masks]
        gt_bboxes_pos = gt_bboxes[pos_masks]
        loss_box = self.loss_bboxes(pred_box_pos, gt_bboxes_pos)
        loss_box = loss_box.sum() / num_fgs
        
        # total loss
        losses = self.loss_obj_weight * loss_obj + \
                 self.loss_cls_weight * loss_cls + \
                 self.loss_box_weight * loss_box

        # 最后,将所有的损失加权求和,存放在一个Dict变量里去,输出即可
        loss_dict = dict(
                loss_obj = loss_obj,
                loss_cls = loss_cls,
                loss_box = loss_box,
                losses = losses
        )

        return loss_dict

2.2 GIou loss

损失函数的实现比较简单,这里重点介绍下GIou loss:

MSE作为损失函数的缺点:

  • 原版YOLOV1中使用MSE作为损失函数,之后Fast R-CNN提出了Smooth L1的损失函数,它们的共同点都是使用两个角点,四个坐标作为计算损失函数的变量,我们称之为ln-norm算法。

    • 绿色框是ground truth,黑色框是预测bounding box。我们假设预测框的左下角是固定的,只要右上角在以ground truth为圆心的圆周上这些预测框都有相同的 ln 损失值,但是很明显它们的检测效果的差距是非常大的。与之对比的是IoU和GIoU则在这几个不同的检测框下拥有不同的值,比较真实的反应了检测效果的优劣。

    • 因此 ln -norm损失函数不和检测结果强相关。

    • 在这里插入图片描述

IOU作为损失函数:

  • 从上图中我们可以看出IoU损失要比 ln 损失更能反应检测效果的优劣,IoU损失函数可以表示为式:

L I o U = 1 − ∣ A ⋂ B ∣ ∣ A ⋃ B ∣ L_{IoU}=1-\frac{|A \bigcap B|}{|A \bigcup B|} LIoU=1ABAB

  • IOU作为损失函数的特点:

    • 尺度不变性:IoU反应的是两个检测框交集和并集之间的比例,因此和检测框的大小无关。而 ln 则是和尺度相关的,对于相同损失值的大目标和小目标,大目标的检测效果要优于小目标,因此IoU损失对于小目标的检测也是有帮助的;

    • IoU是一个距离:这个距离是指评估两个矩形框之间的一个指标,这个指标具有distance的一切特性,包括对称性,非负性,同一性,三角不等性。

  • IoU损失的最大问题是当两个物体没有互相覆盖时,损失值都会变成1,而不同的不覆盖情况明显也反应了检测框的优劣,如下图所示。可以看出当ground truth(黑色框)和预测框(绿色框)没有交集时,IOU的值都是0,而GIoU则拥有不同的值,而且和检测效果成正相关。

    • 在这里插入图片描述

GIOU作为损失函数:

  • GIoU损失拥有IoU损失的所有优点,但是也具有IoU损失不具有的一些特性。

    • GIoU也就有尺度不变性;
    • GIoU也是一个距离,因此拥有对称性,非负性,同一性和三角不等性;
    • GIoU是IoU的下界,即 GIoU(A,B)≤IoU(A,B) ,且当A和B的距离越接近,GIoU和IoU的值越接近 ;
    • GIoU的值域是 −1 到 1 。当 A 和 B 完美重合时, GIoU(A,B)=1 ;当 A 和 B 的距离特别远,此时它们的闭包趋近于无穷大,此时 IoU(A,B)=0 , 因此GIoU(A,B)=-1
  • GIoU的目标相当于在损失函数中加入了一个ground truth和预测框构成的闭包的惩罚,它的惩罚项是闭包减去两个框的并集后的面积在闭包中的比例越小越好

  • 如下所示,闭包是红色虚线的矩形,我们要最小化阴影部分的面积除以闭包的面积。

    • 在这里插入图片描述
  • 计算公式如下:先计算两个框的最小闭包区域面积 Ac (通俗理解:同时包含了预测框和真实框的最小框的面积),再计算出IoU,再计算闭包区域中不属于两个框的区域占闭包区域的比重,最后用IoU减去这个比重得到GIoU。

G I o U = I o U − ∣ A c − U ∣ ∣ A c ∣ G_{IoU}=IoU-\frac{|A_c - U|}{|A_c|} GIoU=IoUAcAcU

  • GIoU损失优化的是当两个矩形框没有重叠时候的情况,而当两个矩形框的位置非常接近时,GIoU损失和IoU损失的值是非常接近的,因此在某些场景下使用两个损失的模型效果应该比较接近,但是GIoU应该具有更快的收敛速度。
  • 从GIoU的性质中我们可以看出GIoU在两个矩形没有重叠时,它的优化目标是最小化两个矩形的闭包或是增大预测框的面积,但是第二个目标并不是十分直接。

当然还有别的损失函数,可以参考:

IoU、GIoU、DIoU、CIoU损失函数的那点事儿 - 知乎 (zhihu.com)

GIoU的实现:

import numpy as np
import torch

def get_giou(bboxes1, bboxes2):
    """
    计算GIOU值
    :param bboxes1: 预测框
    :param bboxes2: 真实框
    :return:
    """
    eps = torch.finfo(torch.float32).eps
    bboxes1_area = (bboxes1[..., 2] - bboxes1[..., 0]).clamp_(min=0) \
                   * (bboxes1[..., 3] - bboxes1[..., 1]).clamp_(min=0)   # 所有预测框的面积
    bboxes2_area = (bboxes2[..., 2] - bboxes2[..., 0]).clamp_(min=0) \
                   * (bboxes2[..., 3] - bboxes2[..., 1]).clamp_(min=0)   # 所有真实框的面积

    w_intersect = (
                    torch.min(bboxes1[..., 2], bboxes2[..., 2])       # 相交区域的w
                       - torch.max(bboxes1[..., 0], bboxes2[..., 0])
                   ).clamp_(min=0)
    h_intersect = (
                    torch.min(bboxes1[..., 3], bboxes2[..., 3])
                       - torch.max(bboxes1[..., 1], bboxes2[..., 1])   # 相交区域的h
                   ).clamp_(min=0)

    area_intersect = w_intersect * h_intersect                 # 相交区域面积
    area_union = bboxes2_area + bboxes1_area - area_intersect  # 两个区域的并集
    ious = area_intersect / area_union.clamp(min=eps)          # 计算预测框和真实框之间的IOU值

    g_w_intersect = torch.max(bboxes1[..., 2], bboxes2[..., 2]) - torch.min(bboxes1[..., 0], bboxes2[..., 0])  # 两个区域并集的w
    g_h_intersect = torch.max(bboxes1[..., 3], bboxes2[..., 3]) - torch.min(bboxes1[..., 1], bboxes2[..., 1])   # 两个区域并集的h
    ac_uion = g_w_intersect * g_h_intersect    # Ac
    gious = ious - (ac_uion - area_union) / ac_uion.clamp(min=eps)
    return gious




if __name__ == '__main__':
    pred_box = torch.tensor(np.asarray([
        [1, 1, 3, 3.2],
        [1, 1, 4, 4]
    ]) * 100)

    gt_box = torch.tensor(np.asarray([
        [2, 2, 4.4, 4.5],
        [1, 1, 4, 4]
    ]) * 100)

    print(get_giou(bboxes1=pred_box, bboxes2=gt_box))

现在,我们已经搭建好了模型,也写好了标签分配和计算损的代码,下一步即可准备开始训练我们的模型。

不过至今为止,我们都还没有详细讲数据一环,包括数据读取、数据预处理和数据增强等十分重要的操作。因此,在正式开始训练我们的模型之前,还需要进行数据操作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/286408.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Qt(三):udp组播的发送与接收

1. 创建UDP套接字 使用QUdpSocket类创建一个UDP套接字。 udpSendnew QUdpSocket(this);udpRecenew QUdpSocket(this); 2. 绑定套接字 绑定套接字到一个本地地址和端口。可以使用bind()函数来完成。 如果要在组播中发送数据&#xff0c;可以将套接字绑定到一个通配符地址&#…

m1芯片电脑上的paragon15如何安装激活 m1芯片电脑上ntfs for mac如何安装

Paragon NTFS软件在M1芯片电脑上安装之后&#xff0c;最后一步会让我们“允许加载第三方内核扩展”&#xff0c;具体如下图所示。 图1&#xff1a;允许加载第三方内核扩展 按照图中提示“单击此处“&#xff0c;然后打开安全与隐私。接下来依次点击小锁标志进行解锁&#xff0c…

Abstract Factory抽象工厂模式(对象创建)

抽象工厂模式&#xff1a;Abstract Factory 链接&#xff1a;抽象工厂模式实例代码 解析 目的 在软件系统中&#xff0c;经常面临着“一系列相互依赖的对象工作”&#xff1b;同时&#xff0c;由于需求的变化&#xff0c;往往存在更多系列对象的创建工作。 如何应对这种变化…

EBDP:解锁大数据的奥秘✨

大数据时代已经来临&#xff0c;你是否也想掌握这门“显学”&#xff1f;&#x1f31f; EBDP&#xff0c;这个让众多专业人士趋之若鹜的认证&#xff0c;究竟有何魅力&#xff1f;今天就带你一探究竟&#xff01; &#x1f31f;EBDP&#xff1a;大数据的“敲门砖”&#x1faa…

无线路由器的五种工作模式:

1.Router&#xff0c;即无线路由模式&#xff0c;这也是我们最常用的一种工作方式&#xff0c;一般家里宽带连接&#xff0c;将宽带猫连接在无线路由的WAN口上&#xff0c;然后做拨号帐号设置&#xff0c;就用这个模式即可。 在Router&#xff08;无线路由&#xff09;模式下&a…

预售价80万元的ET9,能否拯救蔚来【不断恶化】的财务业绩?

来源&#xff1a;猛兽财经 作者&#xff1a;猛兽财经 发布新车型 12月23日&#xff0c;蔚来&#xff08;NIO&#xff09;的创始人李斌在西安NIO DAY上发布了蔚来自成立以来售价最高的车型--ET9。 据猛兽财经了解&#xff0c;ET9定位于行政旗舰&#xff0c;预售价为80万元&…

【C语言】Windows上用GTK写GUI程序

要使用GTK开发一个Windows图形用户界面程序&#xff0c;需要首先设置GTK开发环境。这通常包括安装GTK库和它的依赖&#xff0c;以及配置编译器和工具链。可以选择使用纯C语言和GTK库或者使用支持GTK绑定的其他语言&#xff0c;如Python、C或Rust。 1. 安装GTK开发库 在Window…

QT上位机开发(绘图软件)

【 声明&#xff1a;版权所有&#xff0c;欢迎转载&#xff0c;请勿用于商业用途。 联系信箱&#xff1a;feixiaoxing 163.com】 稍微复杂一点的软件&#xff0c;一般都是带有绘图功能。绘图的意义&#xff0c;不仅仅是像CAD一样&#xff0c;可以进行模型的设计、比对和调试。它…

mysql之四大引擎、账号管理以及建库

一.数据库存储引擎 1.1存储引擎的查看 1.2InnoDB 1.3MyISAM 1.4 MEMORY 1.5 Archive 二.数据库管理 2.1元数据库简介 2.2元数据库分类 2.3 相关操作 2.4 MySQL库 三.数据表管理 3.1三大范式 3.2 基本数据类型 3.2.1优化原则 3.3 整形 3.4 实数 3.5 字符串 3.6 text&…

Java反射机制和动态代理

反射和动态代理 反射前言获取class对象的方式反射获取构造方法反射获取成员变量反射获取成员方法实例 动态代理 反射 前言 什么是反射&#xff1f; 反射允许对成员变量&#xff0c;成员方法和构造方法的信息进行编程访问。 为什么用反射 / 反射的作用&#xff1f; 可以轻易地获…

Scene Creator

场景创建器是一个方便、易于使用的编辑工具&#xff0c;旨在简化创建新场景的过程。使用场景创建器&#xff0c;您可以选择一个模板场景&#xff0c;定义一个目录来存储您的场景&#xff0c;并在需要时自动将新场景添加到构建中。 下载&#xff1a; ​​Unity资源商店链接 资…

微软好听的tts语音包下载,粤语,韩语,日语

微软的 tts 语音库&#xff0c;都是离线的&#xff0c;所以速度非常快 但资源比较少&#xff0c;比如粤语&#xff0c;韩语&#xff0c;日语 我发现一个老牌语音技术供应商。 资源丰富&#xff0c;可自行下载免费或收费语音包。 网站&#xff1a;正版用户专用配套播音员下载…

im6ull学习总结(三-2)文字显示中文字符

承接上篇文章 中文字符的点阵显示 使用点阵字库时&#xff0c;中文字符的显示原理跟 ASCII 字符是一样的。要注意的地方在于中文的编码&#xff1a;在 C 源文件中它的编码方式是 GB2312 还是 UTF-8&#xff1f;编译出的可执行程序&#xff0c;其中的汉字编码方式是 GB2312 还…

机器学习(二) -- 数据预处理(2)

系列文章目录 机器学习&#xff08;一&#xff09; -- 概述 机器学习&#xff08;二&#xff09; -- 数据预处理&#xff08;1-3&#xff09; 机器学习&#xff08;三&#xff09; -- 特征工程&#xff08;1-2&#xff09; 未完待续…… 目录 系列文章目录 前言 四、【数…

三、C语言中的分支与循环—while循环 (5)

本章分支结构的学习内容如下&#xff1a; 三、C语言中的分支与循环—if语句 (1) 三、C语言中的分支与循环—关系操作符 (2) 三、C语言中的分支与循环—条件操作符 与逻辑操作符(3) 三、C语言中的分支与循环—switch语句&#xff08;4&#xff09;分支结构 完 本章循环结…

部署上传漏洞的靶场环境upload-labs

1、工具介绍 upload-labs是一个使用php语言编写的&#xff0c;专门收集渗透测试和CTF中遇到的各种上传漏洞的靶场。旨在帮助大家对上传漏洞有一个全面的了解。目前一共20关&#xff0c;每一关都包含着不同上传方式。 upload-labs靶场开源地址&#xff1a;&#xff1a;https://…

Android14之禁掉Selinux的两种方式(一百七十四)

简介&#xff1a; CSDN博客专家&#xff0c;专注Android/Linux系统&#xff0c;分享多mic语音方案、音视频、编解码等技术&#xff0c;与大家一起成长&#xff01; 优质专栏&#xff1a;Audio工程师进阶系列【原创干货持续更新中……】&#x1f680; 优质专栏&#xff1a;多媒…

经典卷积神经网络-ResNet

经典卷积神经网络-ResNet 一、背景介绍 残差神经网络(ResNet)是由微软研究院的何恺明、张祥雨、任少卿、孙剑等人提出的。ResNet 在2015 年的ILSVRC&#xff08;ImageNet Large Scale Visual Recognition Challenge&#xff09;中取得了冠军。残差神经网络的主要贡献是发现了…

为什么python值得学习,python的应用领域。

文章目录 前言Web 应用开发自动化运维网络爬虫数据分析科学计算人工智能胶水语言Python技术资源分享1、Python所有方向的学习路线2、学习软件3、入门学习视频4、实战案例5、清华编程大佬出品《漫画看学Python》6、Python副业兼职与全职路线 前言 说起编程语言&#xff0c;Pyth…

【电商项目实战】购物车完善

&#x1f389;&#x1f389;欢迎来到我的CSDN主页&#xff01;&#x1f389;&#x1f389; &#x1f3c5;我是Java方文山&#xff0c;一个在CSDN分享笔记的博主。&#x1f4da;&#x1f4da; &#x1f31f;推荐给大家我的专栏《电商项目实战》。&#x1f3af;&#x1f3af; &am…