libaom threads线程配置

参数配置 parse_stream_params

} else if (arg_match(&arg, &g_av1_codec_arg_defs.threads, argi)) {

config->cfg.g_threads = arg_parse_uint(&arg);

使用线程个数参数g_threads

int av1_compute_num_fp_contexts(AV1_PRIMARY *ppi, AV1EncoderConfig *oxcf)

{

//编码模块并行工作线程数量初始化为0

ppi->p_mt_info.num_mod_workers[MOD_FRAME_ENC] = 0;

//检查并行多线程配置是否有效如果无效直接返回1(表示单帧处理)

if (!av1_check_fpmt_config(ppi, oxcf)) {

return 1;

}

//计算最大编码工作线程

int max_num_enc_workers = compute_max_num_enc_workers(

&ppi->cpi->common.mi_params, ppi->cpi->common.seq_params->mib_size_log2);

//用于调整每个工作线程数量计算缩放因子舍入因子

// Scaling factors and rounding factors used to tune worker_per_frame

// computation.

int rounding_factor[2] = { 2, 4 };

int scaling_factor[2] = { 4, 8 };

//判断视频分辨率是否为480p或者更低

int is_480p_or_lesser =

AOMMIN(oxcf->frm_dim_cfg.width, oxcf->frm_dim_cfg.height) <= 480;

int is_sb_64 = 0;

//判断视频分辨率是否480p或者更低

if (ppi->cpi != NULL)

is_sb_64 = ppi->cpi->common.seq_params->sb_size == BLOCK_64X64;

//根据分辨率超级大小选择合适索引对于480p而且超级大小64x64情况使用索引1否则使用索引0

// A parallel frame encode has at least 1/4th the

// theoretical limit of max enc workers in default case. For resolutions

// larger than 480p, if SB size is 64x64, optimal performance is obtained with

// limit of 1/8.

int index = (!is_480p_or_lesser && is_sb_64) ? 1 : 0;

//计算每个工作线程确保至少1

int workers_per_frame =

AOMMAX(1, (max_num_enc_workers + rounding_factor[index]) /

scaling_factor[index]);

//获取最大线程数量

int max_threads = oxcf->max_threads;

//计算并行上下文数量

int num_fp_contexts = max_threads / workers_per_frame;

//如果使用多块编码 tile encoding

// Based on empirical results, FPMT gains with multi-tile are significant when

// more parallel frames are available. Use FPMT with multi-tile encode only

// when sufficient threads are available for parallel encode of

// MAX_PARALLEL_FRAMES frames.

if (oxcf->tile_cfg.tile_columns > 0 || oxcf->tile_cfg.tile_rows > 0) {

//并行数量小于MAX_PARALLEL_FRAMES并行上下文数量设置1

if (num_fp_contexts < MAX_PARALLEL_FRAMES) num_fp_contexts = 1;

}

//确保并行上下文数量1MAX_PARALLEL_FRAMES 之间

num_fp_contexts = AOMMAX(1, AOMMIN(num_fp_contexts, MAX_PARALLEL_FRAMES));

//如果ppi->num_fp_contexts1保持计算出num_fp_contexts 不变

//否则num_fp_contexts限制ppi->num_fp_contexts当前计算值较小

// Limit recalculated num_fp_contexts to ppi->num_fp_contexts.

num_fp_contexts = (ppi->num_fp_contexts == 1)

? num_fp_contexts

: AOMMIN(num_fp_contexts, ppi->num_fp_contexts);

//如果帧并行上下文数量大于1

if (num_fp_contexts > 1) {

//计算编码模块并行工作线程数量确保不超过最大线程

ppi->p_mt_info.num_mod_workers[MOD_FRAME_ENC] =

AOMMIN(max_num_enc_workers * num_fp_contexts, oxcf->max_threads);

}

//返回计算并行上下文数量

return num_fp_contexts;

}

2.10 compute_num_enc_row_mt_workers

// Computes the number of workers for row multi-threading of encoding stage

// 计算编码阶段行多线程的工作线程数

static inline int compute_num_enc_row_mt_workers(const AV1_COMMON *cm,

int max_threads) {

// 定义一个TileInfo结构体变量,用于存储瓦片(tile)信息

TileInfo tile_info;

// 获取视频帧中瓦片的列数

const int tile_cols = cm->tiles.cols;

// 获取视频帧中瓦片的行数

const int tile_rows = cm->tiles.rows;

// 初始化行多线程的总线程数为0

int total_num_threads_row_mt = 0;

// 遍历每一行瓦片

for (int row = 0; row < tile_rows; row++) {

// 遍历每一列瓦片

for (int col = 0; col < tile_cols; col++) {

// 初始化当前瓦片的信息

av1_tile_init(&tile_info, cm, row, col);

// 获取当前瓦片中超级块(super block)的行数

const int num_sb_rows_in_tile = av1_get_sb_rows_in_tile(cm, &tile_info);

// 获取当前瓦片中超级块的列数

const int num_sb_cols_in_tile = av1_get_sb_cols_in_tile(cm, &tile_info);

// 计算当前瓦片可用于行多线程的线程数,并累加到总线程数中

// AOMMIN((num_sb_cols_in_tile + 1) >> 1, num_sb_rows_in_tile)

// 这一步是取 (超级块列数 + 1) 右移一位 和 超级块行数 中的较小值

total_num_threads_row_mt +=

AOMMIN((num_sb_cols_in_tile + 1) >> 1, num_sb_rows_in_tile);

}

}

// 返回总线程数和最大线程数中的较小值

return AOMMIN(max_threads, total_num_threads_row_mt);

}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/946318.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【工具变量】国际消费中心城市DID数据(2007年-2023年)

数据简介 国际消费中心城市的定位是一个国家乃至全球消费市场消费资源的集中地和关键枢纽&#xff0c;该城市特质不单顺应我国对外交流与开放的不断扩大的趋势&#xff0c;其培育和建设国际消费中心城市的一大意义在于&#xff0c;以地区地域资源中心定位&#xff0c;来推动周围…

如何修复 WordPress 中的“Error establishing a database connection”问题

如何修复 WordPress 中的“Error establishing a database connection”问题 在使用 WordPress 建站时&#xff0c;如果你看到“Error establishing a database connection”的提示&#xff0c;不要慌张。这通常意味着网站无法连接到数据库&#xff0c;因此无法显示内容。下面…

streamlit、shiny、gradio、fastapi四个web APP平台体验

streamlit、shiny、gradio、fastapi四个web APP平台体验 经常被问的问题就是&#xff1a;web APP平台哪个好&#xff1f;该用哪个&#xff1f;刚开始只有用streamlit和shiny&#xff0c;最近体验了一下gradio和fastapi&#xff0c;今天根据自己的体会尝试着回答一下。 使用R语…

http报头解析

http报文 http报文主要有两类是常见的&#xff0c;第一类是请求报文&#xff0c;第二类是响应报文&#xff0c;每个报头除了第一行&#xff0c;都是采用键值对进行传输数据&#xff0c;请求报文的第一行主要包括http方法&#xff08;GET&#xff0c;PUT&#xff0c; POST&#…

Qwen-Agent

文章目录 一、关于 Qwen-Agent更新准备&#xff1a;模型服务免责声明 二、安装三、快速开发步骤 1&#xff1a;添加自定义工具步骤 2&#xff1a;配置 LLM步骤 3&#xff1a;创建智能体步骤 4&#xff1a;运行智能体 四、FAQ1、支持函数调用&#xff08;也称为工具调用&#xf…

flux文生图模型实践

flux文生图模型实践 flyfish https://github.com/black-forest-labs/flux Black Forest Labs发布FLUX.1 Tools&#xff0c;这是一套模型全家桶&#xff0c;旨在为FLUX.1基础文本转图像模型添加控制和可操纵性&#xff0c;从而实现对真实图像和生成图像的修改和重新创建。FLU…

【ETCD】【实操篇(十九)】ETCD基准测试实战

目录 1. 设定性能基准要求2. 使用基准测试工具基准测试命令 3. 测试不同的负载和场景4. 监控集群性能5. 评估硬件和网络的影响6. 对比性能基准7. 负载均衡和容错能力测试8. 优化与调优9. 测试在高负载下的表现总结 1. 设定性能基准要求 首先&#xff0c;明确集群性能的目标&am…

Docker Compose 构建 EMQX 集群 实现mqqt 和websocket

EMQX 集群化管理mqqt真香 目录 #目录 /usr/emqx 容器构建 vim docker-compose.yml version: 3services:emqx1:image: emqx:5.8.3container_name: emqx1environment:- "EMQX_NODE_NAMEemqxnode1.emqx.io"- "EMQX_CLUSTER__DISCOVERY_STRATEGYstatic"- …

【Cesium】三、实现开场动画效果

文章目录 实现效果实现方法实现代码组件化 实现效果 实现方法 Cesium官方提供了Camera的flyTo方法实现了飞向目的地的动画效果。 官方API&#xff1a;传送门 这里只需要用到目的地&#xff08;destination&#xff09;和持续时间&#xff08;duration&#xff09;这两个参数…

Qt从入门到入土(七)-实现炫酷的登录注册界面(下)

前言 Qt从入门到入土&#xff08;六&#xff09;-实现炫酷的登录注册界面&#xff08;上&#xff09;主要讲了如何使用QSS样式表进行登录注册的界面设计&#xff0c;本篇文章将介绍如何对登录注册界面进行整体控件的布局&#xff0c;界面的切换以及实现登录、记住密码等功能。…

智能化人才招聘系统是怎样的?

随着企业规模的扩大和业务范围的拓展&#xff0c;人才招聘成为了企业发展的关键环节。然而&#xff0c;市面上的人才招聘系统琳琅满目&#xff0c;质量参差不齐&#xff0c;许多企业发现&#xff0c;并非所有系统都能满足他们的需求&#xff0c;特别是智能化的需求。今天&#…

论文分享 | PromptFuzz:用于模糊测试驱动程序生成的提示模糊测试

大语言模型拥有的强大能力可以用来辅助多种工作&#xff0c;但如何有效的辅助仍然需要人的精巧设计。分享一篇发表于2024年CCS会议的论文PromptFuzz&#xff0c;它利用模型提示生成模糊测试驱动代码&#xff0c;并将代码片段嵌入到LLVM框架中执行模糊测试。 论文摘要 制作高质…

[最佳方法] 如何将视频从 Android 发送到 iPhone

概括 将大视频从 Android 发送到 iPhone 或将批量视频从 iPhone 传输到 Android 并不是一件容易的事情。也许您已经尝试了很多关于如何将视频从 Android 发送到 iPhone 15/14 的方法&#xff0c;但都没有效果。但现在&#xff0c;通过本文中的这 6 种强大方法&#xff0c;您可…

cesium小知识: 处理动画的5种方式

在 Cesium 中处理动画可以通过多种方式实现,具体取决于你想要创建的动画类型。Cesium 提供了丰富的API来支持不同种类的动画,包括但不限于物体的移动、旋转、缩放、属性变化等。以下是几种常见的动画处理方法: 1. 使用 Entity 和 SampledProperty 对于动态数据或随时间变化…

003:如何理解 CNN 中的 RGB 图像和通道?

本文为合集收录&#xff0c;欢迎查看合集/专栏链接进行全部合集的系统学习。 合集完整版请参考这里。 在灰度图一节的最后&#xff0c;给出了一个由彩色图片转成灰度图的示例&#xff0c;并且通过 color_image.mode获取了图片的格式&#xff1a;彩色图片获取到的格式为 RGBA&a…

小程序基础 —— 07 创建小程序项目

创建小程序项目 打开微信开发者工具&#xff0c;左侧选择小程序&#xff0c;点击 号即可新建项目&#xff1a; 在弹出的新页面&#xff0c;填写项目信息&#xff08;后端服务选择不使用云服务&#xff0c;开发模式为小程序&#xff0c;模板选择为不使用模板&#xff09;&…

TP 钱包插件版本的使用

目前 TokenPocket 的几个平台中&#xff0c;以 ios 和 安卓版本最为常见&#xff0c;其实很少有人知道&#xff0c;浏览器上有一个插件版本的 Tp, 用电脑多的话&#xff0c;这也是一个挺好的选择。 最新版本现在支持Chrome、Brave 浏览器、Edge&#xff08;Firefox及Opera正在…

【AIGC】使用Java实现Azure语音服务批量转录功能:完整指南

文章目录 引言技术背景环境准备详细实现1. 基础架构设计2. 实现文件上传功能3. 提交转录任务crul4. 获取转录结果 使用示例结果示例最佳实践与注意事项总结 引言 在当今数字化时代&#xff0c;将音频内容转换为文本的需求越来越普遍。无论是会议记录、视频字幕生成&#xff0c…

【UVM】搭建一个验证平台

UVM环境组件 组件功能 sequence_item&#xff1a;包装数据 UVM中&#xff0c;所有的transaction都要从uvm_sequence_item派生sequence item是每一次driver与DUT互动的最小粒度内容sequence&#xff1a;产生数据 uvm_sequence是一个参数化的类&#xff0c;其参数是transactio…

用Python操作字节流中的Excel文档

Python能够轻松地从字节流中加载文件&#xff0c;在不依赖于外部存储的情况下直接对其进行读取、修改等复杂操作&#xff0c;并最终将更改后的文档保存回字节串中。这种能力不仅极大地提高了数据处理的灵活性&#xff0c;还确保了数据的安全性和完整性&#xff0c;尤其是在网络…