Windows平台RTMP推送|轻量级RTSP服务如何实现摄像头叠加到屏幕输出

技术背景

我们在用Windows平台RTMP推送、轻量级RTSP服务实现无纸化同屏、智慧教室等场景的时候,有个需求是,需要主讲人(或老师)的摄像头数据,叠加到屏幕上输出出去,这就是今天我们需要讲的视频视频叠加。

技术实现

实际上,大牛直播SDK的视频叠加这块做的非常先进,采用类似于Photoshop图层的概念,比如如需要摄像头实时叠加到屏幕,那么第0层,可以设置屏幕数据,第1层可以设置摄像头数据,以C#为例,设置如下:

/* SmartPublisherDemoDlg.cs
 * Author: daniusdk.com
 */
//摄像头overlay到桌面
int left = Int32.Parse(edit_clip_left_.Text);
int top = Int32.Parse(edit_clip_top_.Text);
int w = Int32.Parse(edit_clip_width_.Text);
int h = Int32.Parse(edit_clip_height_.Text);

// 有一个是0, 就使用全屏
if ( w == 0 || h == 0 )
{
	left = 0;
	top = 0;
	GetScreenSize(ref w, ref h);
}
else
{
	// 保证4字节对齐
	w = NT_ByteAlign(w, 4);
	h = NT_ByteAlign(h, 4);
}

NTSmartPublisherSDK.NT_PB_ClearLayersConfig(publisher_handle_, 0, 0, IntPtr.Zero);

//第一层:屏幕
NT_PB_ScreenLayerConfig screen_layer_c0 = new NT_PB_ScreenLayerConfig();

type = (Int32)NTSmartPublisherDefine.NT_PB_E_LAYER_TYPE.NT_PB_E_LAYER_TYPE_SCREEN;
fill_layer_base(screen_layer_c0, out screen_layer_c0.base_, type, index, true, left, top, w, h);
screen_layer_index_ = screen_layer_c0.base_.index_;

screen_layer_c0.clip_region_.x_ = left;
screen_layer_c0.clip_region_.y_ = top;
screen_layer_c0.clip_region_.width_ = w;
screen_layer_c0.clip_region_.height_ = h;

screen_layer_c0.reserve_ = IntPtr.Zero;

if (add_layer_config(screen_layer_c0, type))
	index++;

//第二层:摄像头
if (-1 != cur_sel_camera_index_)
{
	int c_l = Int32.Parse(edit_camera_overlay_left_.Text);
	int c_t = Int32.Parse(edit_camera_overlay_top_.Text);

	int c_w = Int32.Parse(edit_camera_overlay_width_.Text);
	int c_h = Int32.Parse(edit_camera_overlay_height_.Text);

	if (c_w == 0)
	{
		c_w = w / 2;
	}

	if (c_h == 0)
	{
		c_h = h / 2;
	}

	ctos_camera_layer_c1_ = new NT_PB_CameraLayerConfigV2();

	CameraInfo camera = cameras_[cur_sel_camera_index_];
	NT_PB_VideoCaptureCapability cap = camera.capabilities_[cur_sel_camera_resolutions_index_];

	ctos_camera_layer_c1_.device_unique_id_utf8_ = camera.id_;

	type = (Int32)NTSmartPublisherDefine.NT_PB_E_LAYER_TYPE.NT_PB_E_LAYER_TYPE_CAMERA;
	fill_layer_base(ctos_camera_layer_c1_, out ctos_camera_layer_c1_.base_, type, index, true, c_l, c_t, c_w, c_h);
	camera_layer_index_ = ctos_camera_layer_c1_.base_.index_;

	if (btn_check_flip_horizontal_camera_.Checked)
	{
		ctos_camera_layer_c1_.is_flip_horizontal_ = 1;
	}
	else
	{
		ctos_camera_layer_c1_.is_flip_horizontal_ = 0;
	}

	if (btn_check_flip_vertical_camera_.Checked)
	{
		ctos_camera_layer_c1_.is_flip_vertical_ = 1;
	}
	else
	{
		ctos_camera_layer_c1_.is_flip_vertical_ = 0;
	}

	ctos_camera_layer_c1_.rotate_degress_ = GetCameraRotateDegress();

	if (add_layer_config(ctos_camera_layer_c1_, type))
		index++;
}

NTSmartPublisherSDK.NT_PB_SetFrameRate(publisher_handle_, UInt32.Parse(edit_frame_rate_.Text));

界面设置如下,推送RTMP或启动轻量级RTSP服务之前,选择“摄像头叠加到屏幕”选项,然后,如果需要设置位置,可以设置摄像头的位置:

如果需要实时关闭或打开叠加的摄像头:

private void btn_disable_camera_overlay__Click(object sender, EventArgs e)
{
	if (btn_camera_overlay_to_desktop.Checked)
	{
		if (publisher_handle_ != IntPtr.Zero)
		{
			String str_btn_text = btn_disable_camera_overlay_.Text;

			String strStopOverlayCmr = "停止叠加摄像头";

			if (str_btn_text.Equals(strStopOverlayCmr))
			{
				if (NTBaseCodeDefine.NT_ERC_OK == NTSmartPublisherSDK.NT_PB_EnableLayer(publisher_handle_, 0,
					camera_layer_index_, 0))
				{
					btn_disable_camera_overlay_.Text = "叠加摄像头";
				}
			}
			else
			{
				if (NTBaseCodeDefine.NT_ERC_OK == NTSmartPublisherSDK.NT_PB_EnableLayer(publisher_handle_, 0,
					camera_layer_index_, 1))
				{
					btn_disable_camera_overlay_.Text = "停止叠加摄像头";
				}
			}
		}
	}
}

叠加后输出的效果如下:

技术总结

无论是摄像头叠加屏幕,还是屏幕叠加摄像头,亦或屏幕或摄像头添加动态图片或文字水印,大牛直播SDK都是采用图层设计,很容易扩展,也很容易随时隐藏某个图层,确保整体设计更灵活,满足大多数图像叠加场景的技术诉求。

以RTMP推送模块为例,我们目前功能设计如下:

  • [视频采集处理]Windows平台涵盖“Windows视频采集处理SDK”功能;
  •  [音频采集处理]Windows平台涵盖“Windows音频采集处理SDK”功能;
  •  [本地预览]Windows平台支持摄像头/屏幕/合成数据实时预览功能,Android/iOS平台支持本地前后置摄像头预览;
  •  [摄像头反转/旋转]Windows平台支持摄像头水平反转、垂直反转、0°/90°/180°/270°旋转;
  •  [摄像头采集]除常规YUV格式外,Windows平台还支持MJPEG格式的摄像头采集;
  •  [麦克风/扬声器采集]Windows平台音频输入端支持麦克风、扬声器,或麦克风和扬声器混音输入;
  •  [RTMP推流]超低延时的RTMP协议直播推流SDK(Windows/Android/iOS支持RTMP扩展H.265推送);
  •  [视频格式]Windows/Android平台支持H.264/H.265编码(Android H.265硬编码),iOS平台支持H.264编码;
  •  [音频格式]Windows/Android/iOS平台支持AAC编码,Windows/Android平台支持Speex编码;
  •  [音频编码]Windows/Android平台支持Speex推送、Speex编码质量设置;
  •  [音量调节]Windows/Android平台采集端支持实时音量调节(其中,Windows平台混音模式下支持单独控制麦克风、扬声器音量);
  •  [H.264硬编码]Windows/Android/iOS平台支持H.264特定机型硬编码;
  •  [H.265硬编码]Android/iOS平台支持H.265特定机型硬编码;
  •  [硬编码自适应]Android/iOS平台支持硬编码自适应,如检测到硬编码不支持,自动切换到软编(iOS如H.265硬编,先切换到H.264硬编码,如不支持再尝试H.264软编);
  •  [软硬编码参数配置]支持gop间隔、帧率、bit-rate设置;
  •  [软编码参数配置]支持软编码profile、软编码速度、可变码率设置;
  •  [多实例推送]支持多实例推送(如同时推送屏幕/摄像头和外部数据);
  •  [RTMP扩展H.265]Windows/Android/iOS推送SDK支持RTMP扩展H.265推送和Enhanced RTMP H.265,Windows针对摄像头采集软编码,使用H.265可变码率,带宽大幅节省,效果直逼传统H.265编码摄像头,Android/iOS平台支持H.265硬编码;
  •  [横竖屏推流]Android/iOS平台支持支持横屏、竖屏推流;
  •  [多分辨率支持]支持摄像头或屏幕多种分辨率设置;
  •  [Windows推屏]Windows平台支持屏幕裁剪、窗口采集、屏幕/摄像头数据合成等多种模式推送;
  •  [移动端推屏]Android平台支持后台service推送屏幕(推送屏幕需要5.0+版本);
  •  [移动端推屏]iOS平台支持后台推送屏幕(基于ReplayKit,需要iOS 10.0+版本);
  •  [事件回调]支持各种状态实时回调;
  •  [水印]Windows平台支持文字水印、png水印、实时遮挡,Android平台支持文字水印、png水印;
  •  [RTMP推送模式]支持RTMP推送 live|record模式设置(需服务器支持);
  •  [镜像]Android/iOS平台支持前置摄像头实时镜像功能;
  •  [前后摄像头实时切换]Android/iOS平台支持采集过程中,前后摄像头切换;
  •  [复杂网络处理]支持断网重连等各种网络环境自动适配;
  •  [动态码率]支持根据网络情况自动调整推流码率;
  •  [实时静音]支持推送过程中,实时静音/取消静音;
  •  [实时快照]支持推流过程中,实时快照;
  •  [纯音频推流]支持仅采集音频流并发起推流功能;
  •  [纯视频推流]支持特殊场景下的纯视频推流功能;
  •  [降噪]Windows/Android平台支持环境音、手机干扰等引起的噪音降噪处理、自动增益、VAD检测;
  •  [回音消除]Android平台支持实时传递远端PCM数据,方便回音消除处理;
  •  [外部编码前视频数据对接]支持YUV数据对接;
  •  [外部编码前音频数据对接]支持PCM对接;
  •  [外部编码后视频数据对接]支持外部H.264数据对接;
  •  [外部编码后音频数据对接]外部AAC/PCMA/PCMU/SPEEX数据对接;
  •  [推送端休眠设置]Windows平台支持休眠接口(设置成休眠模式后CPU会适当降低);
  •  [编码后数据输出]Android平台支持输出编码后的H264/AAC数据到上层,方便对接第三方平台(如GB28181)对接;
  •  [扩展录像功能]完美支持和录像SDK组合使用,录像相关功能,可参见”Windows/Android/iOS录像SDK“;
  •  [裁剪模式]Android/iOS平台支持特定分辨率摄像头裁剪模式设置;
  •  [服务器兼容]支持自建服务器(如Nginx、SRS)或CDN。

几乎覆盖了RTMP推送所能涉及到的所有常规功能点,配合我们的RTMP或RTSP播放器,整体延迟在毫秒级,足以满足同屏叠加的技术诉求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/551736.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

appium2报错:Failed to create session. ‘automationName‘ can‘t be blank

1、问题概述? 今天在window环境中安装了appium2.5.2版本,通过appium inspector连接真机的时候报错如下: Failed to create session. automationName cant be blank 原因分析:这是因为appium2的比appium1有了很大的改进&#xff…

C++ 类和对象(二)

目录 1.前言 2.类的六个默认成员函数 3.构造函数 3.1概念 3.2特性 3.2.1 函数名与类名相同 3.2.2 无返回值 3.2.3对象实例化时自动调用 3.2.4 构造函数可以重载 3.2.5 默认构造函数的自动生成 3.2.6 默认构造函数对内置类型成员的初始化 3.2.7 默认构造函数的定义 4…

小红书app缓存清除

1.背景 小伙伴们,手机app运行产生的缓存在不断侵占着我们的收集的内存,运行个半年发现内存不足20%。其实很多情况我们通过各个手机自带的缓存清除功能,就可以把app运行过程中产生的内存清除掉,节省我们不少的空间。想一想手机上a…

二分查找的时间复杂度的讲解

二分查找的代码: 二分查找的时间复杂度: 最坏的情况: 就是找不到和查找区间只剩一个值的时候,这两种都是最坏的结果,假设查找了x次,达到了最坏的结果: N代表每一次折半区间数据的个数&#xf…

当你拥有Xbox-GamePass就能更快体验NewGame

如果你有游戏通行证终极通行证,那么你就可以看到很多预售的游戏,以及更多游戏内容。 Shadow of the Tomb Raider: Definitive Edition《古墓丽影:暗影(终极版)》 征服残酷无情的丛林,并活着走出来。探索充满裂隙和幽深…

I2C,UART,SPI(STM32、51单片机)

目录 基本理论知识: 并行通信/串行通信: 异步通信/同步通信: 半双工通信/全双工通信: UART串口: I2C串口: SPI串口: I2C在单片机中的应用: 软件模拟: 51单片机:…

Linux的进程管理

进程 程序运行在操作系统中,是被操作系统所管理的。 为管理运行的程序,每一个程序在运行的时候,便被操作系统注册为系统中的一个:进程 并会为每一个进程都分配一个独有的:进程ID(进程号) 查看…

C++进阶——继承

前言:从这篇文章开始,我们进入C进阶知识的分享,在此之前,我们需要先来回顾一个知识: C语言有三大特性,分别是封装、继承和多态,而我们前边所分享的各种容器类,迭代器等,…

基于SpringBoot的“线上教学平台”的设计与实现(源码+数据库+文档+PPT)

基于SpringBoot的“线上教学平台”的设计与实现(源码数据库文档PPT) 开发语言:Java 数据库:MySQL 技术:SpringBoot 工具:IDEA/Ecilpse、Navicat、Maven 系统展示 线上教学平台结构图 管理员登录界面图 学员管理界…

网络工程师-----第一天

线缆与进制转换 进制转换: 1.十进制: 都是以0-9这九个数字组成,不能以0开头。 2.二进制: 由0和1两个数字组成。 3.八进制: 由0-7数字组成,为了区分与其他进制的数字区别,开头都是以0开始。 4.十六进制…

Python数据结构【二】查找

前言 可私聊进一千多人Python全栈交流群(手把手教学,问题解答) 进群可领取Python全栈教程视频 多得数不过来的计算机书籍:基础、Web、爬虫、数据分析、可视化、机器学习、深度学习、人工智能、算法、面试题等。 🚀&a…

手动实现简易版RPC(下)

手动实现简易版RPC(下) 前言 什么是RPC?它的原理是什么?它有什么特点?如果让你实现一个RPC框架,你会如何是实现?带着这些问题,开始今天的学习。 接上一篇博客 手动实现简易版RPC(上&#xff…

抖音小店运营计划表年度电商规划管理模板

【干货资料持续更新,以防走丢】 抖音小店运营计划表年度电商规划管理模板 部分资料预览 资料部分是网络整理,仅供学习参考。 抖音店铺运营表格 (完整资料包含以下内容) 目录 抖音店铺运营计划: 一、店铺定位与目标…

MySql运维篇

目录 一.日志 1.1日志分类 1.2Error Log 1.3BinaryLog 1.4SlowQuery Log 二.备份 2.1备份原因 2.2备份目标 2.3备份技术 2.3.1物理备份 2.3.2逻辑备份 2.4备份方式 2.4.1完全备份 2.4.2增量备份 2.4.3差异备份 2.5备份环境准备 2.6完全备份实验 2.6.1完全备…

书生·浦语大模型全链路开源体系-第4课

书生浦语大模型全链路开源体系-第4课 书生浦语大模型全链路开源体系-第4课相关资源XTuner 微调 LLMXTuner 微调小助手认知环境安装前期准备启动微调模型格式转换模型合并微调结果验证 将认知助手上传至OpenXLab将认知助手应用部署到OpenXLab使用XTuner微调多模态LLM前期准备启动…

连锁服装卖场进销存一般怎么管理

连锁服装卖场的进销存管理是保证业务顺畅运作和最大化利润的关键之一。随着市场竞争的加剧和消费者需求的变化,良好的进销存管理能够帮助企业及时调整库存,减少滞销品,提高资金周转率,从而增强市场竞争力。本文将探讨连锁服装卖场…

单独设置浏览器滚动条上下箭头

解决方法 重点 ::-webkit-scrollbar-button:vertical 给垂直方向的滚动条设置样式 ::-webkit-scrollbar-button:vertical:start 上方向的按钮 ::-webkit-scrollbar-button:vertical:start:decrement 上方向单个按钮 下方向同理 不知道为啥搜索出来的single-button不生效&#…

制造业的数字化转型如何做?

随着科技的迅速发展,数字化转型已经成为制造型企业提高竞争力的关键因素。它可以帮助制造型企业,在产品优化设计、材料采购、生产流程方面实现精细化管理;提升上下游协同生产能力,提高生产效率、降低生产成本、优化产品质量&#…

华为的AI战略地图上,才不是只有大模型

大模型火热了一年,现在还没做AI化改造的企业,就像是工业革命浪潮伊始与火车赛跑的那辆马车。 最早的蒸汽火车缓慢又笨重,甚至铁轨上还预留了马匹行走的空间,以便随时用马拉火车来替代蒸汽火车,一辆华丽的马车试图和火…

浮点数的存储方式、bf16和fp16的区别

目录 1. 小数的二进制转换2. 浮点数的二进制转换3. 浮点数的存储3.1 以fp32为例3.2 规约形式与非规约形式 4. 各种类型的浮点数5. BF16和FP16的区别Ref 1. 小数的二进制转换 十进制小数转换成二进制小数采用「乘2取整,顺序排列」法。具体做法是:用 2 2…