播放器系列1——总概述

播放器系列1——总概述

article2025/3/31 15:31:17/文章来源:https://blog.csdn.net/weixin_40317531/article/details/145787079

播放器核心架构

在这里插入图片描述

模块解释

文件读取

读取视频文件、读取网络文件、读取音频文件，大概分为这三种，目前代码中仅实现了读取视频文件播放，也就是当没有video数据的时候播放器不可使用。

解复用

容器指的是多媒体文件中的封装格式，常见的封装格式有mp4、flv、ts等，其作用就是将不同的流数据进行封装，便于传输和存储。
这一步就是解析多媒体文件中容器，将容器中的视频流、音频流、字母等数据分离出来。从而输入到视频解码器、音频解码器。
编码的视频数据格式有H264、H265等，编码的音频数据格式有AAC、AC3等。

视频解码器

视频解码器是可以是一种硬件或者软件，它的作用是将视频压缩数据解码成原始的视频数据，以便于后续的渲染和显示。
在本项目中，使用的是ffmpeg库中的解码器，如果在商业项目中，可能会使用硬件解码器，目的是释放CPU资源，提高性能。
解码后的数据可能是RGB、YUV等，具体看输出要求来配置解码器即可。

图像处理

目前比较好用的图像处理开源库有ffmpeg、opencv等。可以使用这些库来完成视频的缩放、旋转、裁剪、特效等操作。

音频解码器

音频解码器与视频解码器类似，也可以在软件或者硬件来实现其功能。
解码后的音频数据为PCM数据，不过需要区分音频的通道数、采样率、采样精度。

音频重采样

音频数据参数有sample_rate、sample_fmt、channel_layout等。sample_rate是指每秒采样的次数，sample_fmt是指采样的精度，channel_layout是指声道布局。在不同的平台上由于硬件的差异，可能会出现音频格式不支持的情况，这时候就需要对音频数据进行重采样，来生成符合硬件输入的音频数据。

音效

音效添加可以使用开源的Sox库来实现。它支持的音效种类很多包括drc、peq、compand、echo等。

视频渲染

视频渲染是将解码后的视频数据渲染到屏幕上，以实现视频播放的功能。
本项目中会介绍两种视频数据渲染的方法分别为SDL与qml。由于最后需要画UI，所以使用了qml。

音频播放

本项目使用SDL库来实现音频播放。****

AvSync

AvSync其实就是音视频同步，如果音视频不同步，会严重影响观影体验，这一项也是区分播放器好坏的关键参数。本项目实现逻辑是使视频的pts与音频的pts保持一致，从而实现音视频同步。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/973700.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

MacOS下使用Ollama本地构建DeepSeek并使用本地Dify构建AI应用

MacOS下使用Ollama本地构建DeepSeek并使用本地Dify构建AI应用

目录 1 大白话说一下文章内容2 作者的电脑配置3 DeepSeek的本地部署3.1 Ollamal的下载和安装3.2 选择合适的deepseek模型3.3 安转deepseek 4 DifyDeepSeek构建Al应用4.1 Dify的安装4.1.1 前置条件4.1.2 拉取代码4.1.3 启动Dify 4.2 Dify控制页面4.3 使用Dify实现个“文章标题生…

阅读更多...

神经网络八股（三）

神经网络八股（三）

1.什么是梯度消失和梯度爆炸梯度消失是指梯度在反向传播的过程中逐渐变小，最终趋近于零，这会导致靠前层的神经网络层权重参数更新缓慢，甚至不更新，学习不到有用的特征。梯度爆炸是指梯度在方向传播过程中逐渐变大，…

阅读更多...

第3章 3.3日志 .NET Core日志 NLog使用教程

第3章 3.3日志 .NET Core日志 NLog使用教程

3.3.1 .NET Core日志基本使用书中介绍了把日志输出到控制台的使用方式： 安装 Microsoft.Extensions.Logging 和 Microsoft.Extensions.Logging.Console 日志记录代码： using Microsoft.Extensions.DependencyInjection; using Microsoft.Extensions.…

阅读更多...

Springboot的jak安装与配置教程

Springboot的jak安装与配置教程

目录 Windows系统 macOS系统 Linux系统 Windows系统下载JDK： 访问Oracle官网或其他JDK提供商网站，下载适合Windows系统的JDK版本。网站地址：Oracle 甲骨文中国 | 云应用和云平台点击进入下滑，点击进入下载根据自己的系统选择&…

阅读更多...

Vue2是如何利用Object.defineProperty实现数据的双向绑定？

Vue2是如何利用Object.defineProperty实现数据的双向绑定？

我们之前说道过Object.defineProperty方法有一关键特性，就是数据劫持，通过get/set 拦截属性的读取和修改操作。Vue主要是通过数据劫持结合发布-订阅模式来实现的，利用Object.defineProperty来劫持各个属性的setter和getter，在数据…

阅读更多...

$Transformer解析——（四）Decoder$

Transformer解析——（四）Decoder

本系列已完结，全部文章地址为： Transformer解析——（一）概述-CSDN博客 Transformer解析——（二）Attention注意力机制-CSDN博客 Transformer解析——（三）Encoder-CSDN博客 Transforme…

阅读更多...

Vue前端开发-Vant之Layout组件

Vue前端开发-Vant之Layout组件

在Vant 中，Layout组件用于元素的响应式布局，分别由van-row和van-col两个组件来实现，前者表示行，后者被包裹在van-row组件中，表示列，共有24列栅格组成，在van-col组件中，span属性表示所…

阅读更多...

【YOLOv8】损失函数

【YOLOv8】损失函数

学习视频： yolov8 | 损失函数之 5、类别损失_哔哩哔哩_bilibili yolov8 | 损失函数之 6、定位损失 CIoU DFL_哔哩哔哩_bilibili 2.13、yolov8损失函数_哔哩哔哩_bilibili YOLOv8 的损失函数由类别损失和定位损失构成类别损失：BCE Loss 定位损失…

阅读更多...

Mac系统下使用Docker快速部署MaxKB：打造本地知识库问答系统

Mac系统下使用Docker快速部署MaxKB：打造本地知识库问答系统

随着大语言模型的广泛应用，知识库问答系统逐渐成为提升工作效率和个人学习的有力工具。MaxKB是一款基于LLM（Large Language Model）大语言模型的知识库问答系统，支持多模型对接、文档上传和自动爬取等功能。本文将详细介绍如何在Ma…

阅读更多...

(Arxiv-2025)ImageRAG：用于参考引导图像生成的动态图像检索

(Arxiv-2025)ImageRAG：用于参考引导图像生成的动态图像检索

ImageRAG：用于参考引导图像生成的动态图像检索 paper是Tel Aviv University发布在Arxiv 2025的工作 paper title:ImageRAG: Dynamic Image Retrieval for Reference-Guided Image Generation Code:链接图 1：使用参考图像扩展图像生成模型的生成能力。在…

阅读更多...

企业知识管理平台重构数字时代知识体系与智能服务网络

企业知识管理平台重构数字时代知识体系与智能服务网络

内容概要现代企业知识管理平台的演进呈现出全生命周期管理与智能服务网络构建的双重特征。通过四库体系（知识采集库、加工库、应用库、评估库）的协同运作，该系统实现了从知识沉淀、结构化处理到价值释放的完整闭环。其中，知识图…

阅读更多...

高级推理的多样化推理与验证

高级推理的多样化推理与验证

25年2月来自波士顿大学、NotBadMath.AI、谷歌、哥伦比亚大学、MIT、Intuit公司和斯坦福大学的论文“Diverse Inference and Verification for Advanced Reasoning”。 OpenAI o1、o3 和 DeepSeek R1 等推理 LLM 在数学和编码方面取得重大进展，但仍发现 IMO 组合问题…

阅读更多...

23.1 WebBrowser控件

23.1 WebBrowser控件

版权声明：本文为博主原创文章，转载请在显著位置标明本文出处以及作者网名，未经作者允许不得用于商业目的。 WebBrowser控件类似于IE浏览器的文档界面（事实上IE也是使用的这个控件），它提供了显示网页及支持…

阅读更多...

Django-Vue 学习-VUE

Django-Vue 学习-VUE

主组件中有多个Vue组件是指在Vue.js框架中，主组件是一个父组件，它包含了多个子组件（Vue组件）。这种组件嵌套的方式可以用于构建复杂的前端应用程序，通过拆分功能和视图，使代码更加模块化、可复用和易于维…

阅读更多...

计算机网络安全之一:网络安全概述

计算机网络安全之一:网络安全概述

1.1 网络安全的内涵随着计算机和网络技术的迅猛发展和广泛普及，越来越多的企业将经营的各种业务建立在Internet/Intranet环境中。于是，支持E-mail、文件共享、即时消息传送的消息和协作服务器成为当今商业社会中的极重要的IT基础设施。然而&#xff0…

阅读更多...

AI学习指南DeepSeek篇(6)-DeepSeek论文介绍

AI学习指南DeepSeek篇(6)-DeepSeek论文介绍

1. DeepSeek LLM: Scaling Open-Source Language Models with Longtermism 发布时间： 2024 年 1 月 5 日主要内容：基于 Transformer 架构，采用分组查询注意力（GQA）优化推理成本。支持多步学习率调度器，提升训练效率。在预训练和对齐（监督微调与 DPO）方面进行了创新…

阅读更多...

刺客信条枭雄画质设置以及【锁帧60帧】的办法

刺客信条枭雄画质设置以及【锁帧60帧】的办法

刺客信条枭雄锁帧60帧的办法画质设置帧率锁60帧办法画质设置关爱老电脑和GPU，适当设置一下画质我们设置画面的时候，可以看游戏右上角的显存占用，进而观察自己这样设置，GPU的显存够不够： 环境质量：超…

阅读更多...

适用于复杂背景的YOLOv8改进：基于DCN的特征提取能力提升研究

适用于复杂背景的YOLOv8改进：基于DCN的特征提取能力提升研究

文章目录 1. YOLOv8的性能瓶颈与改进需求1.1 YOLOv8的优势与局限性1.2 可变形卷积（DCN）的优势 2. DCN在YOLOv8中的应用2.1 DCN的演变与YOLOv8的结合2.2 将DCN嵌入YOLOv8的结构中2.2.1 DCNv1在YOLOv8中的应用2.2.2 DCNv2与DCNv3的优化 2.3 实验与性能对比…

阅读更多...

cesium视频投影

cesium视频投影

先看效果使用cesium做视频投影效果，而且还要跟随无人机移动而移动，我现在用定时器更新无人机的坐标来实现效果具体代码如下： 1、CesiumVideo3d.js(某个cesium技术群大佬分享的) // import ECEF from "./CoordinateTranslate"; le…

阅读更多...

滚珠花键在使用时需注意什么？

滚珠花键在使用时需注意什么？

滚珠花键是一种直线运动系统，当花键套利用其中的钢球在经过精密磨削的花键轴上直线运动时，可以传递扭矩。在使用滚珠花键时，需要注意以下几个重要的事项： 1、不要擅自拆卸滚珠花键的各部分，因为这样可能会导致异物进入…

阅读更多...

最新文章