FFmpeg 简单文档

一、播放器框架

image.png

常用音视频术语

  • 容器/文件(Conainer/File):即特定格式的多媒体文件,比如mp4、flv、mkv等。
  • 媒体流(Stream):表示时间轴上的一段连续数据,如一段声音数据、一段视频数据或一段字幕数据,可以是压缩的,也可以是非压缩的,压缩的数据需要关联特定的编解码器(有些码流音频他是纯PCM)。
  • 数据帧/数据包(Frame/Packet):通常,一个媒体流是由大量的数据帧组成的,对于压缩数据,帧对应着编解码器的最小处理单元,分属于不同媒体流的数据帧交错存储于容器之中。
  • 编解码器:编解码器是以帧为单位实现压缩数据和原始数据之间的相互转换的。

二、常用概念

  • 复用器

    复用器

  • 编解码器

    编解码器

三、FFmpeg库简介

image.png

FFMPEG有8个常用库:

  • AVUtil:核心工具库,下面的许多其他模块都会依赖该库做一些基本的音视频处理操作。

  • AVFormat:文件格式和协议库,该模块是最重要的模块之一,封装了Protocol层和Demuxer、Muxer层,使得协议和格式对于开发者来说是透明的。

  • AVCodec:编解码库,封装了Codec层,但是有一些Codec是具备自己的License的,FFmpeg是不会默认添加像libx264、FDK-AAC等库的,但是FFmpeg就像一个平台一样,可以将其他的第三方的Codec以插件的方式添加进来,然后为开发者提供统一的接口。

  • AVFilter:音视频滤镜库,该模块提供了包括音频特效和视频特效的处理,在使用FFmpeg的API进行编解码的过程中,直接使用该模块为音视频数据做特效处理是非常方便同时也非常高效的一种方式。

  • AVDevice:输入输出设备库,比如,需要编译出播放声音或者视频的工具ffplay,就需要确保该模块是打开的,同时也需要SDL的预先编译,因为该设备模块播放声音与播放视频使用的都是SDL库。

  • SwrRessample:该模块可用于音频重采样,可以对数字音频进行声道数、数据格式、采样率等多种基本信息的转换。

  • SWScale:该模块是将图像进行格式转换的模块,比如,可以将YUV的数据转换为RGB的数据,缩放尺寸由1280720变为800480。

  • PostProc:该模块可用于进行后期处理,当我们使用AVFilter的时候需要打开该模块的开关,因为Filter中会使用到该模块的一些基础函数。

  • av_register_all():注册所有组件,4.0已经弃用

  • avdevice_register_all()对设备进行注册,比如V4L2等。

  • avformat_network_init();初始化网络库以及网络加密协议相关的库(比如openssl)

封装格式相关

  • avformat_alloc_context();负责申请一个AVFormatContext结构的内存,并进行简单初始化
  • avformat_free_context();释放该结构里的所有东西以及该结构本身
  • avformat_close_input();关闭解复用器。关闭后就不再需要使用avformat_free_context 进行释放。
  • avformat_open_input();打开输入视频文件
  • avformat_find_stream_info():获取音视频文件信息
  • av_read_frame(); 读取音视频包
  • avformat_seek_file(); 定位文件
  • av_seek_frame():定位文件

image.png

解码器相关

  • avcodec_alloc_context3(): 分配解码器上下文
  • avcodec_find_decoder():根据ID查找解码器
  • avcodec_find_decoder_by_name():根据解码器名字
  • avcodec_open2(): 打开编解码器
  • avcodec_decode_video2():解码一帧视频数据
  • avcodec_decode_audio4():解码一帧音频数据
  • avcodec_send_packet(): 发送编码数据包
  • avcodec_receive_frame(): 接收解码后数据
  • avcodec_free_context():释放解码器上下文,包含了avcodec_close()
  • avcodec_close():关闭解码器

image.png

FFmpeg3.x组件注册方式

我们使用ffmpeg,首先要执行av_register_all,把全局的解码器、编码器等结构体注册到各自全局的对象链表里,以便后面查找调用。

image.png

FFmpeg4.x组件注册方式

image.png

FFmpeg4.0.2组件注册方式

image.png

四、FFmpeg常用结构体简介

  • AVFormatContext 封装格式上下文结构体,也是统领全局的结构体,保存了视频文件封装格式相关信息。
  • AVInputFormat demuxer 每种封装格式(例如FLV, MKV, MP4, AVI)对应一个该结构体。
  • AVOutputFormat muxer
  • AVStream 视频文件中每个视频(音频)流对应一个该结构体。
  • AVCodecContext 编解码器上下文结构体,保存了视频(音频)编解码相关信息。
  • AVCodec 每种视频(音频)编解码器(例如H.264解码器)对应一个该结构体。
  • AVPacket 存储一帧压缩编码数据。
  • AVFrame 存储一帧解码后像素(采样)数据。

FFmpeg数据结构之间的关系

AVFormatContext和AVInputFormat之间的关系

  • AVFormatContext API调用
  • AVInputFormat 主要是FFMPEG内部调用
 

objectivec

复制代码

AVFormatContext 封装格式上下文结构体 struct AVInputFormat *iformat;

 

objectivec

复制代码

AVInputFormat 每种封装格式(例如FLV, MKV, MP4) int (*read_header)(struct AVFormatContext * ); int (*read_packet)(struct AVFormatContext *, AVPacket *pkt);

 

objectivec

复制代码

int avformat_open_input(AVFormatContext **ps, const char *filename,AVInputFormat *fmt, AVDictionary **options)

AVCodecContext和AVCodec之间的关系

 

objectivec

复制代码

AVCodecContext 编码器上下文结构体 struct AVCodec *codec;

 

objectivec

复制代码

AVCodec 每种视频(音频)编解码器 int (*decode)(AVCodecContext *, void *outdata, int *outdata_size, AVPacket *avpkt); int (*encode2)(AVCodecContext *avctx, AVPacket *avpkt, const AVFrame *frame, int *got_packet_ptr);

image.png

区分不同的码流

 

objectivec

复制代码

AVMEDIA_TYPE_VIDEO视频流 video_index = av_find_best_stream(ic, AVMEDIA_TYPE_VIDEO, -1,-1, NULL, 0)

 

objectivec

复制代码

- AVMEDIA_TYPE_AUDIO音频流 audio_index = av_find_best_stream(ic, AVMEDIA_TYPE_AUDIO, -1,-1, NULL, 0)

AVPacket 里面也有一个index的字段

image.png

数据结构分析

AVFormatContext

  • iformat:输入媒体的AVInputFormat,比如指向AVInputFormat ff_flv_demuxer
  • nb_streams:输入媒体的AVStream 个数
  • streams:输入媒体的AVStream []数组
  • duration:输入媒体的时长(以微秒为单位),计算方式可以参考av_dump_format()函数。
  • bit_rate:输入媒体的码率

AVInputFormat

  • name:封装格式名称
  • extensions:封装格式的扩展名
  • id:封装格式ID
  • 一些封装格式处理的接口函数,比如read_packet()

AVStream

  • index:标识该视频/音频流
  • time_base:该流的时基,PTS*time_base=真正的时间(秒)
  • avg_frame_rate: 该流的帧率
  • duration:该视频/音频流长度
  • codecpar:编解码器参数属性

AVCodecParameters

  • codec_type:媒体类型,比如AVMEDIA_TYPE_VIDEO AVMEDIA_TYPE_AUDIO等
  • codec_id:编解码器类型, 比如AV_CODEC_ID_H264 AV_CODEC_ID_AAC等。

AVCodecContext

  • codec:编解码器的AVCodec,比如指向AVCodec ff_aac_latm_decoder
  • width, height:图像的宽高(只针对视频)
  • pix_fmt:像素格式(只针对视频)
  • sample_rate:采样率(只针对音频)
  • channels:声道数(只针对音频)
  • sample_fmt:采样格式(只针对音频)

AVCodec

  • name:编解码器名称
  • type:编解码器类型
  • id:编解码器ID
  • 一些编解码的接口函数,比如int (*decode)()

AVCodecContext

  • codec:编解码器的AVCodec,比如指向AVCodec ff_aac_latm_decoder
  • width, height:图像的宽高(只针对视频)
  • pix_fmt:像素格式(只针对视频)
  • sample_rate:采样率(只针对音频)
  • channels:声道数(只针对音频)
  • sample_fmt:采样格式(只针对音频)

AVCodec

  • name:编解码器名称
  • type:编解码器类型
  • id:编解码器ID
  • 一些编解码的接口函数,比如int (*decode)()

AVPacket

  • pts:显示时间戳
  • dts:解码时间戳
  • data:压缩编码数据
  • size:压缩编码数据大小
  • pos:数据的偏移地址
  • stream_index:所属的AVStream

AVFrame

  • data:解码后的图像像素数据(音频采样数据)
  • linesize:对视频来说是图像中一行像素的大小;对音频来说是整个音频帧的大小
  • width, height:图像的宽高(只针对视频)
  • key_frame:是否为关键帧(只针对视频) 。
  • pict_type:帧类型(只针对视频) 。例如I, P, B
  • sample_rate:音频采样率(只针对音频)
  • nb_samples:音频每通道采样数(只针对音频)
  • pts:显示时间戳

作者:剧情的需要
链接:https://juejin.cn/post/7033666766202994724
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/263409.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

键盘失灵?别慌!三招帮你调出电脑软键盘

在电脑使用中,我们有时候需要输入文字,但可能会遇到键盘突然失灵的情况。这时,我们可以使用电脑自带的软键盘来解决问题。本文将介绍如何调出电脑软键盘,以便在需要时进行文字输入。 下面以Windows10系统电脑调出软键盘为例进行演…

如何将采购时间从几天缩短为几小时?

从事采购工作时,采购需要多长时间是面临的常见挑战之一。 采购是供应链中的一个环节,大家都不想看到整个流程被拖慢,但很多时候,事情往往向超出控制范围的方向发展。不过,企业可以通过多种方式简化采购和管理整个采购…

红队打靶练习:ESCALATE_LINUX: 1

信息收集 1、arp ┌──(root㉿ru)-[~/kali] └─# arp-scan -l Interface: eth0, type: EN10MB, MAC: 00:0c:29:69:c7:bf, IPv4: 192.168.12.128 Starting arp-scan 1.10.0 with 256 hosts (https://github.com/royhills/arp-scan) 192.168.12.1 00:50:56:c0:00:08 …

Jenkins持续集成自动化测试

执行集成构建 持续,自动地构建&测试软件项目代码管理(git/svn)>编译(maven/ant/gradle)>打包>测试环境部署>自动化测试 研发体系中的迭代流程 1 源码分支管理: git或者svn, 将不同开发编…

MySQL 分表真的能提高查询效率?

背景 首先我们以InnoDB引擎,BTree 3层为例。我们需要先了解几个知识点:页的概念、InnoDB数据的读取方式、什么是树搜索?、一次查询花费的I/O次数,跨页查询。 页的概念 索引树的页(page)是指存储索引数据…

python可以做小程序研发嘛,python能做微信小程序吗

大家好,给大家分享一下python可以做微信小程序开发吗,很多人还不知道这一点。下面详细解释一下。现在让我们来看看! 大家好,给大家分享一下用python编写一个小程序,很多人还不知道这一点。下面详细解释一下用python代码…

计算机毕业设计-----JSP在线奶茶店销售网站平台

项目介绍 本系统分为前后台,分为普通用户和管理员两种角色; 管理员角色包含以下功能: 管理员登录,用户管理,分类管理,奶茶信息管理,订单管理,新闻管理等功能。 用户角色包含以下功能: 用户登录,按分类查看,查看商品详情,加入购…

BWS2000倾角传感器c++测试代码_时间延迟与时间同步问题【3】

详见昨天做的测试代码,代码网址:BWS2000倾角传感器c测试代码【2】-CSDN博客文章浏览阅读268次,点赞7次,收藏8次。倾角传感器测试与编写思路https://blog.csdn.net/m0_47489229/article/details/135128748 问题一:新的…

动能方案|NFC智能家电解决方案 基于13.56MHz的近场无线通信技术

众所周知,物联网(IoT)是一个连接日常物品和互联网的系统,它正在迅速改变我们执行日常任务的方式,物联网的影响如今几乎在每一个领域都有体现。IOT应用在智能家居领域的发展,相信大家都不陌生,日…

Searching for MobileNetV3(2019)

文章目录 Abstract主要内容实验结果 IntroductionRelated WorkEfficient Mobile Building BlocksNetwork SearchPlatform-Aware NAS for Block-wise SearchNetAdapt for Layer-wise Search Network ImprovementsRedesigning Expensive LayersNonlinearitiesLarge squeeze-and-e…

Jupyter Notebook修改默认工作目录

1、参考修改Jupyter Notebook的默认工作目录_jupyter文件路径-CSDN博客修改配置文件 2.在上述博客内容的基础上,这里不是删除【%USERPROFILE%】而是把这个地方替换为所要设置的工作目录路径, 3.【起始位置】也可以更改为所要设置的工作目录路径&#x…

3分钟部署自己独享的Gemini

3分钟部署自己独享的Gemini 在前面的几篇文章中,分别介绍了Gemini Pro的发布和Gemini Pro API的详细申请步骤,那么今天给大家分享的是如何快速搭建一个属于自己的Gemini 。 1️⃣ 准备工作 科学网络环境Github账号和Vercel账号Gemini Pro API Key&…

深度学习建模从零开始步骤流程

深度学习建模从零开始步骤流程 步骤如下: 环境准备三方库安装建模开发 环境准备 Anaconda安装: Anaconda下载网址,下载win10下的64位版本。 清华镜像站 下载完毕后点击安装,一直点确定或下一步 到上图点击 Just me&#xff…

Appium如何实现移动端UI自动化测试呢?

Appium是一个开源跨平台移动应用自动化测试框架。 既然只是想学习下Appium如何入门,那么我们就直奔主题。文章结构如下: 为什么要使用Appium?如何搭建Appium工具环境?(超详细)通过demo演示Appium的使用Appium如何实现移动端UI自…

Appium安装及配置

一、前置说明 Appium 是一个用于自动化移动应用程序的开源测试框架,它支持 Android 和 iOS,同时支持使用多种编程语言(如 Java、Python、JavaScript 等)进行测试脚本的编写。 二、操作步骤 1. 安装Node.js Appium Server 由 n…

【玩转TableAgent数据智能分析】借助全球高校数据多维度分析案例,体验TableAgent如何助力用户轻松洞察数据,赋能企业高效数智化转型

目录 前言 一、TableAgent介绍及其优势? 1、会话式数据分析,所需即所得 2、私有化部署,数据安全 3、支持企业级数据分析,大规模,高性能 4、支持领域微调,专业化 5、透明化过程,审计部署 二、使用Ta…

【设计模式-2.5】创建型——建造者模式

说明:本文介绍设计模式中,创建型设计模式中的最后一个,建造者模式; 入学报道 创建型模式,关注于对象的创建,建造者模式也不例外。假设现在有一个场景,高校开学,学生、教师、职工都…

在Windows上使用 Python

本文档旨在概述在 Microsoft Windows 上使用 Python 时应了解的特定于 Windows 的行为。 与大多数UNIX系统和服务不同,Windows系统没有预安装Python。多年来CPython 团队已经编译了每一个 发行版 的Windows安装程序(MSI 包),已便…

世微 AP5101C高压线性LED恒流驱动芯片 6-100V 2A LED灯电源驱动

产品描述 AP5101C 是一款高压线性 LED 恒流 芯片 , 简单 、 内置功率管 , 适用于 6- 100V 输入的高精度降压 LED 恒流驱动 芯片。电流2.0A。 AP5101C 可实现内置MOS 做 2.0A, 外置MOS 可做 3.0A 的。 AP5101C 内置温度保护功能 ,温度保 护点…

CSS 网页制作-学成在线

1、 准备工作 1.1 项目目录 网站根目录是指存放网站的第一层文件夹,内部包含当前网站的所有素材,包含HTML、CSS、图片、JavaScript等等。 1.2 版心效果 可以发现都是呈现版心居中的效果,但是每次都写一次太麻烦了,可以把版心居中…