音视频开发15 FFmpeg FLV封装格式分析

FLV(Flash Video)简介

FLV(Flash Video)是Adobe公司推出的⼀种流媒体格式,由于其封装后的⾳视频⽂件体积⼩、封装简单等特点,⾮常适合于互联⽹上使⽤。⽬前主流的视频⽹站基本都⽀持FLV。采⽤ FLV格式封装的⽂件后缀为.flv。

FLV封装格式的组成

FLV封装格式是由⼀个 ⽂件头( file header ) ⽂件体( file Body ) 组成。
其中,FLV body由⼀ 对对的(Previous Tag Size字段 + tag)组成。
Previous Tag Size字段 排列在Tag之前,占⽤ 4个字节。
Previous Tag Size记录了前⾯⼀个Tag的⼤⼩,⽤于逆向读取处理。
由于 Previous Tag Size 记录的是前面一个Tag 的大小,因此FLV header 后的第⼀个Pervious Tag Size的值为0。
Tag⼀般可以分为3种类型
脚本(帧)数据类型
⾳频数据类型、
视频数据。
FLV数据以 ⼤端序 进⾏存储 ,在解析时需要注意。⼀个标准FLV⽂件结构如下图:

FLV 文件的分析工具

可以使用UltraEdit 分析。 将 flv 文件直接拖入到 UE 中。

使用 mediainfo 工具进行分析。

然后将flv 文件拖入 mediainfo工具中

FLV Header 解析

我们这里使用 believe.flv文件做为标准分析结果如下:

注:在下⾯的数据type中,UI表示⽆符号整形,后⾯跟的数字表示其⻓度是多少位。⽐如
UI8 ,表示⽆符号整形,⻓度⼀个字节。 UI24 是三个字节,UI [8*n] 表示多个字节。UB表示位
域, UB5 表示 ⼀个字节的5位 。可以参考c中的位域结构体。
FLV头占9个字节,⽤来标识⽂件为FLV类型,以及后续存储的⾳视频流。⼀个FLV⽂件,每种
类型的tag都属于⼀个流,也就是⼀个flv⽂件最多只有⼀个⾳频流,⼀个视频流,不存在多个
独⽴的⾳视频流在⼀个⽂件的情况。
00000 1 0 1

FLV Body 解析

FLV Header之后,就是FLV File Body。
FLV File Body是由⼀连串的   Previous Tag Size + Tag Header + Tag Data 构成。

Previous Tag Size

Previous Tag Size (前⼀个tag 的字节数据⻓度),占 4个字节 。注意是前一个tag的字节数据长度,因此FLV Header后面的第一个   Previous Tag Size的值是0,

Tag Header 

tag header⼀般占11个字节的内存空间。FLV tag结构如下:
注意:
1. flv⽂件中Timestamp和TimestampExtended拼出来的是dts 。也就是解码时间。
Timestamp和TimestampExtended拼出来dts单位为ms。 (如果不存在B帧,当然dts等于
pts)
2. CompositionTime 表示PTS相对于DTS的偏移值, 在每个视频tag的第14~16字节, 。
显示时间(pts) = 解码时间(tag的第5~8字节) + CompositionTime
CompositionTime的单位也是ms
如下是将 FLV Header 的9个字节,
第一个 previous tag size 
第一个tag header 解析

Tag Data

Tag Header 的类型有三种 script data,video,audio

script data

该类型Tag⼜被称为 MetaData Tag ,存放⼀些关于FLV视频和⾳频的元信息,⽐如: duration、width、 height 等。
通常该类型Tag会作为FLV⽂件的第⼀个tag,并且只有⼀个,跟在File Header后。该类型Tag
DaTa的结构如下所示
接前面的分析:

Tag Body 对于tag type = 18,对应16进制为0X12来说:表示的是Script Tag Data,script tag data 的数据结构会在后面的具体讲解,这里只是对于一个简单的描述。

从data size 中看到,tag data的大小是 0x0000 01 8C,十进制是396.

那么从下图开始位置到下下图截止为止,就都是这个data 的数据,我们要做的是分析这个数据

第一个AMF包分析。

第⼀个AMF包: 第1个字节表示AMF包类型,⼀般总是0x02,表示字符串。

第2-3个字节为UI16类型值,标识字符串的⻓度,⼀般总是0x000A(“onMetaData”⻓度)。

后⾯字节为具体的字符串,⼀般总为“onMetaData”(6F,6E,4D,65,74,61,44,61,74,61)。

第二个AMF包分析。

第⼆个AMF包: 第1个字节表示AMF包类型,⼀般总是0x08,表示数组。

第2-5个字节为UI32类型值,表示数组元素的个数。

后⾯即为各数组元素的封装,数组元素为元素名称和值组成的对。常⻅的数组元素如下表所示

第⼆个AMF包: 第1个字节表示AMF包类型,⼀般总是0x08,表示数组。

第2-5个字节为UI32类型值,表示数组元素的个数。

后⾯即为各数组元素的封装,数组元素为元素名称和值组成的对。常⻅的数组元素如下表所示

注:Lavf54.63.104即是 *L*ib*avf*ormat version 54.63.104. 即是ffmpeg对于库的版本

audio

⾳频Tag Data区域开始的:
第⼀个字节包含了⾳频数据的参数信息,
第⼆个字节开始为⾳频流数据
(这两个字节属于tag的data部分,不是header部分)
第⼀个字节为⾳频的信息(仔细看spec发现对于AAC⽽⾔,⽐较有⽤的字段是 SoundFormat ),格式如下:

If the SoundFormat indicates AAC, the SoundType should be set to 1 (stereo) and the SoundRate should be set to 3 (44 kHz).

However, this does not mean that AAC audio in FLV is always stereo, 44 kHz data.

Instead, the Flash Player ignores these values and extracts the channel and sample rate data is encoded in the AAC bitstream.

如果SoundFormat指示AAC,则SoundType应设置为1(立体声),SoundRate应设置为3(44 kHz)。
然而,这并不意味着FLV中的AAC音频总是立体声的,44kHz的数据。
相反,Flash Player会忽略这些值,并提取信道和采样率数据被编码在AAC比特流中。

AudioTagHeader如上图所示,占1个字节,包含audio的各种信息。其后就是audio tag的data部分。

这里有一个特例,如果音频格式(SoundFormat)是10 = AAC,AudioTagHeader中会多出1个字节的数据AACPacketType,这个字段来表示AACAUDIODATA的类型:0 = AAC sequence header,1 = AAC raw。

AAC sequence header也就是包含了AudioSpecificConfig,AudioSpecificConfig包含着一些更加详细音频的信息,AudioSpecificConfig的定义在ISO14496-3中1.6.2.1 AudioSpecificConfig。在FLV的文件中,一般情况下 AAC sequence header 这种包只出现1次,而且是第一个audio tag。

如果是AAC数据,如果他是AAC RAW, tag data[2] 开始才是真正的AAC frame data。这里说的tag data[2],是以下标0开始的,也就是第三个字节才是真正的 aac 数据,

AAC raw 这种包含的就是音频ES流了,也就是audio payload。

video

视频Tag Data开始的:
第⼀个字节 包含视频数据的参数信息,
第⼆个字节 开始为视频流数据。
如果是AVC,那么第2个字节是  AVCPacketType ,3,4,5个字节是Compositon,从第6个字节开始才是data。
更具体的说,第二个字节有可能不是视频的真正数据。
这里也有一个特例,如果视频的格式是AVC(H.264)的话, VideoTagHeader会多出4个字节的信息 AVCPacketType 和  CompositionTime
(1)CompositionTime 单位毫秒
CompositionTime 每个视频tag(整个tag)的第 14~16 字节(如果是tag data偏移[3]~[5],
[0],[1][2:AVCPackettype] )(表示PTS相对于DTS的偏移值 )。
CompositionTime 单位为ms : 显示时间 = 解码时间( tag的第5~8字节,位置索引[4]~[7]
+ CompositionTime
(2)AVCDecoderConfigurationRecord
AVC sequence header就是 AVCDecoderConfigurationRecord 结构,该结构在标准⽂
档“ ISO-14496-15 AVC file format
📎 ISOIEC 14496-15 Advanced Video Coding (AVC) file format.pdf 中有详细说明。
如果不是AVC,那么从第二个字节开始就是视频数据了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/674343.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

长三角Ai行业盛会:2024南京人工智能展会(南京智博会)

在长三角地区,南京这座古老而现代的都市,近年来在人工智能产业发展方面取得了令人瞩目的成绩。作为一座拥有深厚历史底蕴和独特文化魅力的城市,南京在科技创新领域同样展现出非凡的活力与实力。特别是在人工智能领域,南京的崛起已…

Spring Cloud:构建高可用分布式系统的利器

摘要:本文将介绍Spring Cloud,一个基于Spring Boot的开源微服务架构工具集。我们将探讨Spring Cloud的核心组件、特性以及如何使用Spring Cloud构建高可用、分布式系统。通过本文,读者将了解到Spring Cloud在实现微服务架构中的应用和优势。 …

STM8单片机变频器设计

变频调速技术是现代电力传动技术的重要发展方向,而作为变频调速系统的核心—变频器的性能也越来越成为调速性能优劣的决定因素,除了变频器本身制造工艺的“先天”条件外,对变频器采用什么样的控制方式也是非常重要的。随着电力电子技术、微电子技术、计算机网络等高新技术的…

React-生成随机数和日期格式化

生成随机数 uuid文档:https://github.com/uuidjs/uuid npm install uuid import {v4 as uuidV4} from uuid 使用: uuidV4() 日期格式化 dayjs文档:安装 | Day.js中文网 npm install dayjs import dayjs from dayjs

华致酒行一季度业绩好转:毛利率持续下滑,销售人员去年减少578人

《港湾商业观察》李镭 在公布年报和一季报前后,华致酒行(300755.SZ)举行了3次投资者交流活动,可见外界对公司业绩的关注程度。 虽然一季度业绩好于年报,但整个2024年是否能延续这一不错态势,恐怕也并不乐…

医学数据属于小样本,或许源于资源不对等|罗小罗·说

小罗碎碎念 医学数据属于小样本,或许源于资源不对等 今天这篇推文,源于一场对话。 我和他(粉丝)聊完以后,觉得心里总是压了点什么东西,直到我写完那篇关于医学数据类别不平衡的文章,我才大致理…

网络原理——http/https ---http(1)

T04BF 👋专栏: 算法|JAVA|MySQL|C语言 🫵 今天你敲代码了吗 网络原理 HTTP/HTTPS HTTP,全称为"超文本传输协议" HTTP 诞⽣与1991年. ⽬前已经发展为最主流使⽤的⼀种应⽤层协议. 实际上,HTTP最新已经发展到 3.0 但是当前行业中主要使用的HT…

SpringBoot快速部署(1)—docker不使用nginx

方法一:使用 link docker run -d --restartalways -p 3306:3306 --name mysql -e MYSQL_ROOT_PASSWORD123456 -e MYSQL_DATABASEqr_code_test -v /mnt/docker/files/qr_board_system/qr_code_test.sql:/docker-entrypoint-initdb.d/database.sql mysql:5.6 docker r…

Docker 图形化界面管理工具 Portainer | 让你更轻松的管理 Docker

本文首发于只抄博客,欢迎点击原文链接了解更多内容。 前言 Portainer 是一个 Docker 图形化管理工具,可以通过 Web UI 轻松的管理容器、镜像、网络、卷。与 Dockge 相比功能更加的完善,同时上手难度也更大一些 Portainer 分为社区版和商业版…

摸鱼大数据——Hive函数14

14、开窗(开列)函数 官网链接:Window Functions - Apache AsterixDB - Apache Software Foundation 14.1 基础使用 开窗函数格式: 开窗函数 over(partition by 分组字段名 [order by 排序字段名 asc|desc] [rows between 开窗开始 and 开窗结束]) ​ partition b…

动画技术在AI绘画中的革新作用

引言: 随着人工智能技术的飞速发展,AI绘画作为其应用领域之一,已经引起了艺术和技术界的广泛关注。动画技术,作为视觉艺术的重要组成部分,与AI绘画的结合不仅为传统绘画带来了新的活力,也推动了创意表达和艺…

第24讲:Ceph集群RGW对象存储高可用集群部署与测试

文章目录 1.RGW对象存储高可用集群架构1.1.环境规划1.2.高可用集群架构图 2.部署RGW对象存储高可用集群2.1.在所有的Ceph节点中部署RGW2.2.部署Haproxy负载均衡服务2.3.配置Haproxy负载均衡三个节点中的RGW2.4.配置Keepalived实现RGW高可用集群2.5.启动Keepalived并观察VIP地址…

关于域环境

一.什么是域 Windows域是计算机网络的一种形式,其中所有用户帐户,计算机,打印机和其他安全主体都向位于一个或多个中央计算机群集(域控制器)上的中央数据库注册。通过域用户登录域内主机,需要通过域控制器…

升级你的工作流:集成钉钉企微的可道云teamOS网盘体验全攻略,办公体验瞬间升级

我们知道,企业微信、钉钉扫码登录已经成为现代企业高效办公的标配。 然而,市面上绝大多数企业网盘产品,都无法对接企业微信和钉钉,这无疑给企业的工作流程带来一定困扰。 今天给大家介绍一下,集成了钉钉和企微的企业…

动态规划1:1137. 第 N 个泰波那契数

动态规划解题步骤: 1.确定状态表示:dp[i]是什么 2.确定状态转移方程:dp[i]等于什么 3.初始化:确保状态转移方程不越界 4.确定填表顺序:根据状态转移方程即可确定填表顺序 5.确定返回值 题目链接:1137…

格式化数据恢复指南:从备份到实战,3个技巧一网打尽

朋友们!你们有没有遇到过那种“啊,我的文件呢?”的尴尬时刻?无论是因为手滑、电脑抽风还是其他原因,数据丢失都可能会让我们抓狂,甚至有时候,我们可能一不小心就把存储设备格式化了,…

第二证券:A股年内首家非ST股面值退市!这类ST股数量逐年增加

A股出清残次上市公司的速度正在加速。 年内首家非ST退市股“诞生” 5月30日晚间,正源股份公告称已收到买卖所下发的《关于拟停止正源控股股份有限公司股票上市的事前奉告书》,2024年4月30日至2024年5月30日,公司股票接连20个买卖日的每日股…

强达电路营收下滑净利润急剧放缓:周转率骤降,2次因环保被罚

《港湾商业观察》施子夫 自2022年6月向深交所创业板递交招股书起,深圳市强达电路股份有限公司(以下简称,强达电路)已收到深交所下发的两轮审核问询函,并且公司已于2023年3月31日顺利过会。但由于迟迟未提交注册申请&a…

用SNMP模仿Zabbix读取设备接口流量

正文共:666 字 11 图,预估阅读时间:1 分钟 前文(通过SNMP统计网络资产)介绍了SNMPWALK的安装及简单使用。SNMP的功能还是十分强大的,几乎所有设备上支持查看的信息通过SNMP协议都能读取到,甚至有…

API开放平台项目细节

1.前端如何区分用户权限的,是管理员还是普通用户? Ant Design Pro内置了一套权限管理机制,通过access.ts页面实现。它会去取到全局初始化状态(InitialState)的loginUser,根据当前登录用户判断是否有管理员…