MoviePy(Python音视频开发)

  • 音视频基础
    • 帧率、码率、分辨率
    • 视频格式
    • H.264和H.265视频压缩算法
  • Moviepy
    • 常见剪辑类
      • VideoFlieClip
      • ImageFlieClip
      • ColorClip
      • TextClip
      • CompositeVideoClip
      • AudioFlieClip
      • CompositeAudioClip
    • 常见操作
      • 音视频的读入与导出
      • 截取音视频

音视频基础

帧率、码率、分辨率

  • 体积(Volume):一个视频的容量(文件大小),单位是B(byte)。码率影响体积,与体积成正比。如果码率为变量,则帧率也会影响体积,帧率越高,每秒钟经过的画面越多,需要的码率也越高,体积也越大。在这里插入图片描述

  • 帧率(FPS):每秒钟要多少帧画面,就是在1秒钟时间里传输的图片的帧数。影响画面流畅度,与画面流畅度成正比。帧率越大,画面越流畅;帧率越小,画面越有跳动感。如我们看b站常见的1080P 60帧,其中60帧就是帧率,表示每秒播放60张图片。

  • 码率(Bitrate):编码器每秒传输的数据大小(带宽),单位是kbps 即千位每秒,比如800kbps代表编码器每秒产生800kb(或100KB)的数据。如b站要求up主上传的视频码率最高为6000kbps(H264/AVC编码)。

  • 分辨率(Resolution):单位英寸中所包含的横纵向像素点数(图像宽高); VGA:Video Graphics Array(视频图像分辨率)。影响图像大小,与图像大小成正比:分辨率越高,图像越大;分辨率越低,图像越小。在码率一定的情况下,分辨率与清晰度成反比关系:分辨率越高,图像越不清晰,分辨率越低,图像越清晰。如我们看b站常见的最大分辨率1080P,其中1080P就是分辨率,P表示(Progressive scanning,逐行扫描)。以我们常见的16:9的屏幕举例(注意,一定要强调屏幕的宽高比例),1080表示1920 * 1080个像素(其实我们可以说,1080P每一行有接近1K的像素点),2K则是2560 * 1440,4K则是3840 * 2160

好的画质是分辨率、帧率和码率三者之间的平衡:

码率不是越大越好,如果不做码率大小上的限制,那么分辨率越高,画质越细腻;帧率越高,视频也越流畅,但相应的码率也会很大,因为每秒钟需要用更多的数据来承载较高的清晰度和流畅度。

如果限定一个码率,比如800kbps,那么帧率越高,编码器就必须加大对单帧画面的压缩比,也就是通过降低画质来承载足够多的帧数。

视频格式

一个音视频文件实际上分为3层:基础数据编码封装

  • 编码使用不同的编码格式对视频数据进行压缩
  • 封装使用不同的封装格式将视频数据封装成不同的文件
    在这里插入图片描述

在这里插入图片描述

  • 封装格式:封装格式只是视频的一层皮,只是对 文件信息 和 压缩好的音视频数据,按照一定的规则进行编排,不限制视频数据的帧率、分辨率、码率等参数,因此封装格式不会影响视频的清晰度。如MP4(兼容性强)、FLV(在线播放nb)、HLS(长视频nb)、AVI、MKV(支持外接字幕)、PCM、ACC、MOV等。
    在这里插入图片描述

  • 编码格式:编码格式才是音视频流编码的内在组织形式,对原始的音视频数据进行压缩。如H.264、H.265等。
    在这里插入图片描述

H.264和H.265视频压缩算法

在这里插入图片描述

H.264,同时也是MPEG-4的第十部分,被称作,是由联合视频组(JVT,Joint Video Team)提出的视频编解码器标准(视频压缩/编码算法)。这个标准通常被称之为H.264/AVC(或者AVC/H.264或者H.264/MPEG-4AVCMPEG-4/H.264 AVC),其中AVC(Advanced Video Coding,高级视频编码)。H.264主要包含:宏块细分图像、帧内压缩(intra compress)减少空间冗余帧间预测(inter prediction)减少时间冗余转换(transform) 和 量化(quantization)进行残留数据压缩去区块滤波器(deblocking filter)熵编码(entropy coding) 等模块。
在这里插入图片描述

H.265,通常被称为 H.265/HEVC,两者都是基于块的视频编码技术,H.265的编码架构大致上和H.264的架构相似,但编码的文件大小会比H.264小50%,相同画质下更加节省带宽/流量。也主要包含:宏块细分图像、帧内压缩(intra compress)减少空间冗余帧间预测(inter prediction)减少时间冗余转换(transform) 和 量化(quantization)进行残留数据压缩去区块滤波器(deblocking filter)熵编码(entropy coding) 等模块。但在HEVC编码架构中,整体被分为了三个基本单位,分別是:编码单位(coding unit,CU)预测单位(predict unit,PU)转换单位(transform unit,TU)

  • 宏块划分:把图像划分成一个一个的小像素块(patch)。
    在这里插入图片描述

  • 帧内压缩(intra compress):类似JPEG这种有损压缩,减少空间冗余。
    在这里插入图片描述

  • 帧间预测(inter prediction):根据关键帧和运动变化的信息,预测出中间帧,减少时间冗余。把帧分为:I帧(关键帧)、P帧(根据前一个I或P帧预测出来的帧)、B帧(根据前后两个I或P帧预测出来的帧)。
    在这里插入图片描述
    I帧(关键帧)预测 P帧(下一帧):对于没有变化的宏块,P帧直接复制I帧。对于变化的宏块,编码的时候,记录变化的信息,解码的时候,再预测回去。
    在这里插入图片描述
    B帧(双向预测帧):利用前后两帧来预测出的帧。
    在这里插入图片描述
    GPO的概念:I帧的间隔长度。录播视频GOP一般为帧率的4-5倍,直播视频GOP一般为帧率的1-2倍。如果太大,I帧间隔太远,会产生花屏问题,P帧和B帧预测不到位。
    在这里插入图片描述

  • H264的编解码性能要求更低,更加普及;如H264由于算法优化,可以低于1Mbps的速度(码率)实现标清数字图像传送;

  • H265的压缩率更,因此带宽和容量的要求更低,但对编解码性能要求更高。如H265则可以实现利用1~2Mbps的传输速度(码率)传送720P(分辨率1280*720)普通高清音视频传送。

Moviepy

Moviepypython-ffmpeg用subprocess调用ffmpeg 有相同的效果,都可以实现:视频剪辑,视频拼接,插入标题、字幕水印,视频合成,自定义的高级的音视频特效等。此外,MoviePy 可以读写绝大多数常见的视频格式,甚至包括 GIF 格式!

MoviePy 使用软件 FFmpeg 读取和导出视频和音频文件,使用 ImageMagick 生产文字和 GIF 图。中间的处理过程赖于 Python 强大的数学处理库,高级特效和软件加强用到了许多的 Python 图像处理库。
在这里插入图片描述

  • FFmpeg的优点是速度快,缺点则是命令复杂。
  • Moviepy开发起来更加简便,缺点就是相当于ffmpeg速度更慢一些,且不支持stream video流媒体(如直播/摄像头)

常见剪辑类

在这里插入图片描述

Clip是所有剪辑类的基类,VideoClipAudioClip继承自Clip,分别处理视频和音频数据。VideoClipAudioClip又有很多派生类,用于处理 不同的视频和音频内容。所有的类都可以从Moviepy.editor模块导入。Clip、VideoClip、AudioClip三个基类是非常少用的,我们接下来着重介绍他们的派生类。

其中最核心的是VideoClip类的对象 clips(视频片段),开发者可以对 clips 进行修改(剪切,调速度,调亮度…)或者和其他 clip 混合拼接到一起。vedio clip 可以由视频文件,图像,文本或者动画来创建实例。vedio clip 可以拥有一个音频轨道(audio clip) 和一个叠加层的 vedio clip(这是一个特殊的 VedioClip,这意味着,当一个视频和其他 VedioClip 混合的时候,这个叠加层 clip 是隐藏的)

VideoFlieClip

在这里插入图片描述

ImageFlieClip

在这里插入图片描述

ColorClip

在这里插入图片描述

TextClip

在这里插入图片描述

CompositeVideoClip

在这里插入图片描述

AudioFlieClip

在这里插入图片描述

CompositeAudioClip

在这里插入图片描述

常见操作

https://www.bilibili.com/video/BV1Qp421d7yz/?spm_id_from=333.788&vd_source=b2549fdee562c700f2b1f3f49065201b

https://xie.infoq.cn/article/23e694841b8526b2ba9d5fb7c

音视频的读入与导出

读入视频,导出视频:write_videofile

# 导入需要的库
from moviepy.editor import *
 
# 从本地载入视频myHolidays.mp4,并截取00:00:50 - 00:00:60部分
clip = VideoFileClip("Mojito.mp4").subclip(50,60)
 
# 调低音频音量 (volume x 0.8)
clip = clip.volumex(0.8)
# 做一个txt clip. 自定义样式,颜色.
txt_clip = TextClip("Mojito by Jay",fontsize=70,color='white')
# 文本clip在屏幕正中显示持续10秒
txt_clip = txt_clip.set_pos('center').set_duration(10)
# 把 text clip 的内容覆盖 video clip
video = CompositeVideoClip([clip, txt_clip])
 
# 把最后生成的视频导出到文件内
video.write_videofile("Mojito_edited.mp4")  # 默认编解码器codec="libx264"
video.write_videofile("Mojito_edited.mp4", codec="mpeg4")  # MP4也可以指定编解码器为"mpeg4"
video.write_videofile("Mojito_edited.avi", codec="rawvideo")
video.write_videofile("Mojito_edited.webm")  # 默认编解码器codec="libx264"
video.write_videofile("Mojito_edited.flv", codec="flv")

读入音频,导出音频:write_audiofile

# 导入需要的库
from moviepy.editor import *
# 从本地载入视频myHolidays.mp4,并截取00:00:50 - 00:00:60部分
clip = VideoFileClip("/data3/yzr/Mojito.mp4").subclip(3,10)
 
# 取clip的audio音频部分
audio = clip.audio

# 保存为MP3
audio.write_audiofile("Mojito.mp3")
# 保存为wav
audio.write_audiofile("Mojito.wav", codec="pcm_s32le")
# 保存为wmav1
audio.write_audiofile("Mojito.wam", codec="wam1")

导出GIF动图:write_gif

# 导入需要的库
from moviepy.editor import *
 
# 从本地载入视频myHolidays.mp4,并截取00:00:50 - 00:00:60部分
clip = VideoFileClip("/data3/yzr/Mojito.mp4").subclip(3,10)
 
# 把最后生成的视频导出到文件内
clip.write_gif("Mojito_edited.gif")

导出视频截图:save_frame

# 导入需要的库
from moviepy.editor import *
 
# 从本地载入视频myHolidays.mp4,并截取00:00:50 - 00:00:60部分
clip = VideoFileClip("/data3/yzr/Mojito.mp4").subclip(3,10)
 
# 保存clip起始帧
clip.save_frame("frame.png")
# 保存视频第10秒截图
clip.save_frame("frame.png", t=10)

截取音视频

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/607055.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

TL-WN826N无线网卡连接电脑蓝屏,提示rtl8188gu.sys

TL-WN826N无线网卡插电脑就蓝屏,提示rtl8188gu.sys 处理方法: 设备管理器中卸载其他的2.0无线网卡程序和功能中卸载网卡驱动TPlink官网下载 TL-WN826N V1.0_1.0.0(https://www.tp-link.com.cn/product_572.html?vdownload)&…

Redis简介和数据结构

目录 简介 进入之后身份认证才能使用 优点 用途: 数据结构 string string自动扩容 Redis中的简单动态字符串(SDS)具有以下优点: SDS数据的编码格式 比较: string 常用操作 分布式锁 使用情况,…

每日Attention学习2——Multi-Scale Convolutional Attention

模块出处 [link] [code] [NIPS 22] SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation 模块名称 Multi-Scale Convolutional Attention (MSCA) 模块作用 多尺度特征提取,更大感受野 模块结构 模块代码 import torch import torch.…

【启明智显技术分享】“ESP-IDF环境搭建全攻略:告别基于乐鑫方案彩屏开发中的搭建难题”

前言: 【启明智显】专注于HMI(人机交互)及AIoT(人工智能物联网)产品和解决方案的提供商,我们深知彩屏显示方案在现代物联网应用中的重要性。为此,我们一直致力于为客户提供彩屏显示方案相关的技…

深度解析:数据结构二叉树(1)

✅作者简介:大家好,我是再无B~U~G,一个想要与大家共同进步的男人😉😉 🍎个人主页: 再无B~U~G-CSDN博客 目标 1. 掌握树的基本概念 2. 掌握二叉…

分享10个高质量宝藏网站~

分享一波高质量宝藏网站~ 这10个宝藏网站,个个都好用到爆,娱乐、办公、学习都能在这里找到! 1、Z-Library https://zh.zlibrary-be.se/ 世界最大的免费电子书下载网站!电子书资源超千万,不过这个网站不太稳定&#…

网络原理

UDP 特点:无连接 不可靠传输 面向数据报 全双工 报文格式: UDP数据报UDP报头UDP载荷(应用层数据报) | 源端口 目的端口 报文长度 校验和 TCP 特点:有连接 可靠传输 面向字节流 全双工 作为传输层…

C++实验五 : 类的继承 -----CUST

【题目】 1.定义person类,包括数据私有成员:姓名,性别;共用成员函数:带参数构造函数,display函数输出本类对象的所有数据成员值。 2.定义student类,保护继承person类;增加保护数据成…

怎么找投资白银的贵金属交易平台?

在当今的投资市场中,白银作为一种贵金属,一直受到投资者的广泛关注。但是,如何选择一家可靠的贵金属交易平台进行投资呢?这是许多投资者面临的难题。本文将从多个角度为投资者详细解析如何找到一家值得信赖的贵金属交易平台。 我们…

多模态大模型通过外接数据方案实现电力智能巡检(设计方案)

大模型相关目录 大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容 从0起步,扬帆起航。 大模型应用向开发路径:AI代理工作流大模型应用开发实用开源项目汇总大模…

TSINGSEE青犀视频边缘计算AI智能分析网关V4告警消息语音推送的配置流程

TSINGSEE青犀视频边缘计算硬件智能分析网关V4内置了近40种AI算法模型,支持对接入的视频图像进行人、车、物、行为等实时检测分析,上报识别结果,并能进行语音告警播放。今天我们来分享一下如何配置和使用AI智能分析网关V4的语音推送。 提前准备…

webrtc初步了解

WebRTC搭建点对点实时音视频对话,起始需要保证完成两点: 1.媒体协商,了解彼此支持的媒体格式。参与视频通讯的双方必须先交换SDP信息,交换SDP的过程。 2.网络协商,了解彼此的网络环境,找到一条相互通讯的链…

【SpringBoot整合系列】SpringBoot整合RabbitMQ-消息可靠性

目录 确保消息的可靠性RabbitMQ 消息发送可靠性分析解决方案开启事务机制发送方确认机制单条消息处理消息批量处理 失败重试自带重试机制业务重试 RabbitMQ 消息消费可靠性如何保证消息在队列RabbitMQ 的消息消费,整体上来说有两种不同的思路:确保消费成…

基于Java+SpringBoot+Vue+echarts健身房管理系统设计和实现

基于JavaSpringBootVueecharts健身房管理系统设计和实现 🍅 作者主页 网顺技术团队 🍅 欢迎点赞 👍 收藏 ⭐留言 📝 🍅 文末获取源码联系方式 📝 🍅 查看下方微信号获取联系方式 承接各种定制系…

Axure PR 10 下拉三级菜单设计图

在线预览地址:Untitled Document 程序员必备资源网站:天梦星服务平台 (tmxkj.top) 需要源码设计图联系我wx:19948765606,3块钱拿走

k8s 使用Docker和Containerd对比分析

目录 k8s 使用Docker和Containerd对比分析 互动1:docker build构建的镜像和containerd镜像通用吗? 互动2:k8s1.24之前版本和1.24及1.24之后版本区别? k8s 使用Docker和Containerd对比分析 如果你使用Docker作为K8S容器运行时的…

orbslam2基础

目录 一、 内容概要二、 orbslam2基础介绍三 、 orbslam2安装3.1 安装依赖3.2 安装orbslam23.3 下载Kitee数据集 四、 进行ORBSLAM2仿真五、 心得体会六、 参考链接 一、 内容概要 orbslam2基础介绍orbslam2安装orbslam2使用案例:orbslam2kitti数据集序列图像 二、…

python3安装教程

1.下载python 百度网盘下载python-3.12.3-amd64.exe 链接:https://pan.baidu.com/s/1MV3kvVdjCdS_G-_KgefwLw?pwdpgzu 提取码:pgzu 官网下载:Welcome to Python.org 有很多版本,选择需要的版本下载 2.安装python 双击python-…

作为餐饮行业HR,怎么选择一套合适的HCM人事管理系统?

在餐饮业这个行业中,人员流动性较高,特别是对于服务员和厨师这类基层员工,招聘一直是一个难题。根据艾瑞数据测算,到2024年,中国餐饮行业的年收入将超过6万亿元,年复合增长率高达8.8%。作为餐饮企业的品牌战…

RV32I指令集及其编码方式解读

文章目录 前言RISCV指令集的模块化RV32IR型指令I型指令load指令 (I型) S型指令B型指令 (S型指令变体)PC相对地址B型指令简单举例 U型指令LUI指令li伪指令 AUIPC指令 J型指令(U型指令变体)JAL指令JALR指令(I型指令) 注参考 前言 R I S C − V RISC-V RISC−V 表示精简指令集计算…