FFmpeg常用命令行讲解及实战一

文章目录

  • 前言
  • 一、学习资料参考
  • 二、FFmpeg 选项
    • 1、主要选项
      • ①、主要命令选项
      • ②、举例
    • 2、视频选项
      • ①、主要命令选项
      • ②、举例
        • 1)提取固定帧
        • 2)禁止输出视频
        • 3)指定视频的纵横比
    • 3、音频选项
      • ①、主要命令选项
      • ②、举例
    • 4、字幕选项
      • ①、主要命令选项
      • ②、举例
        • 1)将字幕加入视频中
        • 2)字幕格式转换
        • 3)提取字幕
  • 三、FFmpeg 命令示例
    • 1、转换格式(封装格式的转化)
    • 2、抽取画面中的音频
    • 3、抽取画面中的视频
    • 4、音频+视频合成
    • 5、音频+音频合成
    • 6、视频分离成图片
    • 7、图片合成视频
    • 8、改变音量大小
    • 9、音效淡入淡出效果
    • 10、截取音频
    • 11、容器时长获取
    • 12、网络资源下载
    • 13、播放音频视频
    • 14、图片生成 gif 动图
    • 15、抽取 PCM 数据


前言

本文讲解 FFmpeg 常用命令,并进行实践。

有关 FFmpeg 的入门及编译等内容可以参考我之前的博客:

  • FFmpeg入门及编译
  • FFmpeg深入学习

一、学习资料参考

  • FFmpeg 官方文档地址
    • 适合入门后再看
  • FFmpeg 官方 Wiki 地址
    • 适合入门后再看
  • FFmpeg 翻译文档地址
    • 初学者可以参考着看一看,里面有些复杂的可以跳过
  • FFmpeg 中文论坛
    • 适合提升的时候用
  • FFmpeg 雷神博客地址
    • 里面既有小白入门的也有比较难的
  • 罗索实验室官方地址
    • 用于提升的时候用

二、FFmpeg 选项

1、主要选项

查看 ffmpeg 的版本

ffmpeg -version

在这里插入图片描述
上图红框内为编译选项,编译选项支持编解码的格式、封装的格式及网络协议等等第三方包。其中比较常用的:

  • 音频相关:libmp3lame
  • 视频相关:libx264libx265libvpxlibxvidavisynth

使用 MediaInfo 对原视频文件 SampleVideo_1280x720_20mb.mp4 进行分析:
在这里插入图片描述
使用 MediaInfo 对 flv 格式原视频文件 SampleVideo_1280x720_20mb.flv 进行分析:
在这里插入图片描述
flv 文件默认视频编码格式为 sorenson spark,默认音频编码格式为 mp3,即:Flv: [sorenson spark(vcodec) + mp3(acodec)]

以下表格内三种写法是等价的:

音频视频字幕
-codec:a-codec:v-codec:s
-c:a-c:v-c:s
-acodec-vcodec-scodec

①、主要命令选项

  • -f fmt (input/output) :指定输入或者输出文件格式(封装格式,视频容器)。常规可省略,而使用依据扩展名(文件的前几百 K 的内容,智能分析)的自动指定,但一些选项需要强制明确设定。
  • -i filename(input) :指定输入文件。
  • -y(global):默认自动覆盖输出文件,而不再询问确认。
  • -n( global):不覆盖输出文件,如果输出文件已经存在则立即退出。
  • -t duration( input/output):限制输入/输出的时间。如果是在 -i 前面,就是限定从输入中读取多少时间的数据;如果是用于限定输出文件,则表示写入多少时间数据后就停止。duration 可以是以秒为单位的数值或者 hh:mm:ss[.xxx] 格式的时间值。注意 -to 和 -t 是互斥的,-t 有更高优先级。
  • -to position (output) :只写入 position 时间后就停止,position 可以是以秒为单位的数值或者 hh:mm:ss[.xxx] 格式的时间值。注意 -to 和 -t 是互斥的,-t 有更高优先级。
  • -ss position (input/output):当在 -i 前,表示定位输入文件到 position 指定的位置。注意可能一些格式是不支持精确定位的,所以 ffmpeg 可能是定位到最接近 position(在之前)的可定位点。position 可以是以秒为单位的数值或者 hh:mm:ss[.xxx] 格式的时间值。
  • -codec[:stream_specifier] codec (input/output,per-stream) :为特定的文件选择编/解码模式,对于输出文件就是编码器, 对于输入或者某个流就是解码器。选项参数中 codec 是编解码器的名字,或者是 copy(仅对输出文件)则意味着流数据直接复制而不再编码。

使用下面命令可以检测 ffmepg 所支持的所有编码器的格式

ffmpeg.exe -encoders

回显如下:

PS D:\Work\test> ffmpeg.exe -encoders
ffmpeg version 6.0-essentials_build-www.gyan.dev Copyright (c) 2000-2023 the FFmpeg developers
  built with gcc 12.2.0 (Rev10, Built by MSYS2 project)
  configuration: --enable-gpl --enable-version3 --enable-static --disable-w32threads --disable-autodetect --enable-fontconfig --enable-iconv --enable-gnutls --enable-libxml2 --enable-gmp --enable-bzlib --enable-lzma --enable-zlib --enable-libsrt --enable-libssh --enable-libzmq --enable-avisynth --enable-sdl2 --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxvid --enable-libaom --enable-libopenjpeg --enable-libvpx --enable-mediafoundation --enable-libass --enable-libfreetype --enable-libfribidi --enable-libvidstab --enable-libvmaf --enable-libzimg --enable-amf --enable-cuda-llvm --enable-cuvid --enable-ffnvcodec --enable-nvdec --enable-nvenc --enable-d3d11va --enable-dxva2 --enable-libvpl --enable-libgme --enable-libopenmpt --enable-libopencore-amrwb --enable-libmp3lame --enable-libtheora --enable-libvo-amrwbenc --enable-libgsm --enable-libopencore-amrnb --enable-libopus --enable-libspeex --enable-libvorbis --enable-librubberband
  libavutil      58.  2.100 / 58.  2.100
  libavcodec     60.  3.100 / 60.  3.100
  libavformat    60.  3.100 / 60.  3.100
  libavdevice    60.  1.100 / 60.  1.100
  libavfilter     9.  3.100 /  9.  3.100
  libswscale      7.  1.100 /  7.  1.100
  libswresample   4. 10.100 /  4. 10.100
  libpostproc    57.  1.100 / 57.  1.100
Encoders:
 V..... = Video
 A..... = Audio
 S..... = Subtitle
 .F.... = Frame-level multithreading
 ..S... = Slice-level multithreading
 ...X.. = Codec is experimental
 ....B. = Supports draw_horiz_band
 .....D = Supports direct rendering method 1
 ------
 V....D a64multi             Multicolor charset for Commodore 64 (codec a64_multi)
 V....D a64multi5            Multicolor charset for Commodore 64, extended with 5th color (colram) (codec a64_multi5)
 V....D alias_pix            Alias/Wavefront PIX image
 V..... amv                  AMV Video
 V....D apng                 APNG (Animated Portable Network Graphics) image
 V....D asv1                 ASUS V1
 V....D asv2                 ASUS V2
 V....D libaom-av1           libaom AV1 (codec av1)
 V....D av1_nvenc            NVIDIA NVENC av1 encoder (codec av1)
 V..... av1_qsv              AV1 (Intel Quick Sync Video acceleration) (codec av1)
 V....D av1_amf              AMD AMF AV1 encoder (codec av1)
 V....D avrp                 Avid 1:1 10-bit RGB Packer
 V..X.D avui                 Avid Meridien Uncompressed
 V....D ayuv                 Uncompressed packed MS 4:4:4:4
 VF...D bitpacked            Bitpacked
 V....D bmp                  BMP (Windows and OS/2 bitmap)
 VF...D cfhd                 GoPro CineForm HD
 V....D cinepak              Cinepak
 V....D cljr                 Cirrus Logic AccuPak
 V.S..D vc2                  SMPTE VC-2 (codec dirac)
 VFS..D dnxhd                VC3/DNxHD
 V....D dpx                  DPX (Digital Picture Exchange) image
 VFS..D dvvideo              DV (Digital Video)
 VF...D exr                  OpenEXR image
 V.S..D ffv1                 FFmpeg video codec #1
 VF...D ffvhuff              Huffyuv FFmpeg variant
 V....D fits                 Flexible Image Transport System
 V....D flashsv              Flash Screen Video
 V....D flashsv2             Flash Screen Video Version 2
 V..... flv                  FLV / Sorenson Spark / Sorenson H.263 (Flash Video) (codec flv1)
 V....D gif                  GIF (Graphics Interchange Format)
 V..... h261                 H.261
 V..... h263                 H.263 / H.263-1996
 V.S... h263p                H.263+ / H.263-1998 / H.263 version 2
 V....D libx264              libx264 H.264 / AVC / MPEG-4 AVC / MPEG-4 part 10 (codec h264)
 V....D libx264rgb           libx264 H.264 / AVC / MPEG-4 AVC / MPEG-4 part 10 RGB (codec h264)
 V....D h264_amf             AMD AMF H.264 Encoder (codec h264)
 V....D h264_mf              H264 via MediaFoundation (codec h264)
 V....D h264_nvenc           NVIDIA NVENC H.264 encoder (codec h264)
 V..... h264_qsv             H.264 / AVC / MPEG-4 AVC / MPEG-4 part 10 (Intel Quick Sync Video acceleration) (codec h264)
 VF...D hdr                  HDR (Radiance RGBE format) image
 V....D libx265              libx265 H.265 / HEVC (codec hevc)
 V....D hevc_amf             AMD AMF HEVC encoder (codec hevc)
 V....D hevc_mf              HEVC via MediaFoundation (codec hevc)
 V....D hevc_nvenc           NVIDIA NVENC hevc encoder (codec hevc)
 V..... hevc_qsv             HEVC (Intel Quick Sync Video acceleration) (codec hevc)
 VF...D huffyuv              Huffyuv / HuffYUV
 V....D jpeg2000             JPEG 2000
 VF.... libopenjpeg          OpenJPEG JPEG 2000 (codec jpeg2000)
 VF...D jpegls               JPEG-LS
 VF...D ljpeg                Lossless JPEG
 VF...D magicyuv             MagicYUV video
 VFS... mjpeg                MJPEG (Motion JPEG)
 V..... mjpeg_qsv            MJPEG (Intel Quick Sync Video acceleration) (codec mjpeg)
 V.S... mpeg1video           MPEG-1 video
 V.S... mpeg2video           MPEG-2 video
 V..... mpeg2_qsv            MPEG-2 video (Intel Quick Sync Video acceleration) (codec mpeg2video)
 V.S... mpeg4                MPEG-4 part 2
 V....D libxvid              libxvidcore MPEG-4 part 2 (codec mpeg4)
 V..... msmpeg4v2            MPEG-4 part 2 Microsoft variant version 2
 V..... msmpeg4              MPEG-4 part 2 Microsoft variant version 3 (codec msmpeg4v3)
 V..... msvideo1             Microsoft Video-1
 V....D pam                  PAM (Portable AnyMap) image
 V....D pbm                  PBM (Portable BitMap) image
 V....D pcx                  PC Paintbrush PCX image
 V....D pfm                  PFM (Portable FloatMap) image
 V....D pgm                  PGM (Portable GrayMap) image
 V....D pgmyuv               PGMYUV (Portable GrayMap YUV) image
 V....D phm                  PHM (Portable HalfFloatMap) image
 VF...D png                  PNG (Portable Network Graphics) image
 V....D ppm                  PPM (Portable PixelMap) image
 VF...D prores               Apple ProRes
 VF...D prores_aw            Apple ProRes (codec prores)
 VFS... prores_ks            Apple ProRes (iCodec Pro) (codec prores)
 VF...D qoi                  QOI (Quite OK Image format) image
 V....D qtrle                QuickTime Animation (RLE) video
 V....D r10k                 AJA Kona 10-bit RGB Codec
 V....D r210                 Uncompressed RGB 10-bit
 VF...D rawvideo             raw video
 V....D roqvideo             id RoQ video (codec roq)
 V....D rpza                 QuickTime video (RPZA)
 V..... rv10                 RealVideo 1.0
 V..... rv20                 RealVideo 2.0
 V....D sgi                  SGI image
 V....D smc                  QuickTime Graphics (SMC)
 V....D snow                 Snow
 V..... speedhq              NewTek SpeedHQ
 V....D sunrast              Sun Rasterfile image
 V....D svq1                 Sorenson Vector Quantizer 1 / Sorenson Video 1 / SVQ1
 V....D targa                Truevision Targa image
 V....D libtheora            libtheora Theora (codec theora)
 VF...D tiff                 TIFF image
 VF...D utvideo              Ut Video
 VF...D v210                 Uncompressed 4:2:2 10-bit
 V....D v308                 Uncompressed packed 4:4:4
 V....D v408                 Uncompressed packed QT 4:4:4:4
 V....D v410                 Uncompressed 4:4:4 10-bit
 V.S..D vbn                  Vizrt Binary Image
 V..... vnull                null video
 V....D libvpx               libvpx VP8 (codec vp8)
 V....D libvpx-vp9           libvpx VP9 (codec vp9)
 V..... vp9_qsv              VP9 video (Intel Quick Sync Video acceleration) (codec vp9)
 VF...D wbmp                 WBMP (Wireless Application Protocol Bitmap) image
 V....D libwebp_anim         libwebp WebP image (codec webp)
 V....D libwebp              libwebp WebP image (codec webp)
 V..... wmv1                 Windows Media Video 7
 V..... wmv2                 Windows Media Video 8
 V..... wrapped_avframe      AVFrame to AVPacket passthrough
 V....D xbm                  XBM (X BitMap) image
 V....D xface                X-face image
 V....D xwd                  XWD (X Window Dump) image
 V....D y41p                 Uncompressed YUV 4:1:1 12-bit
 V....D yuv4                 Uncompressed packed 4:2:0
 VF...D zlib                 LCL (LossLess Codec Library) ZLIB
 V....D zmbv                 Zip Motion Blocks Video
 A....D aac                  AAC (Advanced Audio Coding)
 A....D aac_mf               AAC via MediaFoundation (codec aac)
 A....D ac3                  ATSC A/52A (AC-3)
 A....D ac3_fixed            ATSC A/52A (AC-3) (codec ac3)
 A....D ac3_mf               AC3 via MediaFoundation (codec ac3)
 A....D adpcm_adx            SEGA CRI ADX ADPCM
 A....D adpcm_argo           ADPCM Argonaut Games
 A....D g722                 G.722 ADPCM (codec adpcm_g722)
 A....D g726                 G.726 ADPCM (codec adpcm_g726)
 A....D g726le               G.726 little endian ADPCM ("right-justified") (codec adpcm_g726le)
 A....D adpcm_ima_alp        ADPCM IMA High Voltage Software ALP
 A....D adpcm_ima_amv        ADPCM IMA AMV
 A....D adpcm_ima_apm        ADPCM IMA Ubisoft APM
 A....D adpcm_ima_qt         ADPCM IMA QuickTime
 A....D adpcm_ima_ssi        ADPCM IMA Simon & Schuster Interactive
 A....D adpcm_ima_wav        ADPCM IMA WAV
 A....D adpcm_ima_ws         ADPCM IMA Westwood
 A....D adpcm_ms             ADPCM Microsoft
 A....D adpcm_swf            ADPCM Shockwave Flash
 A....D adpcm_yamaha         ADPCM Yamaha
 A....D alac                 ALAC (Apple Lossless Audio Codec)
 A....D libopencore_amrnb    OpenCORE AMR-NB (Adaptive Multi-Rate Narrow-Band) (codec amr_nb)
 A....D libvo_amrwbenc       Android VisualOn AMR-WB (Adaptive Multi-Rate Wide-Band) (codec amr_wb)
 A..... anull                null audio
 A....D aptx                 aptX (Audio Processing Technology for Bluetooth)
 A....D aptx_hd              aptX HD (Audio Processing Technology for Bluetooth)
 A....D comfortnoise         RFC 3389 comfort noise generator
 A....D dfpwm                DFPWM1a audio
 A..X.D dca                  DCA (DTS Coherent Acoustics) (codec dts)
 A....D eac3                 ATSC A/52 E-AC-3
 A....D flac                 FLAC (Free Lossless Audio Codec)
 A....D g723_1               G.723.1
 A....D libgsm               libgsm GSM (codec gsm)
 A....D libgsm_ms            libgsm GSM Microsoft variant (codec gsm_ms)
 A..X.D mlp                  MLP (Meridian Lossless Packing)
 A....D mp2                  MP2 (MPEG audio layer 2)
 A....D mp2fixed             MP2 fixed point (MPEG audio layer 2) (codec mp2)
 A....D libmp3lame           libmp3lame MP3 (MPEG audio layer 3) (codec mp3)
 A....D mp3_mf               MP3 via MediaFoundation (codec mp3)
 A....D nellymoser           Nellymoser Asao
 A..X.D opus                 Opus
 A....D libopus              libopus Opus (codec opus)
 A....D pcm_alaw             PCM A-law / G.711 A-law
 A....D pcm_bluray           PCM signed 16|20|24-bit big-endian for Blu-ray media
 A....D pcm_dvd              PCM signed 16|20|24-bit big-endian for DVD media
 A....D pcm_f32be            PCM 32-bit floating point big-endian
 A....D pcm_f32le            PCM 32-bit floating point little-endian
 A....D pcm_f64be            PCM 64-bit floating point big-endian
 A....D pcm_f64le            PCM 64-bit floating point little-endian
 A....D pcm_mulaw            PCM mu-law / G.711 mu-law
 A....D pcm_s16be            PCM signed 16-bit big-endian
 A....D pcm_s16be_planar     PCM signed 16-bit big-endian planar
 A....D pcm_s16le            PCM signed 16-bit little-endian
 A....D pcm_s16le_planar     PCM signed 16-bit little-endian planar
 A....D pcm_s24be            PCM signed 24-bit big-endian
 A....D pcm_s24daud          PCM D-Cinema audio signed 24-bit
 A....D pcm_s24le            PCM signed 24-bit little-endian
 A....D pcm_s24le_planar     PCM signed 24-bit little-endian planar
 A....D pcm_s32be            PCM signed 32-bit big-endian
 A....D pcm_s32le            PCM signed 32-bit little-endian
 A....D pcm_s32le_planar     PCM signed 32-bit little-endian planar
 A....D pcm_s64be            PCM signed 64-bit big-endian
 A....D pcm_s64le            PCM signed 64-bit little-endian
 A....D pcm_s8               PCM signed 8-bit
 A....D pcm_s8_planar        PCM signed 8-bit planar
 A....D pcm_u16be            PCM unsigned 16-bit big-endian
 A....D pcm_u16le            PCM unsigned 16-bit little-endian
 A....D pcm_u24be            PCM unsigned 24-bit big-endian
 A....D pcm_u24le            PCM unsigned 24-bit little-endian
 A....D pcm_u32be            PCM unsigned 32-bit big-endian
 A....D pcm_u32le            PCM unsigned 32-bit little-endian
 A....D pcm_u8               PCM unsigned 8-bit
 A....D pcm_vidc             PCM Archimedes VIDC
 A....D real_144             RealAudio 1.0 (14.4K) (codec ra_144)
 A....D roq_dpcm             id RoQ DPCM
 A..X.D s302m                SMPTE 302M
 A....D sbc                  SBC (low-complexity subband codec)
 A..X.D sonic                Sonic
 A..X.D sonicls              Sonic lossless
 A....D libspeex             libspeex Speex (codec speex)
 A..X.D truehd               TrueHD
 A....D tta                  TTA (True Audio)
 A..X.D vorbis               Vorbis
 A....D libvorbis            libvorbis (codec vorbis)
 A....D wavpack              WavPack
 A....D wmav1                Windows Media Audio 1
 A....D wmav2                Windows Media Audio 2
 S..... ssa                  ASS (Advanced SubStation Alpha) subtitle (codec ass)
 S..... ass                  ASS (Advanced SubStation Alpha) subtitle
 S..... dvbsub               DVB subtitles (codec dvb_subtitle)
 S..... dvdsub               DVD subtitles (codec dvd_subtitle)
 S..... mov_text             3GPP Timed Text subtitle
 S..... srt                  SubRip subtitle (codec subrip)
 S..... subrip               SubRip subtitle
 S..... text                 Raw text subtitle
 S..... ttml                 TTML subtitle
 S..... webvtt               WebVTT subtitle
 S..... xsub                 DivX subtitles (XSUB)

②、举例

下面命令的功能是从输入视频文件的第 10 秒开始截取持续 10.345 秒的视频,并将截取后的视频保存为 FLV 格式的文件。视频和音频的编码格式将与输入文件相同,没有进行重新编码,只是进行了格式转换和截取操作。

ffmpeg -ss 10 -i SampleVideo_1280x720_20mb.mp4 -t 00:00:10.345 -vcodec copy -acodec copy -f flv -y SampleVideo-testflv.flv

回显信息:

PS D:\Work\test> ffmpeg -ss 10 -i SampleVideo_1280x720_20mb.mp4 -t 00:00:10.345 -vcodec copy -acodec copy -f flv -y SampleVideo-testflv.flv
ffmpeg version 6.0-essentials_build-www.gyan.dev Copyright (c) 2000-2023 the FFmpeg developers
  built with gcc 12.2.0 (Rev10, Built by MSYS2 project)
  configuration: --enable-gpl --enable-version3 --enable-static --disable-w32threads --disable-autodetect --enable-fontconfig --enable-iconv --enable-gnutls --enable-libxml2 --enable-gmp --enable-bzlib --enable-lzma --enable-zlib --enable-libsrt --enable-libssh --enable-libzmq --enable-avisynth --enable-sdl2 --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxvid --enable-libaom --enable-libopenjpeg --enable-libvpx --enable-mediafoundation --enable-libass --enable-libfreetype --enable-libfribidi --enable-libvidstab --enable-libvmaf --enable-libzimg --enable-amf --enable-cuda-llvm --enable-cuvid --enable-ffnvcodec --enable-nvdec --enable-nvenc --enable-d3d11va --enable-dxva2 --enable-libvpl --enable-libgme --enable-libopenmpt --enable-libopencore-amrwb --enable-libmp3lame --enable-libtheora --enable-libvo-amrwbenc --enable-libgsm --enable-libopencore-amrnb --enable-libopus --enable-libspeex --enable-libvorbis --enable-librubberband
  libavutil      58.  2.100 / 58.  2.100
  libavcodec     60.  3.100 / 60.  3.100
  libavformat    60.  3.100 / 60.  3.100
  libavdevice    60.  1.100 / 60.  1.100
  libavfilter     9.  3.100 /  9.  3.100
  libswscale      7.  1.100 /  7.  1.100
  libswresample   4. 10.100 /  4. 10.100
  libpostproc    57.  1.100 / 57.  1.100
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'SampleVideo_1280x720_20mb.mp4':
  Metadata:
    major_brand     : isom
    minor_version   : 512
    compatible_brands: isomiso2avc1mp41
    creation_time   : 1970-01-01T00:00:00.000000Z
    encoder         : Lavf53.24.2
  Duration: 00:01:57.31, start: 0.000000, bitrate: 1436 kb/s
  Stream #0:0[0x1](und): Video: h264 (Main) (avc1 / 0x31637661), yuv420p(progressive), 1280x720 [SAR 1:1 DAR 16:9], 1048 kb/s, 25 fps, 25 tbr, 12800 tbn (default)
    Metadata:
      creation_time   : 1970-01-01T00:00:00.000000Z
      handler_name    : VideoHandler
      vendor_id       : [0][0][0][0]
  Stream #0:1[0x2](und): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, 5.1, fltp, 383 kb/s (default)
    Metadata:
      creation_time   : 1970-01-01T00:00:00.000000Z
      handler_name    : SoundHandler
      vendor_id       : [0][0][0][0]
Output #0, flv, to 'SampleVideo-testflv.flv':
  Metadata:
    major_brand     : isom
    minor_version   : 512
    compatible_brands: isomiso2avc1mp41
    encoder         : Lavf60.3.100
  Stream #0:0(und): Video: h264 (Main) ([7][0][0][0] / 0x0007), yuv420p(progressive), 1280x720 [SAR 1:1 DAR 16:9], q=2-31, 1048 kb/s, 25 fps, 25 tbr, 1k tbn (default)
    Metadata:
      creation_time   : 1970-01-01T00:00:00.000000Z
      handler_name    : VideoHandler
      vendor_id       : [0][0][0][0]
  Stream #0:1(und): Audio: aac (LC) ([10][0][0][0] / 0x000A), 48000 Hz, 5.1, fltp, 383 kb/s (default)
    Metadata:
      creation_time   : 1970-01-01T00:00:00.000000Z
      handler_name    : SoundHandler
      vendor_id       : [0][0][0][0]
Stream mapping:
  Stream #0:0 -> #0:0 (copy)
  Stream #0:1 -> #0:1 (copy)
Press [q] to stop, [?] for help
frame=  299 fps=0.0 q=-1.0 Lsize=    1618kB time=00:00:10.33 bitrate=1283.2kbits/s speed=1.2e+03x
video:1039kB audio:563kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.975729%
PS D:\Work\test>

使用 MediaInfo 查看生成文件相关信息,可以看到截取的视频长度为 11s 976 ms,且包含 1 路视频流及 1 路音频流,帧率为25 帧。
在这里插入图片描述
注:这里是 11s 多而不是 10.345s 的原因是截取时是以一个 GOP 进行截取的。

使用 VLC 播放确实如此:
在这里插入图片描述

2、视频选项

①、主要命令选项

  • -vframes number (output):设置输出文件的帧数,是 -frames:v 的别名。
  • -b:设定视频流量, 默认为 200Kbit/s,bitrate
  • -r[:stream_specifier] fps (input/output,per-stream): 设置帧率(一种 Hz 值,缩写或者分数值)。
  • -s[:stream_specifier] size (input/output,per-stream) :设置帧的尺寸。
  • -vn (output) 禁止输出视频。N:no
  • -vcodec codec (output):设置视频编码器, 这是 -codec:v 的一个别名。
  • aspect[:stream_specifier] aspect (output,per-stream):指定视频的纵横比(长宽显示比例)。aspect 是一 个浮点数字符串或者 num:den 格式字符串(其值就是 num/den) ,例如 "4:3""16:9""1.3333" 以及 "1.7777" 都是常用参数值。

②、举例

1)提取固定帧

下面命令的功能是将输入视频文件进行重新编码,并截取前 90 帧视频,然后将重新编码和截取后的视频保存为 FLV 格式的文件。视频编码器使用了 libx264,这意味着输出视频将使用 x264 编码器进行压缩,以提供高质量的视频编码。

ffmpeg -i SampleVideo_1280x720_20mb.mp4 -vcodec libx264 -vframes 75 -f flv -y SampleVideo-testflv.flv

回显信息:

PS D:\Work\test> ffmpeg -i SampleVideo_1280x720_20mb.mp4 -vcodec libx264 -vframes 75 -f flv -y SampleVideo-testflv.flv
ffmpeg version 6.0-essentials_build-www.gyan.dev Copyright (c) 2000-2023 the FFmpeg developers
  built with gcc 12.2.0 (Rev10, Built by MSYS2 project)
  configuration: --enable-gpl --enable-version3 --enable-static --disable-w32threads --disable-autodetect --enable-fontconfig --enable-iconv --enable-gnutls --enable-libxml2 --enable-gmp --enable-bzlib --enable-lzma --enable-zlib --enable-libsrt --enable-libssh --enable-libzmq --enable-avisynth --enable-sdl2 --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxvid --enable-libaom --enable-libopenjpeg --enable-libvpx --enable-mediafoundation --enable-libass --enable-libfreetype --enable-libfribidi --enable-libvidstab --enable-libvmaf --enable-libzimg --enable-amf --enable-cuda-llvm --enable-cuvid --enable-ffnvcodec --enable-nvdec --enable-nvenc --enable-d3d11va --enable-dxva2 --enable-libvpl --enable-libgme --enable-libopenmpt --enable-libopencore-amrwb --enable-libmp3lame --enable-libtheora --enable-libvo-amrwbenc --enable-libgsm --enable-libopencore-amrnb --enable-libopus --enable-libspeex --enable-libvorbis --enable-librubberband
  libavutil      58.  2.100 / 58.  2.100
  libavcodec     60.  3.100 / 60.  3.100
  libavformat    60.  3.100 / 60.  3.100
  libavdevice    60.  1.100 / 60.  1.100
  libavfilter     9.  3.100 /  9.  3.100
  libswscale      7.  1.100 /  7.  1.100
  libswresample   4. 10.100 /  4. 10.100
  libpostproc    57.  1.100 / 57.  1.100
Input #0, mov,mp4,m4a,3gp,3g2,mj2, from 'SampleVideo_1280x720_20mb.mp4':
  Metadata:
    major_brand     : isom
    minor_version   : 512
    compatible_brands: isomiso2avc1mp41
    creation_time   : 1970-01-01T00:00:00.000000Z
    encoder         : Lavf53.24.2
  Duration: 00:01:57.31, start: 0.000000, bitrate: 1436 kb/s
  Stream #0:0[0x1](und): Video: h264 (Main) (avc1 / 0x31637661), yuv420p(progressive), 1280x720 [SAR 1:1 DAR 16:9], 1048 kb/s, 25 fps, 25 tbr, 12800 tbn (default)
    Metadata:
      creation_time   : 1970-01-01T00:00:00.000000Z
      handler_name    : VideoHandler
      vendor_id       : [0][0][0][0]
  Stream #0:1[0x2](und): Audio: aac (LC) (mp4a / 0x6134706D), 48000 Hz, 5.1, fltp, 383 kb/s (default)
    Metadata:
      creation_time   : 1970-01-01T00:00:00.000000Z
      handler_name    : SoundHandler
      vendor_id       : [0][0][0][0]
Stream mapping:
  Stream #0:0 -> #0:0 (h264 (native) -> h264 (libx264))
  Stream #0:1 -> #0:1 (aac (native) -> mp3 (libmp3lame))
Press [q] to stop, [?] for help
[libx264 @ 00000211314d7340] using SAR=1/1
[libx264 @ 00000211314d7340] using cpu capabilities: MMX2 SSE2Fast SSSE3 SSE4.2 AVX FMA3 BMI2 AVX2
[libx264 @ 00000211314d7340] profile High, level 3.1, 4:2:0, 8-bit
[libx264 @ 00000211314d7340] 264 - core 164 r3106 eaa68fa - H.264/MPEG-4 AVC codec - Copyleft 2003-2023 - http://www.videolan.org/x264.html - options: cabac=1 ref=3 deblock=1:0:0 analyse=0x3:0x113 me=hex subme=7 psy=1 psy_rd=1.00:0.00 mixed_ref=1 me_range=16 chroma_me=1 trellis=1 8x8dct=1 cqm=0 deadzone=21,11 fast_pskip=1 chroma_qp_offset=-2 threads=22 lookahead_threads=3 sliced_threads=0 nr=0 decimate=1 interlaced=0 bluray_compat=0 constrained_intra=0 bframes=3 b_pyramid=2 b_adapt=1 b_bias=0 direct=1 weightb=1 open_gop=0 weightp=2 keyint=250 keyint_min=25 scenecut=40 intra_refresh=0 rc_lookahead=40 rc=crf mbtree=1 crf=23.0 qcomp=0.60 qpmin=0 qpmax=69 qpstep=4 ip_ratio=1.40 aq=1:1.00
Output #0, flv, to 'SampleVideo-testflv.flv':
  Metadata:
    major_brand     : isom
    minor_version   : 512
    compatible_brands: isomiso2avc1mp41
    encoder         : Lavf60.3.100
  Stream #0:0(und): Video: h264 ([7][0][0][0] / 0x0007), yuv420p(progressive), 1280x720 [SAR 1:1 DAR 16:9], q=2-31, 25 fps, 1k tbn (default)
    Metadata:
      creation_time   : 1970-01-01T00:00:00.000000Z
      handler_name    : VideoHandler
      vendor_id       : [0][0][0][0]
      encoder         : Lavc60.3.100 libx264
    Side data:
      cpb: bitrate max/min/avg: 0/0/0 buffer size: 0 vbv_delay: N/A
  Stream #0:1(und): Audio: mp3 ([2][0][0][0] / 0x0002), 48000 Hz, stereo, fltp (default)
    Metadata:
      creation_time   : 1970-01-01T00:00:00.000000Z
      handler_name    : SoundHandler
      vendor_id       : [0][0][0][0]
      encoder         : Lavc60.3.100 libmp3lame
frame=   75 fps=0.0 q=-1.0 Lsize=     759kB time=00:00:02.97 bitrate=2088.0kbits/s speed=5.24x
video:708kB audio:47kB subtitle:0kB other streams:0kB global headers:0kB muxing overhead: 0.517854%
[libx264 @ 00000211314d7340] frame I:1     Avg QP:20.95  size:110857
[libx264 @ 00000211314d7340] frame P:20    Avg QP:22.84  size: 20399
[libx264 @ 00000211314d7340] frame B:54    Avg QP:28.08  size:  3798
[libx264 @ 00000211314d7340] consecutive B-frames:  1.3%  8.0%  0.0% 90.7%
[libx264 @ 00000211314d7340] mb I  I16..4:  6.1% 25.2% 68.8%
[libx264 @ 00000211314d7340] mb P  I16..4:  1.7%  5.3%  0.8%  P16..4: 44.9% 19.7% 10.2%  0.0%  0.0%    skip:17.2%
[libx264 @ 00000211314d7340] mb B  I16..4:  0.2%  0.4%  0.1%  B16..8: 50.8%  2.8%  0.3%  direct: 0.6%  skip:44.8%  L0:54.1% L1:42.1% BI: 3.8%
[libx264 @ 00000211314d7340] 8x8 transform intra:52.3% inter:70.8%
[libx264 @ 00000211314d7340] coded y,uvDC,uvAC intra: 67.9% 80.2% 34.6% inter: 11.8% 15.8% 0.8%
[libx264 @ 00000211314d7340] i16 v,h,dc,p: 19% 28% 10% 44%
[libx264 @ 00000211314d7340] i8 v,h,dc,ddl,ddr,vr,hd,vl,hu: 20% 19% 14%  5%  9%  9%  8%  7%  8%
[libx264 @ 00000211314d7340] i4 v,h,dc,ddl,ddr,vr,hd,vl,hu: 20% 13% 10%  9%  9% 10%  7% 14%  7%
[libx264 @ 00000211314d7340] i8c dc,h,v,p: 46% 23% 20% 11%
[libx264 @ 00000211314d7340] Weighted P-Frames: Y:0.0% UV:0.0%
[libx264 @ 00000211314d7340] ref P L0: 71.2% 14.7% 13.0%  1.1%
[libx264 @ 00000211314d7340] ref B L0: 96.7%  3.1%  0.2%
[libx264 @ 00000211314d7340] ref B L1: 99.3%  0.7%
[libx264 @ 00000211314d7340] kb/s:1930.46

使用 MediaInfo 查看生成文件相关信息,可以看到截取的视频长度为 3s 81ms,且包含 1 路视频流及 1 路音频流,帧率为25 帧。视频编码格式为 AVC,音频编码格式为 MP3。
在这里插入图片描述

2)禁止输出视频

下面命令的功能是将输入视频文件中的音频流提取出来,并保存为 FLV 格式的文件。通过使用 -vn 选项,该命令禁用了视频流的处理,只保留音频流。这可以用于提取音频轨道,或者将视频文件转换为只包含音频的文件。

ffmpeg -i SampleVideo_1280x720_20mb.mp4 -vn -f flv -y SampleVideo-testflv.flv

使用 MediaInfo 对其进行分析,可以看到只有一路音频流:
在这里插入图片描述

3)指定视频的纵横比

下面命令的功能是从输入视频文件中截取前 75 帧,并将截取后的视频调整为 640x480 的分辨率,同时设置显示比例为 4:3。然后将截取和调整后的视频保存为 FLV 格式的文件。

ffmpeg -i SampleVideo_1280x720_20mb.mp4 -vframes 75 -s 640*480 -aspect "4:3" -f flv -y SampleVideo-testflv.flv

使用 MediaInfo 对其进行分析,可以看到视频的横纵比为4:3
在这里插入图片描述

3、音频选项

①、主要命令选项

  • -aframes number (output):设置 number 音频帧输出,是 -frames:a 的别名。
  • -ar[:stream_specifier] freq (input/output,per-stream):设置音频采样率。默认是输出同于输入。对于输入进行设置,仅仅通道是真实的设备或者 raw 数据分离出并映射的通道才有效。对于输出则可以强制设置音频量化的采用率。
  • -aq q (output):设置音频品质(编码指定为 VBR),它是 -q:a 的别名。
    • quality settings (VBR)
      • -aq 4 = 128 kb/s
      • -aq 5 = 160 kb/s
      • -aq 6 = 192 kb/s
      • -aq 7 = 224 kb/s
      • -aq 8 = 256 kb/s
  • -ac[:stream_specifier] channels (input/output,per-stream):设置音频通道数。默认输出会有输入相同的音频通道。对于输入进行设置,仅仅通道是真实的设备或者 raw 数据分离出并映射的通道才有效。
  • -an (output):禁止输出音频。
  • -acode codec (input/output):设置音频解码/编码的编/解码器,是 -codec:a 的别名。

②、举例

下面命令的功能是从输入视频文件中提取音频流,并截取前 180 帧音频。然后使用 libmp3lame 编码器将截取的音频压缩为 MP3 格式。输出音频是立体声,采样率为 48000Hz。最后,将处理后的音频保存为 FLV 格式的文件。

ffmpeg -i SampleVideo_1280x720_20mb.mp4 -vn -aframes 180 -acodec libmp3lame -ac 2 -ar 48000 -y SampleVideo-testflv.flv

使用 MediaInfo 对其进行分析:
在这里插入图片描述

4、字幕选项

字幕格式包括:srtassssa,…

①、主要命令选项

  • -scodec codec(input/output):设置字幕解码器,是 -codec:s 的别名。
  • -sn (output):禁止输出字幕。

②、举例

1)将字幕加入视频中

新建一个 test.srt 文件,文件格式为 UTF-8,将下面内容复制进去,并进行保存

1
00:00:00,009 --> 00:00:03,490
这是一个字幕测试案例

2
00:00:05,619 --> 00:00:07,420
我们将从这个例子中

3
00:00:09,549--> 00:00:12,170
学会如何向视频中添加字幕

下面命令的功能是将输入视频文件与指定的字幕文件进行合并,生成一个包含字幕的新视频文件。通过使用 -vf subtitles=test.srt 选项,该命令将输入视频的图像流与字幕文件中的文字内容进行合成,生成一个带有字幕的输出视频文件 “test.mp4”。

ffmpeg -i SampleVideo_1280x720_20mb.mp4 -vf subtitles=test.srt -y test.mp4

使用 MediaInfo 对其进行分析,这里只有音频流和视频流,无字幕流
在这里插入图片描述
注意:这里没有字幕流的原因是我们使用的是 -vf 视频过滤器,因此将字幕直接打到视频流里面了

打开 test.mp4 文件我们可以看到字幕:
在这里插入图片描述

2)字幕格式转换

MP4 支持的字幕格式主要有两种常见的格式:SRT(SubRip Subtitle)和VTT(WebVTT Subtitle)

MKV(Matroska Video)是一种开放的多媒体容器格式,支持多种字幕格式,其中包括:SRT(SubRip Subtitle)、VobSub(.sub/.idx)、SSA/ASS(SubStation Alpha)、PGS(Presentation Graphic Stream)等。

srt 格式字幕转换成 ass 格式命令:

ffmpeg -i test.srt test.ass

回显信息:

PS D:\Work\test> ffmpeg -i test.srt test.ass
ffmpeg version 6.0-essentials_build-www.gyan.dev Copyright (c) 2000-2023 the FFmpeg developers
  built with gcc 12.2.0 (Rev10, Built by MSYS2 project)
  configuration: --enable-gpl --enable-version3 --enable-static --disable-w32threads --disable-autodetect --enable-fontconfig --enable-iconv --enable-gnutls --enable-libxml2 --enable-gmp --enable-bzlib --enable-lzma --enable-zlib --enable-libsrt --enable-libssh --enable-libzmq --enable-avisynth --enable-sdl2 --enable-libwebp --enable-libx264 --enable-libx265 --enable-libxvid --enable-libaom --enable-libopenjpeg --enable-libvpx --enable-mediafoundation --enable-libass --enable-libfreetype --enable-libfribidi --enable-libvidstab --enable-libvmaf --enable-libzimg --enable-amf --enable-cuda-llvm --enable-cuvid --enable-ffnvcodec --enable-nvdec --enable-nvenc --enable-d3d11va --enable-dxva2 --enable-libvpl --enable-libgme --enable-libopenmpt --enable-libopencore-amrwb --enable-libmp3lame --enable-libtheora --enable-libvo-amrwbenc --enable-libgsm --enable-libopencore-amrnb --enable-libopus --enable-libspeex --enable-libvorbis --enable-librubberband
  libavutil      58.  2.100 / 58.  2.100
  libavcodec     60.  3.100 / 60.  3.100
  libavformat    60.  3.100 / 60.  3.100
  libavdevice    60.  1.100 / 60.  1.100
  libavfilter     9.  3.100 /  9.  3.100
  libswscale      7.  1.100 /  7.  1.100
  libswresample   4. 10.100 /  4. 10.100
  libpostproc    57.  1.100 / 57.  1.100
Input #0, srt, from 'test.srt':
  Duration: N/A, bitrate: N/A
  Stream #0:0: Subtitle: subrip
Output #0, ass, to 'test.ass':
  Metadata:
    encoder         : Lavf60.3.100
  Stream #0:0: Subtitle: ass
    Metadata:
      encoder         : Lavc60.3.100 ssa
Stream mapping:
  Stream #0:0 -> #0:0 (subrip (srt) -> ass (ssa))
Press [q] to stop, [?] for help
size=       1kB time=00:00:09.55 bitrate=   0.7kbits/s speed=6.23e+03x
video:0kB audio:0kB subtitle:0kB other streams:0kB global headers:1kB muxing overhead: 450.980377%

生成的 test.ass 文件内容如下:

[Script Info]
; Script generated by FFmpeg/Lavc60.3.100
ScriptType: v4.00+
PlayResX: 384
PlayResY: 288
ScaledBorderAndShadow: yes
YCbCr Matrix: None

[V4+ Styles]
Format: Name, Fontname, Fontsize, PrimaryColour, SecondaryColour, OutlineColour, BackColour, Bold, Italic, Underline, StrikeOut, ScaleX, ScaleY, Spacing, Angle, BorderStyle, Outline, Shadow, Alignment, MarginL, MarginR, MarginV, Encoding
Style: Default,Arial,16,&Hffffff,&Hffffff,&H0,&H0,0,0,0,0,100,100,0,0,1,1,0,2,10,10,10,1

[Events]
Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text
Dialogue: 0,0:00:00.01,0:00:03.49,Default,,0,0,0,,这是一个字幕测试案例
Dialogue: 0,0:00:05.62,0:00:07.42,Default,,0,0,0,,我们将从这个例子中
Dialogue: 0,0:00:09.55,0:00:12.17,Default,,0,0,0,,学会如何向视频中添加字幕

下面命令使用 FFmpeg 工具进行视频转码和字幕添加的操作。

ffmpeg -i SampleVideo_1280x720_20mb.mp4 -i test.ass -c copy -y SampleVideo-testmvk.mkv

使用 MediaInfo 对其进行分析,这里有三路流:音频流、视频流和字幕流
在这里插入图片描述

3)提取字幕

下面命令式将输入文件 “SampleVideo-testmvk.mkv” 中的音频和视频流去掉,然后将子标题提取出来,保存为 SRT 格式的 “output-sub1.srt” 文件。

ffmpeg -i SampleVideo-testmvk.mkv -an -vn -scodec srt output-sub1.srt

提取后的信息用 notepad++ 查看:
在这里插入图片描述

下面这个命令的主要功能是从 “output1002.mkv” 文件中提取字幕信息,并将这些信息保存为 ASS 格式的字幕文件 “output-sub1.ass”

ffmpeg -i SampleVideo-testmvk.mkv -an -vn -scodec ass -y output-sub1.ass

提取后的信息用 notepad++ 查看:
在这里插入图片描述
下面这个命令的主要目的是将 “SampleVideo_1280x720_20mb.mp4” 视频文件和 “test.ass” 字幕文件合并。它将保持音频流的原始格式,并指定视频流编码格式为 libx264,并将字幕直接添加到视频中,然后将结果保存为 “output1002.mkv” 文件

ffmpeg -i SampleVideo_1280x720_20mb.mp4 -i test.ass -c copy -c:v libx264 -y output1002.mkv

使用 MediaInfo 对其进行分析,这里有三路流:音频流、视频流和字幕流,并且视频流的格式为 AVC
在这里插入图片描述

三、FFmpeg 命令示例

上面已经对相关的 FFmepg 选项进行了详细的讲解及演示,下面仅做个总结但不进行演示了

1、转换格式(封装格式的转化)

①、下面命令将从 input_test.mp4 中提取音频流,并将其直接复制到 output_test.flv 中,而不进行任何重新编码。这可以用来分离音频流或将音频从一个容器格式转换为另一个容器格式,而无需对音频进行重新编码。

ffmpeg -i input_test.mp4 -vn -acodec copy output_test.flv

②、下面命令将从 input_test.aac 中提取音频流,并将其直接复制到 output_test.mp3 中,而不进行任何重新编码。这可以用来将 AAC 格式的音频转换为 MP3 格式,而无需对音频进行重新编码。请注意,如果输入文件的音频编码不支持 MP3 格式,或者输出文件的扩展名不适用于 MP3 格式,那么该命令可能会失败

ffmpeg -i input_test.aac -vn -acodec copy output_test.mp3

2、抽取画面中的音频

①、下面命令将从 input_test.mp4 中提取音频流,并将其直接复制到 output_test.aac 中,而不进行任何重新编码。

ffmpeg -i input_test.mp4 -vn -y -acodec copy output_test.aac

②、下面命令将从 input_test.mp4 中提取音频流,并将其直接复制到 output_test.mp3 中,而不进行任何重新编码。请注意,如果输入文件的音频编码不支持 MP3 格式,或者输出文件的扩展名不适用于 MP3 格式,那么该命令可能会失败

ffmpeg -i input_test.mp4 -vn -y -acodec copy output_test.mp3

③、audio:aac —> mp3(想从 mp4 文件中提取音频并输出为 mp3 格式可以参考以下步骤)
下面命令的作用是将输入文件 input_test.mp4 进行转码,并将其视频流直接复制到输出文件 output_test.flv 中,而音频流将使用 libmp3lame 编码器进行重新编码为 MP3 格式。

ffmpeg -i input_test.mp4 -vcodec copy -acodec libmp3lame -y output_test.flv

该命令从 output_test.flv 中提取音频流,并将其直接复制到 output_test.mp3 中,而不进行任何重新编码。

ffmpeg -i output_test.flv -vn -acodec copy -y output_test.mp3

因此可总结如下:

  • 输出 mp3 格式的音频文件必须输入文件是 mp3 编码的音频流
  • 输出 aac 格式的音频文件必须输入文件是 aac 编码的音频流

3、抽取画面中的视频

该命令将从 input_test.mp4 中提取视频流,并将其直接复制到 output_test.avi 中,而不进行任何重新编码。

ffmpeg -i input_test.mp4 -vcodec copy -an output_test.avi

4、音频+视频合成

下面命令将合并 input_test_1.mp4 和 input_test_2.mp3 两个输入文件,将视频流和音频流直接复制到输出文件 output_test.mp4 中,而不进行任何重新编码。

ffmpeg -i input_test_1.mp4 -i input_test_2.mp3 -vcodec copy -acodec copy output_test.mp4

下面命令将输入的视频文件 input_test_1.mp4 和音频文件 input_test_2.mp3 进行处理,并将它们合并成一个单独的 MP4 文件 output_test.mp4。视频流和音频流都会被直接复制到输出文件中,而不会进行重新编码。在输出文件中,第一个输入文件的视频将在 10 秒后开始播放或处理。

ffmpeg -i input_test_1.mp4 -itsoffset 10 -i input_test_2.mp3 -vcodec copy -acodec copy output_test.mp4

下面命令将输入的视频文件 input_test_1.mp4 的第 20 秒开始的 5 秒内容与音频文件 input_test_2.aac 进行处理,并将它们合并成一个单独的 MP4 文件 output_test.mp4。视频流和音频流都会被直接复制到输出文件中,而不会进行重新编码。输出文件中只包含输入文件指定的时间范围内的内容。

ffmpeg -ss 20 -t 5 -i input_test_1.mp4 -i input_test_2.aac -vcodec copy -acodec copy output_test.mp4

5、音频+音频合成

下面命令将输入的两个音频文件 input_test_1.mp3 和 input_test_2.mp3 进行混音处理,并将它们合并成一个单独的 MP3 文件 output_test.mp3。输出文件的音频时长将与两个输入文件中最短的音频时长相匹配,通过使用 amix 过滤器来实现混音操作。

ffmpeg -i input_test_1.mp3 -i input_test_2.mp3 -filter_complex amix=inputs=2:duration=shortest output_test.mp3
  • -filter_complex amix=inputs=2:duration=shortest:这个选项用于指定复杂的音频过滤器图表。在这个例子中,使用了 amix 过滤器,它将两个输入的音频混合为一个输出。inputs=2 表示有两个输入,duration=shortest 表示输出的音频时长将与最短输入的时长相匹配。

下面命令将输入的两个音频文件 input_test_1.mp3 和 input_test_2.mp3 进行混音处理,并将它们合并成一个单独的 MP3 文件 output_test.mp3。输出文件的音频时长将与两个输入文件中最长的音频时长相匹配,通过使用 amix 过滤器来实现混音操作。

ffmpeg -i input_test_1.mp3 -i input_test_2.mp3 -filter_complex amix=inputs=2:duration=longest output_test.mp3

下面命令将输入的两个音频文件 input_test_1.mp3 和 input_test_2.mp3 进行复制处理,并将它们合并成一个单独的 MP3 文件 output_test.mp3。输出文件的音频编码格式和质量与输入文件完全相同,因为使用了 -acodec copy 选项来进行直接复制。由于输入是音频文件,所以 -vcodec copy 选项实际上没有影响。

ffmpeg -i input_test_1.mp3 -i input_test_2.mp3 -vcodec copy -acodec copy output_test.mp3

下面命令将输入的三个音频文件(INPUT1、INPUT2 和 INPUT3)进行混音处理,并将它们合并成一个单独的输出文件。输出文件的音频时长将与第一个输入文件的时长相匹配,通过使用 amix 过滤器来实现混音操作。在混音转换时,过渡时间为 3 秒。

ffmpeg -i INPUT1 -i INPUT2 -i INPUT3 -filter_complex amix=inputs=3:duration=first:dropout_transition=3 OUTPUT
  • -filter_complex amix=inputs=3:duration=first:dropout_transition=3:这个选项用于指定复杂的音频过滤器图表。在这个例子中,使用了 amix 过滤器,它将三个输入的音频混合为一个输出。inputs=3 表示有三个输入,duration=first 表示输出的音频时长将与第一个输入的时长相匹配。dropout_transition=3 表示在混音转换时的过渡时间为 3 秒。

6、视频分离成图片

下面命令从输入的视频文件 input_test.mp4 中提取帧,并以每秒一帧的速率保存为 JPEG 图像文件。输出的图像文件将以 output_image-001.jpeg、output_image-002.jpeg 等命名,表示提取的帧的顺序。

ffmpeg -i input_test.mp4 -r 1 -f image2 output_image-%03d.jpeg

7、图片合成视频

下面命令将一系列图像文件(例如 output_image-001.jpeg、output_image-002.jpeg 等)作为输入,使用 FFmpeg 工具将它们合并为一个视频文件 output_test.mp4。输入的图像文件按照帧的顺序进行读取,并转换为视频格式进行合并。输出文件的格式是 MP4。

ffmpeg -f image2 -i output_image-%03d.jpeg output_test.mp4

8、改变音量大小

下面命令将输入的音频文件 input_test.mp3 进行音量调整处理,将音量调整为原来的一半,并生成一个输出的 MP3 文件 output_test.mp3。这里使用了 -af 选项来指定音频过滤器,并设置了 volume 过滤器来实现音量调整。

ffmpeg -i input_test.mp3 -af 'volume=0.5' output_test.mp3

9、音效淡入淡出效果

下面命令将输入的音频文件 input_test.mp3 应用渐入效果处理,从音频的起始位置开始,在 4 秒的时间内逐渐增加音量,并生成一个输出的 MP3 文件 output_test.mp3。渐入效果由 -filter_complex 选项指定的 afade 过滤器实现。

ffmpeg -i input_test.mp3 -filter_complex afade=t=in:ss=0:d=4 output_test.mp3
  • -filter_complex afade=t=in:ss=0:d=4:这个选项用于指定复杂的音频过滤器图表。在这个例子中,使用了 afade 过滤器来实现渐入效果。t=in 表示渐入效果,ss=0 表示从音频的起始位置开始应用渐入,d=4 表示渐入的持续时间为 4 秒。

10、截取音频

下面命令从输入的音频文件 input_test.mp3 中剪切出从第 10 秒到第 20 秒的部分,并生成一个输出的 MP3 文件 output_test.mp3。剪切操作由 -ss 和 -to 选项指定的时间范围来控制。通过使用 -vn 选项,视频流被忽略,只处理音频流。使用 -acodec copy 选项可以直接复制输入音频的编码格式,而不进行重新编码。

ffmpeg -ss 10 -i input_test.mp3 -to 20 -vn -acodec copy output_test.mp3

11、容器时长获取

下面命令使用 FFprobe 工具对输入的音频文件 input_test.mp3 进行分析,仅输出该文件的持续时间(时长)。输出的持续时间以秒为单位。通过设置 -v error 选项,只输出错误信息,并使用 -of 选项设置输出格式。

ffprobe -v error -show_entries format=duration -of default=noprint_wrappers=1:nokey=1 -i
input_test.mp3
  • -v error:这个选项用于设置错误日志的输出级别为错误级别。-v error 表示只输出错误信息,不输出其他信息。
  • -show_entries format=duration:这个选项用于指定要显示的信息条目。在这个例子中,使用 format=duration 表示要显示输入文件的持续时间。
  • -of default=noprint_wrappers=1:nokey=1:这个选项用于设置输出格式。-of default 表示使用默认输出格式,noprint_wrappers=1 表示不打印包装器,nokey=1 表示不打印键名,只输出值。

12、网络资源下载

下面命令使用 FFmpeg 工具从指定的 URL 下载音频文件,并将其保存为 MP3 格式的输出文件 output_test.mp3。通过使用 -c copy选项,输入文件的编码格式将直接复制到输出文件中,而不进行重新编码。使用 -f mp3 选项指定输出文件的格式为 MP3。请注意,https://xxx.xxx.xxxxxx应替换为实际的音频文件的网络地址。

ffmpeg -i https://xxx.xxx.xxxxxx -c copy -f mp3 output_test.mp3

13、播放音频视频

播放 input_test.mp3 文件

ffplay input_test.mp3

14、图片生成 gif 动图

下面命令将一系列图像文件(例如 input_image_001.png、input_image_002.png 等)作为输入,使用 FFmpeg 工具将它们转换为一个 GIF 动画文件 output_test.gif。输入的图像文件按照帧的顺序进行读取,并根据指定的帧率生成 GIF 动画。输出文件的格式是 GIF。

ffmpeg -i input_image_%03d.png -r 5 output_test.gif
  • -ar 44100:这个选项用于指定输出音频的采样率。在这个例子中,-ar 44100 表示输出音频的采样率为 44100 Hz。
  • -ac 2:这个选项用于指定输出音频的通道数。在这个例子中,-ac 2 表示输出音频的通道数为 2,即立体声。
  • -f s16le:这个选项用于指定输出音频的格式。-f s16le 表示输出音频以 16 位有符号整数的 PCM 格式进行保存。

15、抽取 PCM 数据

下面命令从输入的视频文件 input_test.mp4 中提取音频,并将其保存为 PCM 格式的音频文件 output_test.pcm。通过使用 -vn 选项,视频流被忽略,只处理音频流。使用 -ar 选项指定输出音频的采样率,-ac 选项指定输出音频的通道数,-f 选项指定输出音频的格式为 16 位有符号整数的 PCM。

ffmpeg -i input_test.mp4 -vn -ar 44100 -ac 2 -f s16le output_test.pcm

下面命令使用 ffplay 命令行工具播放 PCM 格式的音频文件 output_test.pcm。通过设置 -ar 选项,指定音频的采样率为 44100 Hz,-ac 选项指定音频的通道数为 2(立体声),-f 选项指定输入音频的格式为 16 位有符号整数的 PCM。

ffplay -ar 44100 -ac 2 -f s16le output_test.pcm

我的qq:2442391036,欢迎交流!


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/170131.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于混沌博弈算法优化概率神经网络PNN的分类预测 - 附代码

基于混沌博弈算法优化概率神经网络PNN的分类预测 - 附代码 文章目录 基于混沌博弈算法优化概率神经网络PNN的分类预测 - 附代码1.PNN网络概述2.变压器故障诊街系统相关背景2.1 模型建立 3.基于混沌博弈优化的PNN网络5.测试结果6.参考文献7.Matlab代码 摘要:针对PNN神…

二分查找——34. 在排序数组中查找元素的第一个和最后一个位置

文章目录 1. 题目2. 算法原理2.1 暴力解法2.2 二分查找左端点查找右端点查找 3. 代码实现4. 二分模板 1. 题目 题目链接:34. 在排序数组中查找元素的第一个和最后一个位置 - 力扣(LeetCode) 给你一个按照非递减顺序排列的整数数组 nums&#…

python实战—核心基础2(数字大小写转换) lv1

目录 一、核心代码解释 二、代码 三、运行截图 一、核心代码解释 1、range函数 函数语法:range(start, stop[, step]) 参数说明: start: 计数从 start 开始。默认是从 0 开始。例如range(5)等价于range(0&#x…

11.15 监控目录文件变化

监视对指定目录的更改,并将有关更改的信息打印到控制台,该功能的实现不仅可以在内核层,在应用层同样可以。程序中使用ReadDirectoryChangesW函数来监视目录中的更改,并使用FILE_NOTIFY_INFORMATION结构来获取有关更改的信息。 Re…

【Java】线程状态

1、线程状态 初始-NEW: Thread : 对象已经创建,但start 方法还没调用. 终止-TERMINATED: Thread 对象还在,内核中的线程已经没了 运行-RUNNABLE: 就绪状态(线程已经在 cpu 上执行了/线程正在排队等待上 cpu 执行) 超时等待-TIMED WAITING: 阻塞.由于 sleep 这种固定…

从暗黑3D火炬之光技能系统说到-Laya非入门教学一~资源管理

我不知道那些喷Laya没有浏览器,嘲笑别人编辑器做不好,是什么水平? 首先目前国内除了WPS和飞书,就没有第三家公司能把编辑器做好。 要是一般的游戏开发者,如我,有一点点引擎代码(某项目&#x…

时间序列预测实战(十七)PyTorch实现LSTM-GRU模型长期预测并可视化结果(附代码+数据集+详细讲解)

一、本文介绍 本文给大家带来的实战内容是利用PyTorch实现LSTM-GRU模型,LSTM和GRU都分别是RNN中最常用Cell之一,也都是时间序列预测中最常见的结构单元之一,本文的内容将会从实战的角度带你分析LSTM和GRU的机制和效果,同时如果你…

铝合金钻孔铣削去毛刺加工之高速电主轴解决方案

铝合金是一种轻质、高强度的材料,其出色的机械性能和良好的导电性、导热性使其在工业领域广受青睐特别是在航空、航天和汽车制造中,铝合金的身影更是随处可见。在铝合金加工过程中,高速电主轴可精准而高效地完成钻孔、铣削和去毛刺等任务&…

贪吃蛇游戏制作

首先在ecilsp里面创建两个包,启动和图形界面 在创建一个文件夹用来放图片 1.绘制图形界面 package com.snaketuxing.view;import java.awt.Color; import java.awt.EventQueue; import java.awt.Font; import java.awt.Frame; import java.awt.Graphics; import …

go语言的某些开发素质真低,完全就是缺教养。

我本人在github提过一个错误处理的提案,2023年11月20日微信公众号“脑子进煎鱼了” 记录了这个提案,在评论区有个微信名为:【hello哥已开始躺平】的微信用户一来就喷粪,这种人到底是欠打呢还是心理变态呢?对别人的提案…

docker更换国内源

docker更换国内源 1、编辑Docker配置文件 在终端中执行以下命令,编辑Docker配置文件: vi /etc/docker/daemon.json2、添加更新源 在打开的配置文件中,添加以下内容: {"registry-mirrors": ["https://hub-mirror…

yum 搭建仓库 http/ftp

目录 http ftp http 服务端 1. 下载 httpd 服务,记得将防火墙和安全终端全部关掉 2. 开启 httpd 服务 3. 临时挂载 客户端 1. 下载 httpd 服务,记得将防火墙和安全终端全部关掉 2. 开启 httpd 服务 3. 进入 /etc/yum.repos.d 4. 新建一个目录 mhy&…

【洛谷 P3743】kotori的设备 题解(二分答案+循环)

kotori的设备 题目背景 kotori 有 n n n 个可同时使用的设备。 题目描述 第 i i i 个设备每秒消耗 a i a_i ai​ 个单位能量。能量的使用是连续的,也就是说能量不是某时刻突然消耗的,而是匀速消耗。也就是说,对于任意实数,…

Vue3 源码解读系列(九)——依赖注入

依赖注入 依赖注入用于祖先组件向后代组件传递数据。 特点: 祖先组件不需要知道哪些后代组件在使用它提供的数据。 后代组件也不需要知道注入的数据来自哪里。 /*** provide 的实现*/ function provide(key, value) {let provides currentInstance.provides // 当…

【Linux】软连接和硬链接:创建、管理和解除链接的操作

文章目录 1. 软链接和硬链接简介2. Linux软链接使用方法3. Linux硬链接使用方法4. 总结 1. 软链接和硬链接简介 什么是软链接 软链接(Symbolic Link),也称为符号链接,是包含了源文件位置信息的特殊文件。它的作用是间接指向一个文件或目录。如果软链接的源文件被删除或移动了,软…

【论文阅读笔记】Deep learning for time series classification: a review

【论文阅读笔记】Deep learning for time series classification: a review 摘要 在这篇文章中,作者通过对TSC的最新DNN架构进行实证研究,探讨了深度学习算法在TSC中的当前最新性能。文章提供了对DNNs在TSC的统一分类体系下在各种时间序列领域中的最成功…

智慧化工园区信息化整体解决方案:PPT全53页,附下载

关键词:智慧化工园区建设方案,智慧化工园区建设规范,智慧化工园区建设指南 一、售智慧化工园区建设背景 随着工业化、信息化和数字化进程的加速,化工园区面临着越来越多的挑战,如安全生产、环境保护、能源消耗等问题…

[架构之路-247]:目标系统 - 设计方法 - 软件工程 - 结构化方法的基本思想、本质、特点以及在软件开发、在生活中的应用

目录 前言: 一、什么是非结构化方法 1.1 什么是非结构化方法 1.2 非结构化方法的适用场合 二、什么是结构化方法 1.1 结构化方法诞生的背景:软件规模发展:大规模、复杂系统的需要 1.2 概述 1.3 主要特点与核心思想 三、结构化方法在…

【C#二开业务冠邑】通过界面查看数据来源

前言 重构框架(CS【C#】转BS【Java】)时,突然发现公司的代码和数据库,有部分都没有写注释,嘎嘎,这不非常影响开发效率,于是乎,开始帮公司整理表结构和数据来源,也从而加…

ISP--Black Level Correction(黑电平矫正)

图像的每一个像素点都是由一个光电二极管控制的,由二极管将电信号,转换为数字信号。 那么,我们知道了,图像的像素值是与电信号强度相关的。但是,我们得知道,每一个光电二极管要想工作,都得有一定…