下载NVIDIA官网的培训视频,生成中文字幕和PPT

下载NVIDIA官网的培训视频,生成中文字幕和PPT

  • 一.[视频网站](https://www.nvidia.cn/on-demand/session/gtc24-s62129/)
  • 二.如何获取视频的原始链接
  • 三.下载视频的脚本【生成output.mp4】
  • 四.安装whisper环境【语音识别生成英文字幕】
  • 五.下载whisper模型
  • 六.生成英文字幕【输出merge.mp4】
  • 七.提取场景变化的帧保存成图片序列【场景变化率大于0.1的帧】
  • 八.图片序列转PPT

背景:想学习NVIDIA官网上的培训视频,但视频没有字幕,又希望能离线观看,以下的操作步骤
涉及到的功能:
1.m3u8视频的下载及转换
2.whisper的使用
3.ffmpeg字幕的使用

一.视频网站

二.如何获取视频的原始链接

在这里插入图片描述

三.下载视频的脚本【生成output.mp4】

#!/bin/bash

# 下载m3u8索引文件
wget https://vod.nvidia.cn/s/hls/p/2935771/sp/293577100/serveFlavor/entryId/1_kpe8g8f4/v/11/ev/8/flavorId/1_wo6zmhel/name/a.mp4/index.m3u8?__hdnea__=st=1718065127~exp=1718151527~acl=/s/hls/p/2935771/sp/293577100/serveFlavor/entryId/1_kpe8g8f4/v/11/ev/8/flavorId/1_*~hmac=5d616800c6cc5b3a48d8f11e2f7b7d2583f9fc419d3f463a6a287afc0caa1f7b -O index.m3u8

# 解析m3u8文件,下载所有的ts文件
for f in `cat index.m3u8 | grep "https"`
do
   name=`echo $f | sed -n 's/.*\(seg-[0-9]*-v[0-9]*-a[0-9]*\.ts\).*/\1/p'`
   echo $name
   wget $f -O $name   
done

# 替换m3u8中的文件名
sed  's/.*\(seg-[0-9]*-v[0-9]*-a[0-9]*\.ts\).*/\1/p' index.m3u8 > index_new.m3u8

# 安装ffmpeg
apt install ffmpeg -y

# 将m3u8转mp4
ffmpeg -i index_new.m3u8 -c:v libx264 -c:a aac output.mp4

四.安装whisper环境【语音识别生成英文字幕】

conda create -n whisper python=3.10
conda activate whisper
pip3 config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple/
pip3 install torch torchvision torchaudio -i https://pypi.tuna.tsinghua.edu.cn/simple
pip3 install git+https://github.com/openai/whisper.git

五.下载whisper模型

wget https://openaipublic.azureedge.net/main/whisper/models/81f7c96c852ee8fc832187b0132e569d6c3065a3252ed18e56effd0b6a73e524/large-v2.pt -O large-v2.pt

六.生成英文字幕【输出merge.mp4】

#提取音频
ffmpeg -i output.mp4 -vn  output.mp3
#生成字幕
whisper --model_dir ./ --model large-v2 --output_format srt --language English output.mp3
#合并字幕
ffmpeg -i output.mp4 -vf subtitles=output.srt merge.mp4

七.提取场景变化的帧保存成图片序列【场景变化率大于0.1的帧】

mkdir extracted_frames
ffmpeg -i merge.mp4 -vf "select='gt(scene,0.1)'" -vsync vfr extracted_frames/frame_%04d.png

八.图片序列转PPT

pip install python-pptx
tee im2ppt.py <<-'EOF'
from pptx import Presentation
from pptx.util import Inches
import os

def create_ppt_from_frames(folder_path, output_pptx):
    prs = Presentation()
    image_files = [f for f in os.listdir(folder_path) if f.endswith('.png')]    
    for image_file in sorted(image_files):
        slide = prs.slides.add_slide(prs.slide_layouts[0])  # 使用空白幻灯片布局
        img_path = os.path.join(folder_path, image_file)
        slide.shapes.add_picture(img_path, Inches(1), Inches(1), width=Inches(8), height=Inches(4.5))
    prs.save(output_pptx)
if __name__ == "__main__":
    folder_path = "extracted_frames"
    output_pptx = "output_presentation.pptx"
    create_ppt_from_frames(folder_path, output_pptx)	
EOF	
python im2ppt.py

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/708341.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

解决微调后的模型导入ollama后出现”胡言乱语“情况

解决微调后的模型导入ollama后出现”胡言乱语“情况 先说结论&#xff0c;出现该问题的原因主要是因为Modelfile文件没有配置好。 这个是ModelFile文件的配置&#xff0c;第一行的from为要用的模型地址。 # sets the temperature to 1 [higher is more creative, lower is mo…

陪诊小程序开发,陪诊师在线接单

近几年&#xff0c;陪诊师成为了一个新兴行业&#xff0c;在科技时代中&#xff0c;陪诊小程序作为互联网下的产物&#xff0c;为陪诊市场带来了更多的便利。 当下生活压力大&#xff0c;老龄化逐渐严重&#xff0c;年轻人很难做到陪同家属看病。此外&#xff0c;就诊中出现了…

Vue3项目中Pinia使用详解

开篇 本文的目的是创建一个使用typescript的vue3项目&#xff0c;并使用pinia来管理状态。 详细步骤 创建项目 创建vue3项目&#xff0c;并使用vite作为打包工具 npm create vitelatest vue3_pinia // 选择vue,随后选择typesript进入项目&#xff0c;并按照依赖包 cd vue3_…

植物大战僵尸(杂交版)最新版V2.1来袭!

【新手指导】最新版v2.1来袭 1.闪退怎么办&#xff1f; 答:窗口模式可以解决大部分问题。输入法转换成英文也可以。最后一种办法管理员运行&#xff0c;再后台可运行&#xff0c;即便不是窗口也不会闪退&#xff0c;亲测有效 2.哪里下载&#xff1f; 答&#xff1a;夸克网盘htt…

OrangePi AIpro测评:性能、应用与开发者体验解析

一、OrangePi AIpro介绍 OrangePi AIpro(8T)采用昇腾AI技术路线&#xff0c;具体为4核64位处理器AI处理器&#xff0c;集成图形处理器&#xff0c;支持8TOPS AI算力&#xff0c;拥有8GB/16GB LPDDR4X&#xff0c;可以外接32GB/64GB/128GB/256GB eMMC模块&#xff0c;支持双4K高…

学习ZYNQ——使用IP核

文章目录 [TOC](文章目录) 前言一、新建Vivado工程二、使用IP核1.加载IP2.查看IP核3.应用IP核 三、添加源文件1.led.v2.约束文件pin_led.xdc 四、综合、运行程序 前言 加载前面使用HLS生成的IP核&#xff0c;实现LED灯的闪烁&#xff0c;熟悉整套流程的步骤&#xff1a; 前一篇…

关于对pagination.js源代码进行修改且引入项目使用

实现效果 使用定时器对组件进行每秒请求&#xff0c;每过固定时间之后&#xff0c;进行下一页项目请求&#xff0c;进行到最后一页请求的时候返回第一页。 首先引入js插件 <script src"./js/pagination.js" type"text/javascript"></script>…

NAND flash测试-雷龙发展

文章目录 一、简介 二、速度测试 最近比较忙&#xff0c;也一直没空发什么文章&#xff0c;这算是新年第一篇吧&#xff0c;正好最近收到了一个雷龙的flash芯片&#xff0c;先拿来玩一下吧。 有兴趣的小伙伴可以去雷龙官网找小姐姐领取一个免费试用。 一、简介 大概样子就是上面…

大模型企业落地:汽车行业知识大模型应用

前言 在当今这个信息爆炸的时代&#xff0c;知识管理成为了企业提升核心竞争力的关键。特别是在汽车行业这样一个技术密集、信息量庞大的领域&#xff0c;如何高效管理和利用知识资源&#xff0c;成为了每个企业必须面对的挑战。 汽车行业的知识管理痛点 汽车行业作为现代工…

RCD负载箱:电力系统的安全保障

在电力系统中&#xff0c;负载箱是一种重要的设备&#xff0c;它的主要功能是模拟实际的电力负载&#xff0c;以便对电力系统进行各种性能测试和分析。RCD负载箱一种特殊类型的负载箱&#xff0c;它具有剩余电流保护功能&#xff0c;可以有效地防止电气火灾和电击事故的发生&am…

基于Spring Boot的智能分析平台

项目介绍&#xff1a; 智能分析平台实现了用户导入需要分析的原始数据集后&#xff0c;利用AI自动生成可视化图表和分析结论&#xff0c;改善了传统BI系统需要用户具备相关数据分析技能的问题。该项目使用到的技术是SSMSpring Boot、redis、rabbitMq、mysql等。在项目中&#…

工业 UI 风格,展现独特魅力

工业 UI 风格&#xff0c;展现独特魅力

Facebook:数字时代的文化交流平台

在当今信息爆炸的数字时代&#xff0c;Facebook已经成为了一个不可或缺的社交媒体平台&#xff0c;不仅在个人生活中起到了联系社交的作用&#xff0c;更在全球范围内促进了文化交流和理解。本文将深入探讨Facebook作为文化交流平台的重要性&#xff0c;并分析其在数字时代如何…

C++面向对象程序设计 - 命名空间

命名空间是ANSI C引入的可以由用户命名的作用域&#xff0c;用来处理程序中常见的同名冲突。 在C语言中定义了三个层次的作用域&#xff0c;即文件&#xff08;编译单元&#xff09;、函数和复合语句。C又引入了类作用域&#xff0c;类是出现在文件内的。在不同的作用域中可以定…

vue代办事件案例实战练习,配有答案解析

代办事件案例 该案例&#xff0c;综合了前面所学的知识&#xff0c;列入点击事件绑定&#xff0c;双向绑定&#xff0c;v-for循环语句&#xff0c;v-model双向绑定&#xff0c;以及input标签的不同type形式。 演示代码如下&#xff1a; <template > <div id"ku…

腾讯云对象存储不绑定自定义备案域名不给下载应该如何处理?

从2024年1月1日起&#xff0c;腾讯云对象存储&#xff08;COS&#xff09;将实施新政策&#xff1a;新创建的存储桶不再支持使用path-style域名&#xff08;即存储桶绝对路径&#xff09;。此外&#xff0c;使用默认域名访问的新存储桶将不再支持任意类型文件的预览&#xff0c…

刷题记录(240613)

aliyun0512 1. 小红定义一个数组是好数组&#xff0c;当且仅当所有奇数出现了奇数次&#xff0c;所有偶数出现了偶数次。现在小红拿到了一个数组&#xff0c;她希望取一个该数组的非空子序列(可以不连续)&#xff0c;使得子序列是好数组。你能帮小红求出子序列的方案数吗?由于…

C++面向对象:多态性

多态性 1.概念 多态性是面向对象的程序设计的一个重要特征。在面向对象的方法中一般是这样表述多态的&#xff1a;向不同的对象发送同一个信息&#xff0c;不同的对象在接收时会产生不同的行为。也就是说&#xff0c;每个对象用自己的方式去响应共同的消息。 2.典例 下面这…

MFC动态创建按钮

void CMFCApplication1Dlg::OnBnClickedOk() {for (int i 0; i < 100; i){for (int j 0; j < 100; j){CButton* pButton3 new CButton;pButton[i][j] pButton3;}}CRect rect;GetClientRect(&rect); // 获取对话框客户区的大小rect.top 10; // 设置按钮的位置rec…