FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频(快速体验)。
开源地址:https://github.com/alibaba-damo-academy/FunClip.git
功能:
-
开源与本地部署:FunClip是一个完全开源的工具,可以在本地一键运行,无需联网即可使用。
-
语音识别模型:该工具基于阿里巴巴通义实验室开源的FunASR高准确率语音识别模型,使用户能够通过语音识别来剪辑视频。
-
一键运行:文章提供了一个AI启动器,允许用户一键运行上百个开源项目,包括FunClip。
功能特性:
- 集成了Paraformer-Large模型,这是一个识别效果优秀的开源中文ASR模型。
- 提供了热词定制化功能,可以指定实体词、人名等作为热词,以提升识别效果。
- 集成了CAM++说话人识别模型,允许用户根据说话人ID裁剪视频段落。
- 通过Gradio交互实现功能,支持在服务端搭建服务,并通过浏览器使用。
- 支持多段自由剪辑,自动生成全视频和目标段落的SRT字幕文件。
- 字幕生成:如果用户希望使用自动生成字幕的视频裁剪功能,需要安装imagemagick。