pyvideotrans —— 视频翻译和配音工具
这是一个视频翻译工具,可将一种语言的视频翻译为另一种语言和配音的视频。 语音识别基于 openai-whisper
离线模型、文字翻译使用google|baidu|chatGPT
翻译接口,文字合成语音使用 Microsoft Edge tts
。
使用预编译版本方法
-
只可用于 win10 win11 系统 (编译版非最新,建议源码部署)
-
从 release 中下载最新版,解压,双击 sp.exe
-
原始视频目录:选择mp4视频;
-
输出视频目录:如果不选择,则默认生成在同目录下的
_video_out
-
选择翻译:可选google、百度、chatGPT,后两者需要点击“设置翻译key”,设置相应信息
-
网络代理地址:如果你所在地区无法直接访问 google,需要在软件界面 网络代理 中设置代理,比如若使用 v2ray ,则填写
http://127.0.0.1:10809
,若clash,则填写http://127.0.0.1:7890
. 如果你修改了默认端口或使用的其他代理软件,则按需填写 -
视频原始语言:选择待翻译视频里的语言种类
-
翻译目标语言:选择希望翻译到的语言种类
-
选择配音:选择翻译目标语言后,可从配音选项中,选择配音角色;
硬字幕: 是指始终显示字幕,不可隐藏,如果希望网页中播放时也有字幕,请选择硬字幕嵌入
软字幕: 如果播放器支持字幕管理,可显示或者隐藏字幕,该方式网页中播放时不会显示字幕,某些国产播放器可能不支持,需要将生成的视频同名srt文件和视频放在一个目录下才会显示
不能“既不嵌入字幕又不选择配音角色”
-
文字识别模型: 选择 base/small/medium/large, 识别效果越来越好,但识别速度越来越慢,第一次将需要下载模型,默认 base,可以预先单独下载模型后,放到
当前软件目录/models
目录下.模型单独下载地址
-
配音语速:填写 -90到+90 之间的数字,同样一句话在不同语言语音下,所需时间是不同的,因此配音后可能声画字幕不同步,可以调整此处语速,负数代表降速,正数代表加速播放。
-
自动加速: 如果翻译后的语音时长大于原时长,并且这里确认选中,那么将强制加速播放该片段,以缩小时长
-
静音片段: 填写100到2000的数字,代表毫秒,默认 500,即以大于等于 500ms 的静音片段为区间分割语音
-
点击 开始按钮 底部会显示当前进度和日志,右侧文本框内显示字幕
原始视频统一使用mp4格式,处理速度快,网络兼容性好
采用软合成字幕:字幕作为单独文件嵌入视频,可再次提取出,如果播放器支持,可在播放器字幕管理中启用或禁用字幕;
默认会在 原始视频目录 下生成同名的字幕文件 视频名.srt
对于无法识别的语音将直接复制原语音

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
每日一博 | 视觉 BEV 基本原理和方案解析
BEV(Bird’s-Eye-View)是一种鸟瞰视图的传感器数据表示方法,它的相关技术在自动驾驶领域已经成了“标配”,纷纷在新能源汽车、芯片设计等行业相继量产落地。BEV同样在高德多个业务场景使用,例如:高精地图地面要素识别、车道线拓扑构建、车端融合定位中都扮演了重要角色。如图1‑1所示: 图1‑1 BEV在高德应用场景(仅列举部分)a)高精底图 b)地面要素识别 c)车道线拓扑构建[1] d)车端融合定位(BEV特征和底图匹配)[2] 本文分享的内容主要包括两个部分:视觉BEV基本原理、方案解析。 1.BEV基础 1.1.引言 如图1‑2所示,BEV具有如下优势: 1) BEV视图尺度变化小。在PV空间(即透视图,类似通常行车记录仪所采集的车辆前视图)中,物体近大远小,物体的大小和类别、远近都有关,而在BEV空间中,物体的大小只和类别有关; 2) BEV空间是决策友好空间。BEV空间更接近3D真实空间的平面空间,而PV空间是真实物理世界在透视投影下的视图,以图1‑2的车道线举例,在真实世界中平行的两条车道线,在BEV空间下还是平行的,在PV空间却是相交的。相比之下,BEV空间下的信...
- 下一篇
Unity 6 将于 2024 年发布,下一个 LTS 版本
Unity 公司在今天举办的 Unite 2023 上宣布,2024 年将发布重大版本更新Unity 6,并表示其为下一个长期支持版本 (LTS)。 Unity 在大会上演示了全新的 Unity 6 引擎,并通过 Syncy Studios 采用 Unity 6 制作的《幻想王国(Fantasy Kingdom)》Demo 进行了演示,强调 Unity 6 的性能与画面改进。 Unity 公司称 Unity 6 将带来显著的性能增强、提升创建多人游戏的速度,以及对 XR 设备更深入的支持。此外还解锁了新渲染功能的支持,实现了更高水平的图形保真度。 以惊人的性能提供先进的视觉效果 加速多人游戏的创建和规模化 利用 AI 工具探索新的创意可能性 通过下一代移动功能和创新的 VR 设备支持让玩家随时随地接触 Untiy提到的 AI 工具为 Sentis,允许开发者在Unity运行时导入AI模型,从而创建基于AI的 NPC。Sentis的独特之处在于 AI 模型最终在用户设备上本地运行,不需要开发者额外配置云服务器。 Unity 6 还将带来对全新 WebGPU 图形后端的初步支持。从 Uni...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS8安装Docker,最新的服务器搭配容器使用
- Hadoop3单机部署,实现最简伪集群
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8编译安装MySQL8.0.19