pyvideotrans —— 视频翻译和配音工具-低调大师

pyvideotrans —— 视频翻译和配音工具

2023-11-17 682

这是一个视频翻译工具，可将一种语言的视频翻译为另一种语言和配音的视频。语音识别基于 openai-whisper 离线模型、文字翻译使用google|baidu|chatGPT翻译接口，文字合成语音使用 Microsoft Edge tts。

使用预编译版本方法

只可用于 win10 win11 系统 (编译版非最新，建议源码部署)
从 release 中下载最新版，解压，双击 sp.exe
原始视频目录：选择mp4视频；
输出视频目录：如果不选择，则默认生成在同目录下的 _video_out
选择翻译：可选google、百度、chatGPT，后两者需要点击“设置翻译key”，设置相应信息
网络代理地址：如果你所在地区无法直接访问 google，需要在软件界面网络代理中设置代理，比如若使用 v2ray ，则填写 http://127.0.0.1:10809,若clash，则填写 http://127.0.0.1:7890. 如果你修改了默认端口或使用的其他代理软件，则按需填写
视频原始语言：选择待翻译视频里的语言种类
翻译目标语言：选择希望翻译到的语言种类
选择配音：选择翻译目标语言后，可从配音选项中，选择配音角色；

硬字幕: 是指始终显示字幕，不可隐藏，如果希望网页中播放时也有字幕，请选择硬字幕嵌入

软字幕: 如果播放器支持字幕管理，可显示或者隐藏字幕，该方式网页中播放时不会显示字幕，某些国产播放器可能不支持,需要将生成的视频同名srt文件和视频放在一个目录下才会显示

不能“既不嵌入字幕又不选择配音角色”
文字识别模型: 选择 base/small/medium/large, 识别效果越来越好，但识别速度越来越慢，第一次将需要下载模型，默认 base,可以预先单独下载模型后，放到 当前软件目录/models目录下.

模型单独下载地址

tiny模型

base模型

small模型

medium模型

large模型
配音语速：填写 -90到+90 之间的数字，同样一句话在不同语言语音下，所需时间是不同的，因此配音后可能声画字幕不同步，可以调整此处语速，负数代表降速，正数代表加速播放。
自动加速: 如果翻译后的语音时长大于原时长，并且这里确认选中，那么将强制加速播放该片段，以缩小时长
静音片段: 填写100到2000的数字，代表毫秒，默认 500，即以大于等于 500ms 的静音片段为区间分割语音
点击开始按钮底部会显示当前进度和日志，右侧文本框内显示字幕

原始视频统一使用mp4格式，处理速度快，网络兼容性好

采用软合成字幕：字幕作为单独文件嵌入视频，可再次提取出，如果播放器支持，可在播放器字幕管理中启用或禁用字幕；

默认会在原始视频目录下生成同名的字幕文件视频名.srt

对于无法识别的语音将直接复制原语音

微信关注我们

原文链接：https://www.oschina.net/p/pyvideotrans

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

每日一博 | 视觉 BEV 基本原理和方案解析

BEV(Bird’s-Eye-View)是一种鸟瞰视图的传感器数据表示方法，它的相关技术在自动驾驶领域已经成了“标配”，纷纷在新能源汽车、芯片设计等行业相继量产落地。BEV同样在高德多个业务场景使用，例如：高精地图地面要素识别、车道线拓扑构建、车端融合定位中都扮演了重要角色。如图1‑1所示：图1‑1 BEV在高德应用场景（仅列举部分）a)高精底图 b)地面要素识别 c)车道线拓扑构建[1] d)车端融合定位(BEV特征和底图匹配)[2] 本文分享的内容主要包括两个部分：视觉BEV基本原理、方案解析。 1.BEV基础 1.1.引言如图1‑2所示，BEV具有如下优势： 1) BEV视图尺度变化小。在PV空间（即透视图，类似通常行车记录仪所采集的车辆前视图）中，物体近大远小，物体的大小和类别、远近都有关，而在BEV空间中，物体的大小只和类别有关； 2) BEV空间是决策友好空间。BEV空间更接近3D真实空间的平面空间，而PV空间是真实物理世界在透视投影下的视图，以图1‑2的车道线举例，在真实世界中平行的两条车道线，在BEV空间下还是平行的，在PV空间却是相交的。相比之下，BEV空间下的信...

2023-11-17

404

Unity 公司在今天举办的 Unite 2023 上宣布，2024 年将发布重大版本更新Unity 6，并表示其为下一个长期支持版本 (LTS)。 Unity 在大会上演示了全新的 Unity 6 引擎，并通过 Syncy Studios 采用 Unity 6 制作的《幻想王国（Fantasy Kingdom）》Demo 进行了演示，强调 Unity 6 的性能与画面改进。 Unity 公司称 Unity 6 将带来显著的性能增强、提升创建多人游戏的速度，以及对 XR 设备更深入的支持。此外还解锁了新渲染功能的支持，实现了更高水平的图形保真度。以惊人的性能提供先进的视觉效果加速多人游戏的创建和规模化利用 AI 工具探索新的创意可能性通过下一代移动功能和创新的 VR 设备支持让玩家随时随地接触 Untiy提到的 AI 工具为 Sentis，允许开发者在Unity运行时导入AI模型，从而创建基于AI的 NPC。Sentis的独特之处在于 AI 模型最终在用户设备上本地运行，不需要开发者额外配置云服务器。 Unity 6 还将带来对全新 WebGPU 图形后端的初步支持。从 Uni...

2023-11-17

428

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。