Waston+Python,6行代码实现音频转文字,轻松做字幕~
几行代码,抱上IBM爸爸大腿,实现音频快速转文字~用到了IBM Waston的Speech to text(目前还是个demo)
碎碎念的废话~
前几天工作中遇到需要把音频转为文字稿的任务,顺便学了个新词语:扒词。
扒词:根据视频信息获得文字信息,即根据录音或者台词,然后转字幕。
拿音频找导演联系扒词,结果导演居然说视频扒词可以,音频就算了吧,算了吧……!
我可是有30个音频,每个虽然才2-5分钟,但转成文字每个也有近千字吧,总和就是30000字!难道纯手打吗!踹翻导演啊!
科技这么发达,难道找不到音频转文字的软件吗!我于是搜了一下:
……天下没有免费的午餐。
感谢万能的知乎!让我找到了IBM 爸爸的Speech to text!
Speech to text官网在这里:
https://speech-to-text-demo.ng.bluemix.

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
.鼠标点击爱心特效的实现
关于这个鼠标点击的爱心的实现代码现在我就发给你们吧 <script type="text/javascript"> /* 鼠标特效 */ var a_idx = 0; jQuery(document).ready(function($) { $("body").click(function(e) { var a = new Array("富强","民主","文明","和谐","自由","平等","公正","法治","爱国","敬业","诚信","友善"); var $i = $("<span></span>").text(a[a_idx]); a_idx = (a_idx + 1) % a.length; var x = e.pageX, y = e.pageY; $i.css({ "z-index": 999999999999999999999999999999999999999999999999999999999999999999999, "top": y - 20, "left": x, "position": "absolute", "fon...
- 下一篇
Python机器学习(sklearn)——分类模型评估与调参总结(上)
1.如果只划分测试集和训练集 经验是75%作为训练集 sklearn中的train_test_split()默认这样划分from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split() 2.通常使用sklearn中的score方法计算结果的精度(正确预测比例) 3.KNN算法有两个重要参数:邻居个数和数据点之间距离的度量方法在实践中,选择较小的邻居个数(例如3或5个)效果较好,sklearn中默认使用欧氏距离构建KNN模型速度很快,若训练集很大(特征数多或样本数多),预测速度可能较慢对于稀疏数据集(大多数特征值为0),KNN效果很不好 4.普通最小二乘法,即要求预测值和真实值均方误差最小
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2全家桶,快速入门学习开发网站教程
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- MySQL8.0.19开启GTID主从同步CentOS8
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8编译安装MySQL8.0.19
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Linux系统CentOS6、CentOS7手动修改IP地址