google sdk speech-to-text(谷歌语音转文本、谷歌语音转字幕)
google sdk speech-to-text
- 同步识别(REST 和 gRPC)将音频数据发送到 Speech-to-Text API,对该数据执行识别,并在所有音频处理完毕后返回结果。同步识别请求仅限于持续时间不超过 1 分钟的音频数据。
- 异步识别(REST 和 gRPC)将音频数据发送到 Speech-to-Text API 并启动长时间运行的操作。使用此操作,您可以定期轮询识别结果。异步请求可用于任何持续时间不超过 180 分钟的音频数据。
- 流式识别(仅限 gRPC)对 gRPC 双向流内提供的音频数据执行识别。流式传输请求专为实时识别(例如从麦克风采集实时音频)而设计。流式识别可以一边采集音频一边提供临时结果,例如实现在用户仍在讲话时显示结果。
源码
识别率超高的在线麦克风语音转文本(免费工具)
官网文档
- https://cloud.google.com/speech-to-text/docs/quickstart-client-libraries#client-libraries-usage-java
Java 流式和非流式语音识别示例(官网示例)
- https://github.com/GoogleCloudPlatform/java-docs-samples
- https://github.com/GoogleCloudPlatform/java-docs-samples/tree/master/speech
google speech-to-text
google 语音转文本(短语音)
google 语音转文本(英文短语音)
google 语音转文本(异步短语音)
google 语音转文本(每个单词带时间戳)
google 语音转文本自动加标点符号(短语音)
google 通过流的方式发送语音文件转文本
google 通过流的方式发送语音(直接用电脑上的麦克风说话)
google 语音转文本(多轨支持)
Google Speech 多语言支持
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
google 语音识别 VS 百度语音识别
google [优点] ).很牛逼,实时解析这么精准,了不起 ).有歧义的语句,复杂的语句,自动纠正能力很强,哪怕发音差(普通话差)也能识别 ).语音识别能力:丧心病狂 ).完全免费的: speechTexter [缺点] ).不能自动断句,查了官网说明,只支持英文,不支持中文(不能自动加标点符号) 百度 [优点] ).非常不错,翻译的很好 ).免费版本,(收费版本,更精准) [缺点] ).QPS (每秒钟的并发 10) ).复杂语句,自动纠正,还是做的还不够好 ).免费版的QPS太低,断句,丢字的现象 丧心病狂的谷歌语音识别能力 https://www.bilibili.com/video/av47855514/ 语音技术(google VS 百度) https://www.bilibili.com/video/av47884261
- 下一篇
语音识别实时对比(百度收费 VS SpeechTexter免费)
对比从5:00分钟开始 视频地址: https://www.bilibili.com/video/av48112826 ).以下测试结果基于测试点(祝福语、数字、日期、绕口令、诗、日常用语) [百度收费] [优点] ).比起百度自家发布的免费版本,速度快很多,很好的解决了丢字(丢句、就是有的地方没有翻译) ).比起百度自家发布的免费版本,语义解析在有些方面增强了,翻译的更准确些 ).百度断点,自动标点符号绝对优势 [缺点] ).还存在丢字的现象,有些地方翻译不准确 ).对于普通话的兼容度还不够好(发音不准、口音) ).语义自动解析还需要加强,有的地方直译(不能结合语境、不够智能就显得呆板) ).如说2019年04月02日星期二20点20分16秒320毫秒 这些固定格式的,最好能格式化输出 ).有些完全翻译错的地方 ).绕口令需加强(常用的就那些、至少常用的能做加强处理) ).整体相比于之前版本,有所提升,但是比起别人的免费版本不占优势,希望加强 ).希望百度在训练自己语音系统时,不只看重日常常用语,把他当个人,能很好的理解各种语境,甚至有的地方可以猜、或推出用户的想法(中国崛起) 因为...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8编译安装MySQL8.0.19
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- MySQL8.0.19开启GTID主从同步CentOS8
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Red5直播服务器,属于Java语言的直播服务器
- CentOS8安装Docker,最新的服务器搭配容器使用
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长