google sdk speech-to-text(谷歌语音转文本、谷歌语音转字幕)

2019-04-01 1614

google sdk speech-to-text

同步识别（REST 和 gRPC）将音频数据发送到 Speech-to-Text API，对该数据执行识别，并在所有音频处理完毕后返回结果。同步识别请求仅限于持续时间不超过 1 分钟的音频数据。
异步识别（REST 和 gRPC）将音频数据发送到 Speech-to-Text API 并启动长时间运行的操作。使用此操作，您可以定期轮询识别结果。异步请求可用于任何持续时间不超过 180 分钟的音频数据。
流式识别（仅限 gRPC）对 gRPC 双向流内提供的音频数据执行识别。流式传输请求专为实时识别（例如从麦克风采集实时音频）而设计。流式识别可以一边采集音频一边提供临时结果，例如实现在用户仍在讲话时显示结果。

源码

https://github.com/opensourceteams/google-sdk-speech-to-text

识别率超高的在线麦克风语音转文本(免费工具)

https://www.speechtexter.com

官网文档

https://cloud.google.com/speech-to-text/docs/quickstart-client-libraries#client-libraries-usage-java

Java 流式和非流式语音识别示例(官网示例)

微信关注我们

原文链接：https://yq.aliyun.com/articles/696338

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

google 语音识别 VS 百度语音识别

google [优点] ).很牛逼，实时解析这么精准,了不起 ).有歧义的语句，复杂的语句，自动纠正能力很强，哪怕发音差(普通话差)也能识别 ).语音识别能力:丧心病狂 ).完全免费的: speechTexter [缺点] ).不能自动断句,查了官网说明，只支持英文，不支持中文(不能自动加标点符号) 百度 [优点] ).非常不错，翻译的很好 ).免费版本，(收费版本，更精准) [缺点] ).QPS (每秒钟的并发 10) ).复杂语句，自动纠正，还是做的还不够好 ).免费版的QPS太低，断句，丢字的现象丧心病狂的谷歌语音识别能力 https://www.bilibili.com/video/av47855514/ 语音技术(google VS 百度) https://www.bilibili.com/video/av47884261

2019-03-31

840

对比从5:00分钟开始视频地址: https://www.bilibili.com/video/av48112826 ).以下测试结果基于测试点（祝福语、数字、日期、绕口令、诗、日常用语） [百度收费] [优点] ).比起百度自家发布的免费版本，速度快很多，很好的解决了丢字(丢句、就是有的地方没有翻译) ).比起百度自家发布的免费版本，语义解析在有些方面增强了，翻译的更准确些 ).百度断点，自动标点符号绝对优势 [缺点] ).还存在丢字的现象，有些地方翻译不准确 ).对于普通话的兼容度还不够好(发音不准、口音) ).语义自动解析还需要加强，有的地方直译(不能结合语境、不够智能就显得呆板) ).如说2019年04月02日星期二20点20分16秒320毫秒这些固定格式的，最好能格式化输出 ).有些完全翻译错的地方 ).绕口令需加强(常用的就那些、至少常用的能做加强处理) ).整体相比于之前版本，有所提升，但是比起别人的免费版本不占优势，希望加强 ).希望百度在训练自己语音系统时，不只看重日常常用语，把他当个人，能很好的理解各种语境,甚至有的地方可以猜、或推出用户的想法(中国崛起) 因为...

2019-04-02

702

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。