首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/212583/matter-1-0-released

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Whisper —— OpenAI 开源的语音识别系统

Whisper 是 OpenAI 开源的自动语音识别(ASR,Automatic Speech Recognition)系统,OpenAI 通过从网络上收集了 68 万小时的多语言(98 种语言)和多任务(multitask)监督数据对 Whisper 进行了训练。OpenAI 认为使用这样一个庞大而多样的数据集,可以提高对口音、背景噪音和技术术语的识别能力。除了可以用于语音识别,Whisper 还能实现多种语言的转录,以及将这些语言翻译成英语。 设置 我们使用 Python 3.9.9 和 PyTorch 1.10.1 来训练和测试我们的模型,但代码库预计将与 Python 3.7 或更高版本以及最新的 PyTorch 版本兼容。 代码库还依赖于一些 Python 包,以下命令将从该存储库中提取并安装最新提交及其 Python 依赖项 pip install git+https://github.com/openai/whisper.git 它还需要在你的系统上安装命令行工具 ffmpeg,大多数包管理器都可以使用: # on Ubuntu or Debian sudo apt up...

EasyOCR 新增光栅字符分割算法,实现同时多数字识别

EasyOCR新增光栅字符分割算法,实现同时多数字识别 最近,为了群里的网友的大作业,实现了早就计划要进行的升级活动,实现了一维光栅字符分割算法,实现了多数字字符的识别。EasyOCR进入了2.0时代。 光栅字符分割算法基于字符周围的空白边线。利用边线实现字符分割,这种算法不是完美的。但是,更加复杂的算法都可以看作对光栅分割算法的改进。 效果见截图: 项目介绍 这是一个软件示例,为学习准备,需要下载源码,运行和学习。 本软件是一个手写体数字识别软件,采用BP神经网络,基于colt数学库,有完整源码,可以保存训练结果,基于开源例程neuralnetwork-sample,原作可以在GitHub中找到。主要改进了训练结果保存,并新增500张手写训练样本照片。新版本1.2.0新增宽幅数字识别和流行手写数字数据集MNIST前6076幅图片。欢迎使用。 软件架构 软件架构说明:Java,Colt数学库,BP神经网络,附带500张测试图片,附带已训练的神经网络。 介绍视频 https://www.bilibili.com/video/BV1K34y1Y75A/

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。

用户登录
用户注册