阿里通义开源 Qwen3-ASR-Toolkit,音视频转录 Python 命令行工具
阿里通义Qwen团队推出开源Python命令行工具Qwen3-ASR-Toolkit,该工具能一键突破Qwen3-ASR-Flash API的3分钟时长限制,实现小时级音视频的快速转录。
Qwen3-ASR-Flash是通义千问系列最新的语音识别模型,它基于Qwen3基座模型,经海量多模态数据以及千万⼩时规模的 ASR(自动语音识别)数据训练构建而成。
Qwen3-ASR-Toolkit采用VAD智能静音切分技术,确保句子完整性;能自动将任意采样率的音频重采样为16 kHz单声道;借助多线程并行上传分片,显著缩短总耗时。
此外,它基于FFmpeg,支持mp4、mov、mkv、mp3、wav、m4a等几乎所有媒体格式。
开源地址:https://github.com/QwenLM/Qwen3-ASR-Toolkit

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Perceptron 发布感知语言模型 Isaac 0.1
由Meta Chameleon原班团队创立的Perceptron公司发布了开源2B参数感知-语言模型Isaac 0.1,该模型在多项视觉理解基准上表现优异,专为低延迟的边缘部署场景设计,定位为“物理世界的智能层”。 https://huggingface.co/PerceptronAI/Isaac-0.1 Isaac 0.1由Meta Chameleon原班团队创立的公司打造,强调在制造、物流、安防与机器人等环境中进行连续、低延迟、近传感器的边缘部署,以更低的功耗与成本运行。模型支持视觉问答、空间定位、OCR、小样本提示学习以及“对话式指向”交互,无需YOLO式微调即可通过少量标注示例完成缺陷或安全状态识别。 目前,Perceptron正与制造业、物流及安防领域的企业合作部署Isaac,并致力于研发下一代适应性更强的物理AI系统。
-
下一篇
License Manager软件授权管理平台,为软件开发者提供完整的版权保护体系
开源许可证管理解决方案 - 为软件开发者提供完整的版权保护体系 解决软件盗版难题,开源社区少有的专业授权管理平台。基于现代技术栈构建,兼顾安全性与易用性。 填补市场空白 - 国内外开源许可证管理方案稀缺,专为中小软件厂商设计 🚀 核心特性 强安全防护 - 硬件指纹绑定: 基于CPU、主板等硬件特征生成唯一标识 - 多层验证机制: 时间校验 + 硬件校验 + 功能权限控制 - 防破解设计: 加密通信 + 动态验证,提升破解门槛 灵活部署 - 在线授权: 实时控制,支持远程吊销许可证 - 离线授权: 适合内网环境,本地验证无需联网 - 混合模式: 可根据客户需求灵活切换 开发友好 # 5分钟完成部署 git clone https://gitee.com/cedar-v/license-manager cd license-manager docker compose up -d 💡 技术亮点 现代技术栈: Vue3 + Go + Docker,主流技术降低学习成本完整解决方案: 从许可证生成到客户端SDK,提供端到端支持可视化管理: 直观的Web...
相关文章
文章评论
共有0条评论来说两句吧...