谷歌发布 2.7 亿参数的多模态模型:Gemma 3 270M
谷歌发布了专为任务特定微调设计的 2.7 亿参数紧凑模型 Gemma 3 270M,该模型具备高能效和内置指令遵循能力,并支持 INT4 精度运行。Gemma 3 270M 包含 1.7 亿嵌入参数、1 亿 Transformer 参数以及 25.6 万词汇量,为特定领域和语言的微调提供了坚实的基础。
Gemma 3 270M 具有很高的能效。它提供了生产就绪的量化感知训练(QAT)检查点,支持在 INT4 精度下运行,性能损失极小,非常适用于资源受限的设备。模型还附带了指令微调版本,可实现开箱即用。该模型的核心价值在于通过微调释放其潜力,能够高精度、高速度且经济高效地执行文本分类、数据提取等任务。
它适用于情感分析、实体提取、查询路由等高吞吐量、定义明确的任务。其小巧的尺寸支持快速微调迭代和设备上运行,确保了用户隐私。开发者可以通过 Hugging Face、Ollama、Kaggle、LM Studio 和 Docker 下载 Gemma 3 270M。
它支持在 Vertex AI、llama.cpp、Gemma.cpp、LiteRT、Keras 和 MLX 等多种推理工具上运行。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
开源多媒体框架 FFmpeg 集成 Whisper.cpp,增加 AI 语音转写功能
开源多媒体框架FFmpeg 在即将发布的8.0 版本中新增了 af_whisper 音频工具,可在 FFmpeg 生态系统内直接实现自动语音识别(ASR)。 https://git.ffmpeg.org/gitweb/ffmpeg.git/commit/13ce36fef98a3f4e6d8360c24d6b8434cbb8869b 该工具基于 whisper.cpp 库,为媒体处理流程引入 AI 模型,支持灵活的音频转写功能,包括选择 AI 模型、指定语言和设置输出格式(文本、SRT、JSON 等)。 它既可处理预录制文件,也可处理实时音频流,并提供语音激活检测(VAD)以提升转写的准确性与效率。同时,该工具支持 GPU 加速,能够显著缩短转写时间。 社区用户对这一新功能发表了许多看法,有用户表示,“添加 --enable-whisper 到自定义的 FFmpeg 构建配置中”很令人期待;当然也有人质疑:“为什么要将其整合入 FFmpeg?最可能的用途是实时生成并将字幕嵌入视频,但这看起来还是很小众”。还有人写道:“我希望这个功能可以用来从音频中隔离语音内容,这样就能更好地重制 TV...
- 下一篇
AI 质量专项报告自动分析生成
一、背景 在日常工作中,常需要通过各项数据指标,确保驱动版本项目进展正常推进,并通过各种形式报表数据,日常总结日报、周会进展、季度进行总结输出归因,分析数据变化原因,做出对应决策变化,优化运营方式,目前在梳理整理校准分析数据需要大量的时间投入、结合整体目标及当前进展,分析问题优化的后续规划。 常见形式 人工收集 数据来源依赖于各系统平台页面,通过人工收集校准后填写再通过表格公式计算,或者可以通过多维表格工作流触发通知等功能。 quickbi报表 通过ODPS搭建自定义报表,实现快速收集数据,复制报表到飞书文档内进行异动分析。 平台能力开发 通过代码开发文档导出能力,根据固定模板生成数据分析,该能力开发人力成本较高,需要针对不同平台数据源定制化开发。 AI Studio智能体平台 研发效能团队基于开源Dify项目社区部署,可以根据需求自定义sop,多模型的可选项,选择最适合业务的模型。每个工作流节点可自定义流程的判断分析,轻松上线可投产的AI Agents。 Dify是一个支持工作流编排的AI智能体平台,轻松构建并部署生产级 AI 应用。其核心功能包含: 以工作流的方式编排AI应用,在工...
相关文章
文章评论
共有0条评论来说两句吧...