Meta 计划在 Llama 4 中引入改进的语音功能，接近双向自然对话-低调大师

Meta 计划在 Llama 4 中引入改进的语音功能，接近双向自然对话

2025-03-07 324

英国金融时报援引知情人士消息称， Meta 计划在其最新的开源大型语言模型 Llama 4 中引入改进的语音功能，预计将在未来几周内推出，因为该公司认为未来所谓的人工智能代理将以对话为主，而不是以文本为主。

一位知情人士透露，该公司特别注重让用户和语音模型之间的对话更接近双向自然对话，允许用户打断，而不是采用更为死板的问答形式。

在推动语音技术发展之际，Meta 首席执行官扎克伯格已经提出了大胆计划，要将这家价值 1.7 万亿美元的硅谷公司打造成“AI leader”。扎克伯格称，2025 年是该公司许多 AI 产品的成败之年。

两位知情人士表示，这促使该公司考虑试行其 AI 助手 Meta AI 的高级订阅服务，用于执行预订和视频制作等代理任务。其中一位知情人士表示，该公司还在考虑在其 AI 助手的搜索结果中引入付费广告或赞助帖子。

扎克伯格今年透露了打造一个 AI 工程代理的计划，其编码和解决问题的能力相当于中级工程师，并称其具有 “非常大的潜在市场”。

日前，Meta 首席产品官克里斯·考克斯（Chris Cox）透露了 Llama 4 的一些计划，称它将是一种“omni model”，即语音将“成为原生的……而不是将语音翻译成文本，将文本发送到 LLM，输出文本，然后再将其转换回语音”。

“我相信这对于界面产品来说意义重大，你可以与互联网对话，向它询问任何事情。我认为我们仍在思考它到底有多强大。”

两位知情人士表示，Meta 还一直在讨论最新款 Llama 型号应具备的输出限制以及是否要降低限制。

微信关注我们

原文链接：https://www.oschina.net/news/337453/meta-voice-powered-ai

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

谷歌联合创始人佩奇成立新公司，专注于将 AI 应用于产品制造

根据 The Information 的独家报道，谷歌联合创始人拉里·佩奇正在创建一家名为 Dynatomics 的新公司，专注于将 AI 应用于产品制造，通过 AI 技术优化产品设计，并指导工厂生产，以提高效率和创新能力。报道称，佩奇正在与一小群工程师合作开发人工智能，该人工智能可以为物体创建高度优化的设计，然后让工厂制造它们。克里斯·安德森 (Chris Anderson) 曾担任佩奇支持的电动飞机初创公司 Kittyhawk 的首席技术官，目前他正在负责这项秘密工作。佩奇并不是唯一一位探索利用人工智能改进制造流程的企业家（尽管他可能是最富有的企业家之一）。 Orbital Materials 正在创建一个 AI 平台，可用于发现从电池到二氧化碳捕获电池等各种材料。PhysicsX 为从事汽车、航空航天和材料科学等项目领域的工程师提供运行模拟的工具。此外，Instrumental正在利用视觉驱动的 AI 来检测工厂异常情况。

2025-03-07

259

法国大模型独角兽 Mistral AI 宣布推出Mistral OCR，号称是「世界上最好的 OCR 模型」。据介绍，Mistral OCR 是一种光学字符识别 API，它为文档理解树立了新标准。与其他模型不同，Mistral OCR 能够以前所未有的准确度和认知能力理解文档的每个元素（媒体、文本、表格、公式）。它以图像和 PDF 作为输入，并从有序交错的文本和图像中提取内容。因此，Mistral OCR 称得上一种理想的模型，可以与以多模式文档（如幻灯片或复杂 PDF）作为输入的 RAG 系统结合使用。从现在开始，Mistral OCR 功能可以在 Le Chat 上免费试用。 Mistral AI 已经将它作为 le Chat 上数百万用户的默认文档理解模型，并以 1000 页 / 美元的价格发布了 API「mistral-ocr-latest」。目前，该 API 已经在开发者套件 la Plateforme 上提供，并将很快提供给 Mistral AI 的云和推理合作伙伴，同时可以有选择地本地部署。

2025-03-07

294

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。