首页 文章 精选 留言 我的

文章列表

共 182785 篇
Mistral AI 发布 Agents API,内置代码执行、网络搜索等工具

Mistral AI 发布 Agents API,内置代码执行、网络搜索等工具

Mistral AI 宣布推出 Agents API,其内置代码执行、网络搜索等工具,支持跨对话持久记忆和智能体编排。 官方公告写道: 传统语言模型擅长生成文本,但在执行操作或保持上下文方面存在局限。Mistral 的新 Agents API 通过将 Mistral 强大的语言模型与以下功能结合,解决了这些局限性: 内置的代码执行、网络搜索、图像生成和 MC...

多模态大模型视觉推理能力评估:o3 仅得 25.8% 分数

多模态大模型视觉推理能力评估:o3 仅得 25.8% 分数

清华大学、腾讯混元、斯坦福大学及卡耐基梅隆大学的研究团队近日联合发布了一项新评估基准 ——RBench-V,专门针对多模态大模型的视觉推理能力进行测试。 RBench-V 基准测试包含803道题目,涉及多个领域,包括几何与图论、力学与电磁学、多目标识别和路径规划等。与以往只要求文字回答的评估不同,这次评测特别要求模型生成或修改图像内容,以支持推理过程。这意味...

秘塔AI搜索推出全新“极速”模型,响应速度最高400 tokens/秒

秘塔AI搜索推出全新“极速”模型,响应速度最高400 tokens/秒

秘塔AI搜索推出了全新“极速”模型,新版模型不仅更快,准确率更高,逻辑也更清晰。 据介绍,秘塔AI团队通过在GPU上进行kernel fusion,以及在CPU上进行动态编译优化,在单张H800 GPU上实现了最高400 tokens/秒的响应速度,大部分问题2秒内就能答完。 用户可通过测速站点kuai.metaso.cn体验实际效果,但团队提示模型规模较小...

Trae IDE 海外版上线付费订阅服务,Pro 版每月 10 美金

Trae IDE 海外版上线付费订阅服务,Pro 版每月 10 美金

字节跳动旗下 AI IDE ——Trae IDE 已针对海外版上线付费订阅服务,具体权益如下: ✅ 不再“排队等待”——更快地访问像 Claude Sonnet 4 这样的顶级模型 ✅ 每月 600 次快速请求 Premium 模型 ✅ 无限自动补全和慢速请求 ✅ 额外快速请求按需付费 ✅ 新用户首月仅需 3 美元 除了上线付费订阅服务,Trae IDE 还...

谷歌回应在 AI 搜索植入广告:用户觉得有帮助

谷歌回应在 AI 搜索植入广告:用户觉得有帮助

谷歌搜索正在其AI模式(AI Mode)和AI概览(AI Overviews)功能中添加广告,谷歌声称这些广告是“有帮助的”。 在上周的谷歌营销活动Google Marketing Live上,谷歌确认已经开始在美国推出这些广告,并声称它们为客户提供了新的“机会”。 据一些用户反映,这些广告出现在AI概览的下方,紧随其后的是传统的蓝色链接。随后在媒体发现的一...

腾讯混元开源语音数字人模型 HunyuanVideo-Avatar

腾讯混元开源语音数字人模型 HunyuanVideo-Avatar

腾讯混元宣布开源语音数字人模型HunyuanVideo-Avatar,由腾讯混元视频大模型(HunyuanVideo)及腾讯音乐天琴实验室MuseV技术联合研发,支持头肩、半身与全身景别,以及多风格、多物种与双人场景,面向视频创作者提供高一致性、高动态性的视频生成能力。 用户可上传人物图像与音频,HunyuanVideo-Avatar模型会自动理解图片与音频...

被拒两次后,我彻底重构了 iOS 上架流程|Appuploader复盘实录

被拒两次后,我彻底重构了 iOS 上架流程|Appuploader复盘实录

有一段时间,我对“App Store 审核”三个字产生了条件反射。不是因为怕写代码,而是因为我太怕看见“Your app has been rejected”那封邮件了。 作为跨平台独立开发者,我从构建到发布全程一个人搞定。项目上线那天,本应是收获成就感的节点,结果因为 App Store 的严格机制,被迫一拖再拖。 我从第一次被拒、第二次被拒,再到最终一次...

大语言模型推理优化技术综述(The Art of LLM Inference)

大语言模型推理优化技术综述(The Art of LLM Inference)

编者按: 如何将 LLM 的推理过程从"烧钱的无底洞"转变为"高性能的生产力引擎"?本文深入剖析了提升 LLM 推理效率的五大核心技术:巧妙的 KV 缓存管理、Query-sparsity attention(QUEST)、推测解码(使用 draft model 加速生成过程)、权重调度(通过 Flexgen 实现跨设备资源分配)以及系统级优化(FastSe...

Kmesh v1.1.0 发布,基于 eBPF 和可编程内核的无 Sidecar 服务网格

Kmesh v1.1.0 发布,基于 eBPF 和可编程内核的无 Sidecar 服务网格

Kmesh v1.1.0 版本已正式发布。 在 v1.0.0 的基础上,此版本对 Kmesh 的架构、可观察性和生态系统集成进行了重大改进。Kmesh 官方网站经过了全面的重新设计,提供了直观的界面和精简的文档,以增强用户和开发者的体验。此外,我们还重构了 DNS 模块并添加了长连接指标,从而能够更深入地洞察更多流量模式。 在 Kernel-Native 模...

开源快讯 | 近期开源资讯一览(2025.5.28)

开源快讯 | 近期开源资讯一览(2025.5.28)

开源生态建设加速技术创新,促进全球协作,是科技发展的强大驱动力,其重要性对现代科技社会至关重要。 新致开源团队整理了近期开源生态重要行业信息,供读者参考。 杭州市滨江区发布新一轮人工智能产业政策 2025年5月26日, 杭州市滨江区在2025滨江国际人才活动开幕式上推出了以“真金白银”支持为核心的最新 产业政策。新政策将聚焦 “ 算力 、算法、数据”三要素,...

etcd v3.6.0 发布,开源分布式键值存储项目

etcd v3.6.0 发布,开源分布式键值存储项目

etcd v3.6.0 已正式发布,这是自 2021 年 6 月 15 日 etcd v3.5.0 以来的第一个小版本更新。 此版本引入了多个新功能,在长期项目如降级支持和迁移到 v3store 上取得重要进展,还修复了大量关键和重大问题。内存使用也有显著优化,提升了效率和性能。 支持更丰富的架构与操作系统,包含最新 Linux 发行版与 macOS 版本 ...

大模型评估排障指南 | 关于可复现性

大模型评估排障指南 | 关于可复现性

这是大模型评估排障指南系列文章的第三篇,敬请关注系列文章: 关于推理 关于 公式解析 关于可复现性 假设你读了一篇最近的新模型技术报告,然后心血来潮想要在本机复现他们的结果,却发现根本没法复现,这是为什么? 让我们来探讨一下原因。 代码库不同 要想复现论文或报告的评估得分并精确到小数点,首先要确保使用的代码库一致。 一般情况下,你可以选择使用作者提供的默认评...

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。