首页 文章 精选 留言 我的

文章列表

共 183019 篇
美团 M17 团队开源 Meeseeks 评测集:揭秘大模型的 “听话”能力

美团 M17 团队开源 Meeseeks 评测集:揭秘大模型的 “听话”能力

近期,以 OpenAI o 系列模型、Claude 3.5 Sonnet 和 DeepSeek-R1 等各类大模型为代表的 AI 技术快速发展,其知识与推理能力得到了广泛认可。然而,许多用户在实际使用中也注意到一个普遍现象:模型有时未能严格遵循输入指令的具体格式要求、字数限制或内容约束,导致输出结果虽内容尚可,却不完全符合输入指令。 针对大模型知识推理能力与...

来自火山引擎的 MCP 安全授权新范式

来自火山引擎的 MCP 安全授权新范式

资料来源: 火山引擎-开发者社区 本文旨在深入剖析火山引擎 Model Context Protocol (MCP) 开放生态下的 OAuth 授权安全挑战,并系统阐述火山引擎为此构建的多层次、纵深防御安全方案。面对由 OAuth 2.0 动态客户端注册带来的灵活性与潜在风险,我们设计了从“事前防御”到“事中限制”,再到“事后兜底”的完整安全闭环。该体系通...

2025 年 8 月《DeepSeek-V3.1 SQL 能力评测报告》发布

2025 年 8 月《DeepSeek-V3.1 SQL 能力评测报告》发布

一、本期导览与核心看点 2025 年 8 月,SCALE 评测基准在纳入 GPT-5 家族 后,又马上纳入了 深度求索 公司于 8 月 21 日发布的最新模型 ------ DeepSeek-V3.1。 本报告旨在通过我们标准化的测试集,客观评估该模型在专业级数据库 SQL 任务中的综合能力,并揭示其在企业真实场景下的表现。 评测结果显示,DeepSeek-...

Anthropic 隐私政策更新:用户数据将用于模型训练、默认同意

Anthropic 隐私政策更新:用户数据将用于模型训练、默认同意

Anthropic 宣布将开始使用用户数据训练其 AI 模型,这些数据包括新的聊天记录和代码编写会话,除非用户主动选择退出。同时,该公司还将其数据保留政策延长至五年,同样适用于未选择退出的用户。 根据 Anthropic 发布的博客文章,所有用户需在 9 月 28 日前做出选择。若用户现在点击 “接受”,Anthropic 将立即开始用其数据训练模型,并将这...

Meta 提出“Active Reading”框架,让大模型像人一样“精读”

Meta 提出“Active Reading”框架,让大模型像人一样“精读”

Meta FAIR 与伯克利今日联合发布最新研究——Active Reading 框架,首次把“主动学习”概念搬进大模型训练流程,让模型以自我生成的学习策略研读指定材料,从而在大规模场景下可靠地吸收知识。 简单来说,模型拿到一篇文档后,会先自己设计“学习策略”(如摘要、联想、自测题等),再用这些策略生成大量高质量训练数据,最终把知识“吃干榨尽”。 https...

传音与 DXOMARK 联合影像实验室落成,重构移动影像测评新标准

传音与 DXOMARK 联合影像实验室落成,重构移动影像测评新标准

近日,传音控股与国际权威影像评测机构DXOMARK联合打造的影像实验室在传音重庆研发中心正式落成启用,这是行业首个基于DXOMARK第六版智能手机影像测试基准,打造的全自动化客观影像测评实验室。这一全新的联合影像实验室,融合了前沿自动化测试技术与领先的图像客观评测标准,尤其在自动化水平和测试精度方面实现了新突破,重构移动影像测评新标杆,继续引领行业技术革新,...

SuperCLUE 多模态视觉 8 月评测榜:Gemini-2.5-Pro 位居第一

SuperCLUE 多模态视觉 8 月评测榜:Gemini-2.5-Pro 位居第一

在8月28日发布的中文多模态视觉语言模型测评基准(SuperCLUE-VLM)榜单中,Gemini-2.5-Pro 以总分74.99分位居第一,OpenAI 的 GPT-5(high) 以68.59分排在第二位。 该基准基于中文场景特点,围绕基础认知、视觉推理和视觉应用三大核心维度构建评测体系,力求为多模态视觉语言模型的发展提供客观、公正的评估标准。 此次评...

商汤 2025 上半年收入 23.58 亿元,生成式 AI 收入占比 77%

商汤 2025 上半年收入 23.58 亿元,生成式 AI 收入占比 77%

8月28日,商汤发布2025年中期业绩显示,今年上半年,商汤实现收入23.58亿元,同比增长35.6%;经调整亏损净额为11.62亿元,同比和环比均大幅收窄。 其中,生成式AI收入连续第三年高速增长,实现收入约18.16亿元,同比增长72.7%,占总收入比例从 60.4% 提升至 77.0%。 经调整亏损净额同比和环比均大幅收窄,同比下降50%;贸易应收回款...

微软 35 岁软件工程师深夜加班在公司死亡

微软 35 岁软件工程师深夜加班在公司死亡

据媒体报道,一名年仅35岁的微软软件工程师死于硅谷园区。 据悉,该工程师名为Pratik Pandey,其家属透露,他在8月19日晚上进入微软办公室,隔日凌晨被发现死亡。 警方在凌晨约2点赶到现场,他们未发现“有任何可疑活动或行为的迹象”,此次死亡事件并未作为刑事调查案件处理。 目前,官方并未公布确切的死因,圣克拉拉县验尸官声称,具体死因尚待确定。其家人表示...

斯坦福研究: AI 导致年轻员工入门级职位减少 13%

斯坦福研究: AI 导致年轻员工入门级职位减少 13%

斯坦福大学以人为本人工智能研究所(HAI)的一项最新研究敲响了警钟,揭示了人工智能(AI)对年轻人就业市场的深远影响。 研究分析了数百万个招聘信息和就业数据后发现,在过去三年中,软件开发和客户服务等易受AI自动化影响的领域,入门级职位数量急剧下降了13%。这一趋势从2022年底开始加速,恰逢 ChatGPT 等生成式 AI 工具的广泛应用。 AI如何“吞噬”...

OpenAI 重组或将推迟至明年,与微软谈判陷入关键分歧

OpenAI 重组或将推迟至明年,与微软谈判陷入关键分歧

据媒体报道,OpenAI正与其最大金主——微软进行复杂谈判,准备修改一份原本持续到2030年的商业合同。如果能达成协议,OpenAI将能推进其重组计划,让投资者可以直接持有OpenAI的股权。 OpenAI这次的公司重组,目的是让投资者从“利润分享模式”转为“持股模式”,为未来上市铺路。但这必须先解决与微软的旧协议。 知情人士透露,双方在一些关键问题上仍有分...

隐语 Kuscia 正式发布 1.0.0 版本

隐语 Kuscia 正式发布 1.0.0 版本

Kuscia 是一款基于 K3s 的轻量级隐私计算任务编排框架,旨在屏蔽异构基础设施和协议,并提供统一的隐私计算底座。隐语·数据可信流通技术社区是融合可信数据空间、隐私计算、数据元件等多项数据流通利用基建技术设施在内的开源社区,致力于推动前沿技术探索、技术标准体系共建与产业应用场景共创,促进高质量数据资源流通利用与价值释放。 近期隐语Kuscia 正式发布 ...

🔥Oinone 赋能开发:集成自动化接口测试,提升软件质量与效率​

🔥Oinone 赋能开发:集成自动化接口测试,提升软件质量与效率​

Oinone 产品化架构:上层承接客户差异化与行业特性,中层直面市场的标准业务产品,底层沉淀通用能力与标准,确保迭代稳定。通过将需求拆解为模块与扩展包,实现标准化与个性化在同一框架内协同;依托低/无代码一体化、“被集成”原则及国产化全栈支持,保障生态适配与持续演进。现场演示中,标准产品与个性化需求都能快速落地,开发到上线全程在统一规范下完成。 Oinone ...

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Oracle

Oracle

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。