首页 文章 精选 留言 我的

文章列表

共 182785 篇
蚂蚁与中国人民大学发布首个原生 MoE 扩散语言模型

蚂蚁与中国人民大学发布首个原生 MoE 扩散语言模型

蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构的扩散语言模型(dLLM)“LLaDA-MoE”。 该模型通过非自回归的掩码扩散机制,在大规模语言模型中实现了与Qwen2.5相当的语言智能(如上下文学习、指令遵循、代码和数学推理等),挑战了“语言模型必须自回归”的主流认知。 实验数据显示,LLaDA-MoE模型性能效果在代码、数学、Agent等任务上领先...

阿里巴巴、百度开始采用自研芯片训练 AI 模型

阿里巴巴、百度开始采用自研芯片训练 AI 模型

《The Information》援引直接知情人士的消息报道,阿里巴巴和百度已开始使用自主设计的芯片训练其 AI 模型,部分替代了英伟达生产的芯片。 报道称,自今年初以来,阿里巴巴针对轻量级 AI 模型使用自研芯片;而百度则在尝试用其昆仑 P800 芯片训练新版文心一言(Ernie)AI 模型。 不过,阿里和百度都并未完全放弃英伟达,两家公司仍在使用英伟达的...

Zulip Server 11.1 发布,开源团队协作工具

Zulip Server 11.1 发布,开源团队协作工具

Zulip 是一个开源团队协作工具,一款专为实时和异步对话而设计的现代团队聊天应用程序,支持快速搜索、拖放文件上传、图像预览、组私人消息、可听通知、错过电子邮件消息提醒与桌面应用等。 Zulip Server 11.1 现已发布,一些更新亮点如下: 添加了 Debian 12 → 13 的升级说明。 修复了数据导入后数据库中订阅者数量不正确的问题,该问题可能...

MiniMax 发布新一代音乐生成模型 Music 1.5

MiniMax 发布新一代音乐生成模型 Music 1.5

MiniMax发布了新一代音乐生成模型Music 1.5,单次可生成最长4分钟完整歌曲,支持流行、爵士、摇滚、蓝调等多种风格,并新增对中国小众及民族乐器的建模。 该模型还提供“高级模式”,允许用户用自然语言描述风格、情绪、场景,并对Intro、Verse、Chorus等段落进行歌词与结构级精细控制,实现段落界限清晰、副歌爆点突出的“叙事级”听觉体验。 Mus...

腾讯:OpenAI 前研究员姚顺雨 1 亿薪资入职传闻不实

腾讯:OpenAI 前研究员姚顺雨 1 亿薪资入职传闻不实

日前有市场传闻称,OpenAI 的前研究员姚顺雨以超过1亿的薪资加盟腾讯。 对于这一敏感消息,腾讯于今日通过其“鹅厂黑板报” 账号发布声明正式辟谣,称该消息并不属实,明确指出关于姚顺雨入职及薪资的传闻是虚假信息。 公开资料显示,姚顺雨毕业于清华大学和普林斯顿大学,在清华就读姚班。2024年加入OpenAI,他的研究方向是Agent(智能体)。 他曾指出,AI...

Yzncms v2.1.1 已经发布,内容管理系统

Yzncms v2.1.1 已经发布,内容管理系统

Yzncms v2.1.1 已经发布,内容管理系统 此版本更新内容包括: 【优化】新增面板图表并修改控制台样式 【优化】新增菜单刷新并优化插件和菜单刷新 【优化】会员中心样式,图表改为fill,更改蓝色系 【优化】后台rem格式统一改为px 【新增】本地插件安装支持升级 【新增】添加会员注册开关 【新增】新增Config配置超时配置 【修复】修复附件多选不显...

OpenAI 与微软达成非约束性协议:允许将营利部门转型公益股份公司

OpenAI 与微软达成非约束性协议:允许将营利部门转型公益股份公司

OpenAI 宣布与其主要投资方微软签署了一份非约束性谅解备忘录(MOU),开启双方合作的新阶段。 该协议的核心在于 OpenAI 计划将其营利部门转型为公益股份公司(Public Benefit Corporation,简称 PBC),这一转型若获得美国各州监管机构的批准,将为 OpenAI 带来更多的融资机会,并可能为未来上市铺平道路。 OpenAI 董...

什么是上下文工程 (Context Engineering)?

什么是上下文工程 (Context Engineering)?

你听说过这个新术语上下文工程,但不确定它是什么吗?加入我们,我们将解释它是什么以及 RAG 与 Elasticsearch 如何提供帮助。 Elasticsearch 包含许多新功能,可帮助您为您的用例构建最佳搜索解决方案。深入了解我们的示例笔记本以了解更多信息,开始免费云试用,或立即在您的本地计算机上试用 Elastic。 随着人工智能的快节奏和不断发展的...

2025 年大语言模型架构演进:DeepSeek V3、OLMo 2、Gemma 3 与 Mistral 3.1 核心技术剖析

2025 年大语言模型架构演进:DeepSeek V3、OLMo 2、Gemma 3 与 Mistral 3.1 核心技术剖析

编者按: 在 Transformer 架构诞生八年之际,我们是否真的见证了根本性的突破,还是只是在原有设计上不断打磨?今天我们为大家带来的这篇文章,作者的核心观点是:尽管大语言模型在技术细节上持续优化,其核心架构仍保持延续,真正的创新更多体现在效率提升与工程实现上。 文章系统梳理了 2025 年多个主流开源模型的架构演进,重点分析了 DeepSeek-V3/...

微语 0.9.6 发布,开源智能客服 Agent

微语 0.9.6 发布,开源智能客服 Agent

企业级多租户团队协作工具,免费开源N件套:企业IM、在线客服、企业知识库/帮助文档、客户之声、工单系统、AI对话、工作流、呼叫中心、视频客服、开放平台。 语言 English 中文 管理端 多渠道 客服端 介绍 企业IM 局域网即时通讯 企业成员管理 聊天记录监控 ... 全渠道客服 多渠道接入 人工客服 客服Agent智能体,对接自有数据,自动执行操作 ....

🔥 AI + 低代码:历史记录功能革新,开启低代码开发智能协作新纪元

🔥 AI + 低代码:历史记录功能革新,开启低代码开发智能协作新纪元

开源AI低代码引擎VTJ.PRO再次突破,用智能历史管理让开发者的每次创作都有迹可循、有版可溯。 近日,领先的开源AI低代码引擎VTJ.PRO正式发布0.13.22版本,重点增强了历史记录功能,支持自动与手动保存、标记管理和版本对比等实用特性。 这标志着VTJ.PRO在提升开发者体验和团队协作效率方面再次迈出重要一步,进一步巩固了其“降低复杂度,不降低自由度...

RXThinkCMF 敏捷开发框架 Laravel10+AntdVue 版本 v2.4.0 发布

RXThinkCMF 敏捷开发框架 Laravel10+AntdVue 版本 v2.4.0 发布

v2.4.0 更新内容: 1、新增 `DevOps` 兼容解决方案; 2、优化 `Docker` 容器化脚本; 3、修复近期用户反馈的问题; 一款 PHP 语言基于 Laravel10、Vue3、AntDesign、MySQL 等框架精心打造的一款模块化、插件化、高性能的前后端分离架构敏捷开发框架,可用于快速搭建前后端分离后台管理系统,本着简化开发、提升开发...

AI 编程公司 Replit 发布第三代自主编码 Agent

AI 编程公司 Replit 发布第三代自主编码 Agent

Replit宣布推出第三代自主编码 Agent(Agent 3),官方称其自主性提升至前代的 10 倍,单次可连续运行 200 分钟,全程无需人工干预。 自主性增强:Agent 3 可以自主测试和修复代码,甚至在后台持续改进用户的应用,将用户从重复性工作中解放出来。它能够像人类一样在浏览器中 “点击” 和 “操作”,检查应用中的按钮、表单和 API,确保一切...

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

JDK

JDK

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。