首页 文章 精选 留言 我的

文章列表

共 186764 篇
国产替代 + 大模型推理优化,AI 产业发展需要强大的基础设施

国产替代 + 大模型推理优化,AI 产业发展需要强大的基础设施

在人工智能迈向「智算融合」的新时代,大模型凭借其强大的认知与推理能力,正逐步重塑千行百业的智能化图景。然而,大模型推理环节的高算力消耗、高延迟与高能耗问题,成为其规模化落地的关键掣肘。破解这一瓶颈,既需构建高效能、低时延的算力基础设施,也依赖从芯片到应用的全产业链协同创新。 与此同时,在全球化技术博弈与数字化转型的双重驱动下,中国AI产业也正在经历一场从硬件...

从本地部署、推理加速到产业落地,昇腾AI基础设施驱动全栈技术升级

从本地部署、推理加速到产业落地,昇腾AI基础设施驱动全栈技术升级

2025年,AI 技术加速向实体经济渗透,而昇腾作为国产 AI 基础设施的核心力量,正通过技术创新与生态协同,推动大模型从实验室走进千行百业。在近期 OSCHINA 举办的一场昇腾技术直播中,多位行业专家与开发者分享了昇腾在推理加速、行业落地及本地化部署中的实践成果,揭示了昇腾如何以全栈能力打破技术壁垒,成为 AI 普惠时代的核心引擎。 本地部署:香橙派联合...

OR算法+ML模型混合推理框架架构演进

OR算法+ML模型混合推理框架架构演进

本文介绍了OR算法+ML模型混合推理能力建设思路及业务背景,此场景相比常规模型推理更具特殊性和复杂性,在工程实现上面临多维挑战,因此本文分别从性能、稳定性和扩展性三个维度分析问题和解法,并以推理框架架构演进为线总结了过去两年的分期迭代实践历程和收益,其中有一些较为通用的经验,希望能够给大家带来一些帮助或启发。 1 背景 调度系统主要职责是需要在合适的时间以合...

荣耀新增 AI 新产业部门,中国区关键岗位“竞聘上岗”

荣耀新增 AI 新产业部门,中国区关键岗位“竞聘上岗”

第一财经记者从知情人士独家获悉,荣耀在近期已完成对中国地区部关键岗位的人员部署,其中涉及38个中国区关键岗位主管,采用“重新竞聘上岗”的方式。 这场被内部称为“雄鹰计划”的人员调整计划面向荣耀的国内外全体员工。上述知情人士透露,竞聘目前已经完成,其中45%的岗位负责人有所调整,90后占比达到24%。 此外,记者了解到,荣耀内部新增AI新产业部门,同时将AI相...

三星 Galaxy S25 系列:AI 天团赋能,重塑旗舰新标杆

三星 Galaxy S25 系列:AI 天团赋能,重塑旗舰新标杆

2025年,三星以Galaxy S25系列重新定义了智能手机的边界。作为AI手机的革新之作,该系列凭借升级的Galaxy AI与强悍硬件性能,重新定义了智能手机的角色——让手机从“工具”蜕变为“智能伙伴”。与此同时,三星特别成立“三星AI天团”,邀请演员金晨担任团长兼AI颜值官,李川担任AI智慧管,孙越担任AI掌事管,哈瑞担任翻译官,进一步强化AI技术的人性...

Perplexity 即将完成 5 亿美元融资,估值达 140 亿美元

Perplexity 即将完成 5 亿美元融资,估值达 140 亿美元

AI 搜索初创公司 Perplexity 正在接近其六个月内的第二次融资,估值达到140亿美元。这一轮融资将由风险投资公司 Accel 领投,预计金额将达到5亿美元。 此次融资将为 Perplexity 的扩展提供重要的资金支持。公司计划利用这笔资金进一步提升其技术平台,扩展产品线,并加大市场推广力度。Perplexity 的目标是在竞争激烈的市场中占据一席...

微软更新「蓝屏错误」排查指南

微软更新「蓝屏错误」排查指南

微软最近更新了帮助用户排查 Windows 11 出现蓝屏错误的官方指南文件。内容如下: 蓝屏错误 (也称为_bug 检查_、停止代码错误_、内核错误或 BSOD 错误_) 如果严重问题导致 Windows 意外关闭或重启,以保护自身免受数据丢失的影响。 你可能会看到一条消息,指出“Windows 已关闭,以防止损坏你的计算机”或类似消息。 硬件设备、其驱动...

中国安全专家发现苹果自研 5G 基带漏洞,现已被修复

中国安全专家发现苹果自研 5G 基带漏洞,现已被修复

苹果今天发布iOS 18.5正式版更新,为苹果首款自研5G基带C1修复了首个漏洞。 该漏洞编号为CVE-2025-31214,可能允许“处于特权网络地位”的攻击者拦截网络流量,实施监控或中间人攻击。苹果通过改进状态管理,可能是新增验证机制,阻止攻击者利用运行状态间的弱点。 苹果C1芯片由iPhone 16e首发搭载,标志着苹果在摆脱对高通依赖的道路上迈出了关...

CrateDB 5.10.6 发布,分布式 SQL 数据库

CrateDB 5.10.6 发布,分布式 SQL 数据库

CrateDB 是一个分布式的 SQL 数据库,使得实时存储和分析大量的机器数据变得简单。CrateDB 提供了通常与 NoSQL 数据库相关的可扩展性和灵活性,最小的 CrateDB 集群可以轻松地每秒摄取数万条记录。这些数据可以在整个集群中实时地、临时地、并行地进行查询。 CrateDB 5.10.6 现已正式发布,该版本更新内容如下: 修复了一个问题,...

OceanBase 创始人、首席科学家阳振坤荣誉退休

OceanBase 创始人、首席科学家阳振坤荣誉退休

根据「OceanBase」公众号的消息,OceanBase创始人、首席科学家阳振坤荣誉退休,5月11日也恰是他入职的十五周年纪念日。这位1965年出生的分布式系统与数据库资深专家,见证并推动了中国数据库的技术革新。 据介绍,阳振坤在2010年从0到1发起并100%自研原生分布式数据库OceanBase。 15年来,阳振坤带领OceanBase攻克了分布式数据...

OpenAI 开源医疗大模型测试评估集 HealthBench

OpenAI 开源医疗大模型测试评估集 HealthBench

OpenAI开源了专门面向医疗大模型的测试评估集——HealthBench。 据介绍,该测试集的5000段核心测试对话,全部由来自60个国家/地区的26个专业262名医生打造,极大增强了该测试集的难度、真实性以及丰富度。并且采用了多轮对话测试,而不是简单的答题或选择题模式。 开源地址:https://github.com/openai/simple-eval...

全球首个 AI 设计 Agent —— Lovart.ai 发布 Beta 版本

全球首个 AI 设计 Agent —— Lovart.ai 发布 Beta 版本

Lovart.ai 号称是全球首个 AI 设计 Agent,刚刚发布了 Beta 版本, 据介绍,Lovart.ai 将「深度思考」的理念引入到了 AI 图像生成领域。用户只需描述需求,它会进逐步地推理和思考来分解和理解你的任务需求,然后调用合适的模型工具进行创作。而且在一个展开的画布中直接呈现,还能随时修改。 Lovart.ai 集成 GPT image-...

昆仑万维开源 Matrix-Game 大模型

昆仑万维开源 Matrix-Game 大模型

昆仑万维宣布正式开源(17B+)Matrix-Game大模型,即Matrix-Zero世界模型中的可交互视频生成大模型。 根据介绍,Matrix-Game是Matrix系列在交互式世界生成方向的正式落地,也是工业界首个开源的10B+空间智能大模型,它是一个面向游戏世界建模的交互式世界基础模型,专为开放式环境中的高质量生成与精确控制而设计。 Matrix-Ga...

Manus 开放注册,用户每天可免费执行一项任务

Manus 开放注册,用户每天可免费执行一项任务

AI 智能体平台 Manus 发文宣布面向所有人开放,无需等待名单。 从今天起,我们将推出 Manus 的额外访问权限! 所有用户均可使用,无需等待 所有用户均可免费获得一项每日任务(300 积分) 所有用户均可一次性获得 1000 积分奖励 相关阅读: Monica.im 发布 AI Agent 产品「Manus」 Manus 邀请码炒至 6 万元,官方称...

资源下载

更多资源
腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

WebStorm

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源,继承了IntelliJ IDEA强大的JS部分的功能。

用户登录
用户注册