首页 文章 精选 留言 我的

文章列表

共 184795 篇
破解 vLLM + DeepSeek 规模化部署的“不可能三角”

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

作者:亦达 什么是 vLLM 人工智能产业的蓬勃发展催生了丰富多样的推理模型,为解决特定领域的问题提供了高效的解决方案。DeepSeek 的爆火就是极佳的范例。然而,对于个人用户而言,如何有效地利用这些模型成为一个显著的挑战------尽管模型触手可及,但其复杂的部署和使用流程却让人望而却步。 针对这一现象,在大型语言模型(LLM)领域,vLLM(访问官网 ...

恭喜禅道软件通过CMMI 5级认证,研发实力获国际权威机构最高级别认可

恭喜禅道软件通过CMMI 5级认证,研发实力获国际权威机构最高级别认可

2025年1月16日,禅道软件通过了CMMI DEV V3.0 ML5认证(以下简称“CMMI 5级”)。 此次获得国际权威认证,代表着禅道软件的软件研发能力成熟度达到业界一流软件企业的水准。彰显了禅道软件在软件研发方面领先的研发水平和雄厚的技术实力,也标志着禅道在设计和开发产品、确保质量、策划和管理工作、支持实施、提高性能以及维持性能和持久性等方面进...

湖仓分析|浙江霖梓基于 Doris + Paimon 打造实时/离线一体化湖仓架构

湖仓分析|浙江霖梓基于 Doris + Paimon 打造实时/离线一体化湖仓架构

导读:浙江霖梓早期使用 CDH 产品套件搭建了大数据系统,面临业务逻辑冗余、查询效率低下等问题,基于 Apache Doris 进行整体架构与表结构的重构,并基于湖仓一体和查询加速展开深度探索与实践,打造了 Doris + Paimon 的实时/离线一体化湖仓架构,实现查询提速 30 倍、资源成本节省 67% 等显著成效。 浙江霖梓是一家专注于深度学习和人工...

DeepSeek R1的崛起已经势不可挡,而开源商业化在中国到底行不行?

DeepSeek R1的崛起已经势不可挡,而开源商业化在中国到底行不行?

缘起及背景 在科技行业蓬勃发展的浪潮中,开源商业化宛如一颗闪耀却又充满争议的新星,备受瞩目。开源商业化在中国到底行不行? 这是一个不仅被开源圈讨论了很久的话题,也是被行业讨论了很多的话题。 有人认为开源商业化行,有人认为开源商业化不行,各有各的观点和事实依据。虽然在中国市场上还没有出现一个足以让信服的开源商业化成功的企业,但随着华为的鸿蒙系统在OpenHar...

Databend 基于青云 DeepSeek-V3 服务拥抱技术创新

Databend 基于青云 DeepSeek-V3 服务拥抱技术创新

随着业务的飞速发展, 依托创新数据处理技术来为众多企业提供云原生湖仓解决方案的 Databend,面临着用户日益增长的复杂数据处理需求,从 2023 年起便开始探索将大模型能力引入湖仓,对算力和 API 稳定性提出了近乎苛刻的要求,青云科技旗下基石智算CoresHub 提供 DeepSeek 稳定的 API 调用,为 Databend 的能力创新筑牢了坚实基...

一文详解 RocketMQ 如何利用 Raft 进行高可用保障

一文详解 RocketMQ 如何利用 Raft 进行高可用保障

作者:季俊涛 前言 Apache RocketMQ 自诞生以来,因其架构简单、业务功能丰富、具备极强可扩展性等特点被众多企业开发者以及云厂商广泛采用。历经十余年的大规模场景打磨,RocketMQ 已经成为业内共识的金融级可靠业务消息首选方案,被广泛应用于互联网、大数据、移动互联网、物联网等领域的业务场景。由于其业务场景愈加丰富,在工业界的使用率日益提高,开发...

DeepSeek带来的Deepshock,一次看懂DeepSeek

DeepSeek带来的Deepshock,一次看懂DeepSeek

摘要:感受深度思考的震撼,通俗易懂地带你了解为什么DeepSeek会如此之火? 本文分享自华为云社区 《DeepSeek带来的Deepshock,一次看懂DeepSeek》 ,作者:王同学 2025年初,为什么DeepSeek会一夜火出圈?为什么会让行业兴奋?它的出现,是否让大模型对GPU/NPU的算力需求还要那么大?本文从几个维度尝试分析一下。 Dee...

gh-ost 扩展 MySQL 字段失败?看看 ChatDBA 和 DeepSeek 都怎么说?

gh-ost 扩展 MySQL 字段失败?看看 ChatDBA 和 DeepSeek 都怎么说?

社区王牌专栏《一问一实验:AI 版》改版以来已发布多期(51-60),展现了 ChatDBA 在多种场景下解决问题的效果。 下面让我们正式进入《一问一实验:AI 版》的第 61 期,看看 ChatDBA 最新效果以及与热门大模型 DeepSeek 的对比效果。 问题 一个 gh-ost 的使用故障 使用 gh-ost 根据将 MySQL 表字段进行长度扩展,...

大模型推理服务全景图

大模型推理服务全景图

作者:望宸 随着 DeepSeek R1 和 Qwen2.5-Max 的发布,国内大模型推理需求激增,性能提升的主战场将从训练转移到推理。 由于无论是训练还是推理,如何提升性能都是业内讨论最多的话题之一。为什么是性能呢?做过在线业务工程化的人都知道,性能的提升,直接带来的效果有两个: 计算资源成本的下降,更便宜 客户端体验的提升,内容生成更快 在大模型消耗计...

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

用户登录
用户注册