首页 文章 精选 留言 我的

文章列表

共 184700 篇
云原生场景下,AIGC 模型服务的工程挑战和应对

云原生场景下,AIGC 模型服务的工程挑战和应对

作者:徐之浩、车漾 “成本”、“性能”和 “效率”正在成为影响大模型生产和应用的三个核心因素,也是企业基础设施在面临生产、使用大模型时的全新挑战。AI 领域的快速发展不仅需要算法的突破,也需要工程的创新。 大模型推理对基础设施带来更多挑战 首先,AI 商业化的时代,大模型推理训练会被更加广泛的使用。比较理性的看待大模型的话,一个大模型被训练出来后,无外乎两个...

Nacos 在云原生架构下的演进

Nacos 在云原生架构下的演进

背景 Nacos 提供的最核心能力是动态服务发现与动态配置管理能力,在云原生环境下,借助云产品,如 EDAS(企业级分布式应用服务)平台中,我们可以很轻松地使用 K8s 来托管 Nacos 体系的微服务应用,同时又享有全链路流量治理、可观测、极致弹性等能力。 云原生下的应用由两个主要部分组成:不可变基础设施(代码、运行时)与配置。在这里配置是一个非常广泛的概...

ICLR 2024 录用结果公布,MetaGPT 喜提 ICLR 2024 Oral (1.2%)

ICLR 2024 录用结果公布,MetaGPT 喜提 ICLR 2024 Oral (1.2%)

一年一度的ICLR顶会录用结果公布了!今年共7000多篇投稿论文,录用率31%。 邮件显示,今年ICLR 2024组委会共收到了7262篇投稿,总体录用率约为31%,与去年相似(2023年总投稿数5000)。 其中spotlights论文的录用率为5%(约有363篇),Oral论文的录用率为1.2%(约有85篇)。 ICLR提交的论文主题大致包括:700篇有...

深入了解浮点运算——CPU 和 GPU 算力是如何计算的

深入了解浮点运算——CPU 和 GPU 算力是如何计算的

随着国家大力发展数字经济,算力的提升和普惠变得越来越重要。在数字化时代,算力已成为推动科技发展和创新的关键要素。它不仅仅是衡量计算机处理速度的标准,还涉及计算机系统或设备执行计算任务的能力、数据处理能力以及解决复杂计算问题的能力。那么算力到底是什么呢? 简单了解算力 算力(Computational Power)在计算机科学和计算领域中是一个重要概念,它指的...

如何使用GaussDB创建外表(FOREIGN TABLE)

如何使用GaussDB创建外表(FOREIGN TABLE)

目录 一、前言 二、创建外表的特点 二、GaussDB创建外表访问外部数据库表(示例) 1、创建外表 2、FAQ:CREATE USER MAPPING错误 三、GaussDB创建外表映射数据文件(示例) 1、创建数据文件 2、创建外表 3、FAQ:创建(外部服务器/外表)时报错 四、小结 一、前言 GaussDB是一个高效、可靠、安全的企业级数据库管理系统...

千万级数据深分页查询SQL性能优化实践

千万级数据深分页查询SQL性能优化实践

一、系统介绍和问题描述 如何在Mysql中实现上亿数据的遍历查询?先来介绍一下系统主角:关注系统,主要是维护京东用户和业务对象之前的关注关系;并对外提供各种关系查询,比如查询用户的关注商品或店铺列表,查询用户是否关注了某个商品或店铺等。但是最近接到了一个新需求,要求提供查询关注对象的粉丝列表接口功能。该功能的难点就是关注对象的粉丝数量过多,不少店铺的粉丝数量...

OpenSPG 新版发布:新增大模型知识抽取,3 步快速搭建专属知识图谱

OpenSPG 新版发布:新增大模型知识抽取,3 步快速搭建专属知识图谱

随着 ChatGPT 的横空出世,大模型已然成为人工智能领域的焦点。大模型在语言理解、对话生成方面表现得尤其亮眼,而知识图谱则擅长大模型所无法解决的事实性 “幻觉” 和复杂推理问题。将知识图谱和大语言模型结合起来,充分发挥各自的优势,能为用户提供更优质的人工智能服务和产品。 去年 10 月 26 日,OpenSPG 正式开源,希望和社区一起共同推动知识图谱技...

使用 Taro 开发鸿蒙原生应用 —— 快速上手,鸿蒙应用开发指南

使用 Taro 开发鸿蒙原生应用 —— 快速上手,鸿蒙应用开发指南

随着鸿蒙系统的不断完善,许多应用厂商都希望将自己的应用移植到鸿蒙平台上。最近,Taro 发布了 v4.0.0-beta.x 版本,支持使用 Taro 快速开发鸿蒙原生应用,也可将现有的小程序转换为鸿蒙原生应用。 在 《使用 Taro 开发鸿蒙原生应用》 系列文章中,我们已经介绍了 鸿蒙的基本概念 和 Taro 适配鸿蒙的原理。本文作为该系列的第三篇,将正式为...

cache 应用加速

cache 应用加速

NGINX 向云原生演进,All inOpenNJet 需求 为了节省带宽、能够快速获取资源,在中间代理服务器上,通常会配置缓存。缓存机制的基本原理是将 Web 资源(如 HTML、CSS、JavaScript、图像等)保存在客户端或中间代理服务器上,以便在后续请求中直接使用该缓存副本,而不必重新获取资源。当客户端或代理服务器收到对资源的请求时,它们首先检查...

得物云原生容器技术探索与落地实践

得物云原生容器技术探索与落地实践

一、前言 得物 App 作为互联网行业的后起之秀,在快速的业务发展过程中基础设施规模不断增长,继而对效率和成本的关注度也越来越高。我们在云原生技术上的推进历程如图所示,整体上节奏还是比较快的。 从 2021 年 8 月开始,我们以提升资源使用率和资源交付效率为目标,开始基于云原生技术建设整个服务体系的高可用性、可观测性和高运维效率,同时要保证成本可控。在容器...

Bun 1.0.23 版本发布,打包部署更便捷

Bun 1.0.23 版本发布,打包部署更便捷

Bun这个兼具运行时、打包工具、转译器和包管理器多重功能的JavaScript工具,在日前迎来了1.0.23版本的更新。本次更新针对社区反馈修复了40个bug,共计获得了194个赞。更新使Bun在打包部署等方面的易用性有所提升。 引入SQLite数据库:轻松管理数据 Bun v1.0.23的一大亮点是引入了对SQLite数据库的支持。开发者现在可以直接在Bu...

芯盛智能加入 OurBMC,携手构筑根技术存储产业

芯盛智能加入 OurBMC,携手构筑根技术存储产业

近日,芯盛智能科技有限公司签署了 CLA(Contributor License Agreement,贡献者许可协议),宣布正式加入 OurBMC 社区。 芯盛智能科技有限公司成立于 2018 年,是国内领先的固态存储控制器芯片及解决方案提供商。公司现有员工 500 余人,其中 70% 以上为研发人员,在北京、上海、成都、济南、长沙、常州等地设有分子公司及研...

浪潮计算机加入 OurBMC 社区!携手打造整机生态,推动 BMC 技术加速发展

浪潮计算机加入 OurBMC 社区!携手打造整机生态,推动 BMC 技术加速发展

近日,浪潮计算机签署了 CLA(Contributor License Agreement,贡献者许可协议),宣布正式加入 OurBMC 社区。 浪潮计算机作为专注创新技术领域、专业从事服务器、终端产品的研发生产、方案设计及实施服务的科技企业,旗下计算型、存储型、均衡型等服务器产品和台式机、笔记本等终端产品阵列丰富、性能优异,已广泛应用于政府、金融、通信、能...

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

用户登录
用户注册