首页 文章 精选 留言 我的

文章列表

共 185510 篇
LLM 推理优化探微 (1) :Transformer 解码器的推理过程详解

LLM 推理优化探微 (1) :Transformer 解码器的推理过程详解

编者按:随着 LLM 赋能越来越多需要实时决策和响应的应用场景,以及用户体验不佳、成本过高、资源受限等问题的出现,大模型高效推理已成为一个重要的研究课题。为此,Baihai IDP 推出 Pierre Lienhart 的系列文章,从多个维度全面剖析 Transformer 大语言模型的推理过程,以期帮助读者对这个技术难点建立系统的理解,并在实践中做出正确的...

PolarDB-X 最佳实践系列(四):如何设计一张订单表

PolarDB-X 最佳实践系列(四):如何设计一张订单表

本文主要内容是如何使用全局索引与CO_HASH分区算法(CO_HASH),实现高效的多维度查询。 淘宝订单号中的秘密 有一个很有趣的事情。 打开你的淘宝客户端或者PC端的淘宝,点开订单列表,打开几个订单,查看他们的订单号,你会发现什么? 比如这是我最近的3个订单,和10年前的3个订单。其订单号分别是: 1249511065364414810 123882...

RustRover 中最常见的 Rust 编译器错误(下)| 技术解析

RustRover 中最常见的 Rust 编译器错误(下)| 技术解析

在上期博客中,我们根据 RustRover 的使用数据深入分析了 10 大最常见 Rust 编译器错误中的后 5 个。在本部分中,我们将探讨最常发生的前 5 大错误,并对 Rust 编程语言中最容易使开发者与编译器产生“冲突”的方面进行一些更总体的观察。 常见错误 #5:E0433(使用了未声明的 crate、模块或类型) 这个错误类似于上一部分中谈到的 E...

讯飞发布星火认知大模型 V3.5

讯飞发布星火认知大模型 V3.5

讯飞昨天举办新品发布会,正式发布了星火认知大模型 V3.5,其在逻辑推理、语言理解、文本生成、数学答题、代码、多模态等核心能力均显著提升。 据了解,星火认知大模型 V3.5 带来七大能力提升,文本生成提升 7.3%,语言理解提升 7.6%,知识问答提升 4.7%,逻辑推理提升 9.5%,数学能力提升 9.8%,代码能力提升 8.0%,多模态能力提升 6.6%...

国产数据迁移同步工具 CloudCanal v3.3.4.0 发布

国产数据迁移同步工具 CloudCanal v3.3.4.0 发布

CloudCanal免费社区版是ClouGence公司推出的一款全自研、可视化、自动化数据迁移同步工具,具备结构迁移、数据迁移、数据同步、数据校验、数据订正等功能,支持30+ 款流行关系型数据库、实时数仓、消息中间件、缓存数据库和搜索引擎之间数据互通,其中包含国产数据库OceanBase,PolarDB,TiDB,StarRocks,Doris,Rocket...

阿里云推出 3.x Java 探针,解锁应用观测与治理的全新姿势

阿里云推出 3.x Java 探针,解锁应用观测与治理的全新姿势

作者:张铭辉、泮圣伟 前言 随着春节大促即将到来,为了确保线上业务高效稳定地运行,电商企业大多会对旗下关键业务应用进行多轮测试。通过模拟线上较高流量的请求,来观察服务性能的实际表现。以某企业的业务测试报告举例: 图 1 压测报告显示,成功率非常低,且全局接口成功率都很低 通过报告可以看到: 当应用所承受的流量增加至特定临界点时,请求成功率大幅下降,导致整个测...

简单一招竟把 nginx 服务器性能提升 50 倍

简单一招竟把 nginx 服务器性能提升 50 倍

需求背景 接到重点业务需求要分轮次展示数据,预估最高承接 9w 的 QPS,作为后端工程师下意识的就是把接口写好,分级缓存、机器扩容、线程拉满等等一系列连招准备,再因为数据更新频次两只手都数得过来,我们采取了最稳妥的处理方式,直接生成静态文件拿 CDN 抗量 架构流程大致如下所示: 数据更新后会重新生成新一轮次的文件,刷新 CDN 的时候会触发大量回源请求,...

streampark+flink一键整库或多表同步mysql到doris实战

streampark+flink一键整库或多表同步mysql到doris实战

streampark+flink一键整库或多表同步mysql到doris实战,此应用一旦推广起来,那么数据实时异构时,不仅可以减少对数据库的查询压力,还可以减少数据同步时的至少50%的成本,还可以减少30%的存储成本; streampark搭建 二进制包编译构建 编译构建二进制可执行包,使用自己构建的二进制包构建Docker镜像,需要准备一台Linux的服务...

Jedis连接池究竟是何物?

Jedis连接池究竟是何物?

一、前言 连接池的用途实际上有过开发经验的朋友都已经比较清楚了,当资源对象的创建/销毁比较耗时的场景下,可以通过"池化"技术,达到资源的复用,以此来减少系统的开销、增大系统吞吐量,比如数据库连接池、线程池、Redis 连接池等都是使用的该方式,而我们在开发场景中使用较为广泛的 Jedis 就是使用了 GenericObjectPool 作为它底层的连接池实现...

如何筑造数据安全边界

如何筑造数据安全边界

本文分享自华为云社区《【云享问答】第6期:如何筑造数据安全边界?》,作者: 华为云社区精选。 当前AI技术的快速发展,大模型、大数据正在加速对海量多样化数据的应用。数据已经成为核心资产,而数据安全和隐私保护的重要性也日益凸显。数据脱敏作为数据安全管控体系的关键环节,能够有效地保护敏感数据的安全。为了满足开发者对于数据脱敏的需求,GaussDB(DWS) 动态...

Apache DolphinScheduler 技术详解进阶(资源中心)

Apache DolphinScheduler 技术详解进阶(资源中心)

本文介绍了Apache DolphinScheduler的内置参数及其用于调度的应用,包括基础和衍生参数的使用方法。 此外,文章还详细阐述了如何在 DolphinScheduler 中引用依赖资源,例如使用资源中心管理文件和引用脚本,以 Shell 任务为例进行说明。 内置参数 DolphinScheduler提供了一些时间相关的系统参数,方便定时调度使用。...

分析了 1.5 亿行代码发现:AI 编程助手降低代码质量

分析了 1.5 亿行代码发现:AI 编程助手降低代码质量

摘要 2023 年是 GitHub Copilot 大放异彩的一年。在短短不到两年的时间里,这款 AI 编程助手已从一个初步的原型迅速成为众多开发者和企业中不可或缺的重要工具 [1]。它的迅猛发展开启了编写代码的新纪元。 GitHub 已经发布了数份关于 AI 如何影响软件开发的增长和影响的研究。他们的一项重要发现是,开发者在使用 Copilot 时,编码速...

Opera 将推出全球首款非 WebKit 内核的 iOS 浏览器

Opera 将推出全球首款非 WebKit 内核的 iOS 浏览器

昆仑万维旗下海外信息分发与元宇宙平台 Opera 近日宣布,将为欧洲的iPhone和iPad用户带来一款基于自研引擎的全新AI浏览器“Opera One”。 Opera计划于3月份首次亮相这款新浏览器,届时DMA(欧洲数字市场法案)将生效。由于这些变化仅在欧盟实施,Opera强烈鼓励苹果将这些增强功能推广至全球iOS用户。 为了遵守DMA,苹果决定允许开发者...

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

用户登录
用户注册