首页 文章 精选 留言 我的

文章列表

共 187957 篇
SiliconCloud公测上线,每人免费送3亿Token

SiliconCloud公测上线,每人免费送3亿Token

随着模型能力的不断提升,不少开源大模型在诸多维度上已能媲美GPT4这类顶尖闭源模型,这也让它们能胜任多数生成式AI应用场景,更多开发者也开始基于开源大模型开发应用。 作为坚定看好开源大模型发展的AI Infra公司,硅基流动(SiliconFlow)顺势而为。 今天,我们推出集合主流开源大模型的一站式云服务平台SiliconCloud,为开发者提供更全面、更...

LLM Serving 有效吞吐量的最大化实现

LLM Serving 有效吞吐量的最大化实现

如今的LLM应用具有多样化的时延要求。例如,聊天机器人可能需要快速的初始响应(例如,少于0.2秒),但在解码速度上只需要匹配人类阅读速度,而代码补全则需要快速的端到端生成时间,以实现实时代码建议。 本文说明了优化吞吐量(throughput)的现有serving系统,在时延标准下并不是最优选择。作者主张使用有效吞吐量(goodput),即符合服务等级目标(S...

一站式链路追踪:阿里云的端到端解决方案

一站式链路追踪:阿里云的端到端解决方案

作者:涯海 炎炎夏日,当你打开外卖 APP 购买奶茶却发现下单失败;五一佳节,当你自驾游途中发现导航响应缓慢,频繁错过路口;深更半夜,当你辅导孩子功课,却发现 GPT 应用迟迟无法应答。不知你有没有想过,这些程序运行的背后到底是怎样的世界,每一次点击,每一次交互,又到底发生了什么? 如果你是一名 SRE,是否会关注系统的性能瓶颈在哪里?如果你是一名 AppO...

State 微调、PointRWKV、中文文档上线……RWKV 社区 5 月最新动态来啦!

State 微调、PointRWKV、中文文档上线……RWKV 社区 5 月最新动态来啦!

大家好,这里是我们组织的新栏目:RWKV 社区最新动态,这个栏目会不定期播报 RWKV 社区的最新消息,以帮助 RWKV 的关注者、爱好者、开发者更好地了解 RWKV 的发展情况。 《RWKV 社区最新动态》是不定期更新,所以请保持关注我们的公众号(RWKV 元始智能)、QQ 频道(RWKV)等公开的消息平台,以获取最新的消息。 本期节目统计了 RWKV 社...

不需要数据的数据库

不需要数据的数据库

数据库的众多优点之一是它们通常试图将数据在内部的表示方式(例如在磁盘上)与数据使用方式分开。甚至 不将数据存储在运行查询的同一硬件上已成为常态。 数据库在这方面已经做得非常出色,以至于这个术语现在几乎具有误导性。“数据库”暗示着某种坚固的东西,没有它数据就会消失。但数据始终存在,只是无名硬盘上的一些位。现代数据库提供的结构和可访问性完全独立于硬盘而存在。没错...

记 Codes 研发管理平台 —— 日报与工时融合集中式填报的创新实现

记 Codes 研发管理平台 —— 日报与工时融合集中式填报的创新实现

继上一回合生成式全局看板的创新实现后,本篇我们来讲一讲日报与工时融合集中式填报的创新实现。 市面上所有的研发管理软件,大多都有工时相关功能,但是却没有日报功能,好像也没什么问题,但是在使用过程中体验非常不好,为什么呢? 项目管理对于基层工作人员来说,主要解决这三个问题:开展我的工作、协作我们的工作和汇报我的工作,也就是说日常的汇报也是刚需。平台没有日报就会有...

Bun 的五月更新:性能提升与内存优化

Bun 的五月更新:性能提升与内存优化

在刚刚过去的五月,Bun团队只发布了三个小版本更新(v1.1.8、v1.1.9和v1.1.10),在不断优化性能和提升稳定性的同时,也为开发者带来了许多新的功能和改进。这些更新不仅修复了大量的bug,还对关键功能进行了显著的优化,尤其是fetch函数的内存使用效率。 主要更新内容概述 这三次更新总共修复了超过140个bug,涉及从Windows平台稳定性到N...

在任何云上运行 云的可移植性你考虑过吗

在任何云上运行 云的可移植性你考虑过吗

云可移植性是构建可扩展、有弹性、云原生应用程序的一种策略。谈到云原生*通常也会暗含地考虑到云的可移植性。云原生是一种应用程序开发和部署架构方法*可最大限度利用云计算资源的弹性和敏捷性。然而*当团队开始使用单一云平台*并围绕这个平台的供应商所提供的专用工具和托管服务进行构建时*很快就会面临供应商锁定的局面。 延伸阅读*了解 Akamai cloud*compu...

PDM —— 现代 Python 包管理器

PDM —— 现代 Python 包管理器

PDM 是一个现代的 Python 包管理器,支持 PEP 最新标准。 主要特性 支持PEP 582,完全不需要虚拟环境。 一个简单且相对快速的依赖解析器,特别是对于大的二进制包发布。 兼容PEP 517的构建后端,用于构建发布包(源码格式与 wheel 格式) 灵活且强大的插件系统 PEP 621元数据格式 功能强大的用户脚本 像pnpm一样的中心化安装缓...

PieCloudDB Database Flink Connector: 让数据流动起来

PieCloudDB Database Flink Connector: 让数据流动起来

面对客户环境中长期运行的各种类型的传统数据库,如何优雅地设计数据迁移的方案,既能灵活地应对各种数据导入场景和多源异构数据库,又能满足客户对数据导入结果的准确性、一致性、实时性的要求,让客户平滑地迁移到 PieCloudDB 数据库生态,是一个巨大的挑战。PieCloudDB Database 打造了丰富的数据同步工具来实现数据的高效流动,本文将聚焦 PieC...

快手上线自研文生图大模型“可图”,参数规模达十亿级

快手上线自研文生图大模型“可图”,参数规模达十亿级

界面新闻从多位知情人士处获悉,快手自研文生图大模型“可图”已于近日正式对外开放。“可图”大模型目前支持文生图和图生图两类功能,可用于AI创作图像以及AI形象定制。用户可通过“可图”微信小程序和网页版使用,这也是快手首次将其自研的系列大模型对外开放。 “可图”大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研AI技术合成,覆盖了常见的千万级中...

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

WebStorm

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源,继承了IntelliJ IDEA强大的JS部分的功能。

用户登录
用户注册