首页 文章 精选 留言 我的

文章列表

共 183065 篇
实现 LLM 应用的可观测,难在哪里?

实现 LLM 应用的可观测,难在哪里?

随着生成式 AI 概念的火爆,以 ChatGPT、通义大模型为代表,市场上涌现了一系列商用或者开源的大模型,同时基于大语言模型(LLM )以及 AI 生态技术栈构建的应用以及业务场景也越来越多。 众所周知,LLM 包含数十亿甚至万亿级别的参数,其架构复杂,训练和推理涉及大量计算资源。这些特性使得它们在实际应用中可能表现出意料之外的行为,同时也带来了性能、安全...

JetBrains IDE 年度第二个大版本 (2024.2) 采用全新默认 UI

JetBrains IDE 年度第二个大版本 (2024.2) 采用全新默认 UI

JetBrains IDE 即将发布年度第二个大版本更新 2024.2,根据官方公告,他们会在该版本中为所有 IDE 启用全新默认 UI,其主要变化包括简化的主工具栏、新的工具窗口布局、新的主题和图标。 JetBrains 团队介绍称,设计新 UI 目标是为了降低 IDE 的视觉复杂性,提供对基本功能的便捷访问,并根据用户需要逐步展示更复杂的功能 —— 进而...

搞大模型,没有重排工具怎么行?

搞大模型,没有重排工具怎么行?

在说重排工具之前,我们要先了解一下 RAG。 检索增强生成(RAG)是一种新兴的 AI 技术栈,通过为大型语言模型(LLM)提供额外的“最新知识”来增强其能力。 基本的 RAG 应用包括四个关键技术组成部分: Embedding 模型:用于将外部文档和用户查询转换成 Embedding 向量 向量数据库:用于存储 Embedding 向量和执行向量相似性检索...

weops-lite v1.0 正式发布,轻量化运维平台

weops-lite v1.0 正式发布,轻量化运维平台

一、项目概述 随着信息技术的飞速发展,企业的 IT 基础设施日益复杂,运维管理变得更加重要和具有挑战性。为了帮助企业高效地管理其 IT 资产与运维流程。本项目旨在通过全面的资产管理、强大的凭据管理和快速的全文检索功能,协助运维人员提升工作的效率和准确性。 项目地址:https://gitee.com/weops-lab/weops_lite 二、主要功能 本...

搜索广告召回技术在美团的实践

搜索广告召回技术在美团的实践

本文整理自美团技术沙龙第81期《美团在广告算法领域的探索及实践》(B站视频)。首先介绍了美团搜索广告的三个阶段:多策略关键词挖掘、分层召回体系、生成式召回;然后重点介绍了生成式关键词召回、多模态生成式向量召回、生成式相关性判断在美团的实践。最后是一些经验分享及总结,希望能对大家有所帮助或启发。 美团搜索广告介绍 从美团流量场景角度来看,美团搜索广告分为两大类...

深入了解软件测试:从入门到奥秘,揭开测试的精髓

深入了解软件测试:从入门到奥秘,揭开测试的精髓

最新技术资源:(建议收藏) https://www.grapecity.com.cn/resources/ 前言 在软件开发的世界中,软件测试是不可或缺的一部分。它是确保软件质量、功能完整性和用户满意度的关键环节。本文小编将为大家介绍各类软件测试的奥秘,并提供入门级的指导和见解。 本文内容概要: 软件测试是什么? 黑盒测试vs白盒测试 自动化测试vs手工测试...

微软和苹果放弃 OpenAI 董事会观察员席位

微软和苹果放弃 OpenAI 董事会观察员席位

英国《金融时报》最新报道称,在 OpenAI 面临监管审查之际,微软公司和苹果公司已决定不再加入该公司的董事会。 微软是 OpenAI 的最大投资者,在去年 11 月获得了其董事会观察员席位,并于本周二宣布放弃了这一职位。此前曾有报道称苹果将担任 OpenAI 董事会观察员,但消息称苹果公司也已经改变了主意。 微软副总法律顾问 Keith Dolliver ...

GaussDB关键技术原理:高性能(五)

GaussDB关键技术原理:高性能(五)

GaussDB关键技术原理:高性能(四)从USTORE存储引擎、计划缓存计划技术、数据分区与分区剪枝、列式存储和向量化引擎、SMP并行执行等五方面对高性能关键技术进行解读,本篇将从LLVM动态查询编译执行、SQL-BYPASS执行优化、线程池化、多核处理器优化、日志无锁刷新与多级流水等方面继续介绍GaussDB高性能关键技术,并对高斯数据库性能优化进行总结。...

Apache Doris + Apache Hudi 快速搭建指南|Lakehouse 使用手册(一)

Apache Doris + Apache Hudi 快速搭建指南|Lakehouse 使用手册(一)

作者:SelectDB 技术团队 导读:湖仓一体(Data Lakehouse)融合了数据仓库的高性能、实时性以及数据湖的低成本、灵活性等优势,帮助用户更加便捷地满足各种数据处理分析的需求。在过去多个版本中,Apache Doris 持续加深与数据湖的融合,已演进出一套成熟的湖仓一体解决方案。为便于用户快速入门,我们将通过系列文章介绍 Apache Dori...

 通用代码生成器模板体系,域对象,枚举和动词算子

 通用代码生成器模板体系,域对象,枚举和动词算子

通用代码生成器模板体系,域对象,枚举和动词算子 通用代码生成器或者叫动词算子式通用目的代码生成器是一组使用Java编写的通用代码生成器。它们的原理基于动词算子和域对象的笛卡尔积。它们没有使用FreeMarker和或者Velocity等现成的文件式模板引擎。而是使用java语言开发了一套专门为动词算子式代码生成器使用的模板API。 组成通用代码生成器模板的概念...

基于Rspack实现大仓应用构建提效实践|得物技术

基于Rspack实现大仓应用构建提效实践|得物技术

一、实践背景 随着项目的逐步迭代,代码量和依赖的逐渐增长,应用的构建速度逐步进入缓慢期。以目前所在团队的业务应用来看(使用webpack构建),应用整体构建耗时已经普遍偏高,影响日常开发测试的使用效率,其中编译耗时大约占50%。 实际上随着近些年前端的技术发展以及业务对前端交互体验的要求提高,前端整个代码量复杂度和代码量增长飞快。随着这一趋势的变化,服务于前...

探索大模型:袋鼠云在 Text To SQL 上的实践与优化

探索大模型:袋鼠云在 Text To SQL 上的实践与优化

Text To SQL 指的是将自然语言转化为能够在关系型数据库中执行的结构化查询语言(简称 SQL)。近年来,伴随人工智能大模型技术的不断进步,Text To SQL 任务的成功率显著提升,这得益于大模型的推理、理解以及指令遵循等能力。 对于大数据平台来说,集成 Text To SQL 功能意义非凡。首先,这能够大幅优化用户体验;其次,Text To SQ...

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。