首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://my.oschina.net/vivotech/blog/18181972

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

得物自研DGraph4.0推荐核心引擎升级之路

一、前言 DGraph是得物自主研发的新一代推荐系统核心引擎,基于C++语言构建,自2021年启动以来,经过持续迭代已全面支撑得物社区内容分发、电商交易等核心业务的推荐场景。DGraph在推荐链路中主要承担数据海选和粗排序功能,为上层精排提供高质量候选集。 核心技术特性: 索引层 - 支持KV(键值)、KVV(键-多值)、INVERT(倒排)、DENSE-KV(稠密键值)等。索引存储支持磁盘 & 内存两种模式,在预发等延迟压力低场景,通过磁盘索引使用低规格服务器提供基本服务。线上场景使用内存索引保证服务稳定性,提供毫秒级延迟响应。索引更新支持双buff热更新【内存足够】、服务下线滚动更新【内存受限】、Kafka流式数据实时更新等三种模式。 查询层 - 支持向量检索IVF & HNSW、键值(KV)查询、倒排检索、X2I关联查询、图查询。对外提供JavaSDK & C++ SDK。 系统依赖架构: 索引全生命周期管理由得物索引平台DIP统一管控。 服务发现基于ZooKeeper(zk)。 集群资源调度基于得物容器平台,目前已经支持HPA。 服务规模: 目前在线10...

能否将扩散模型思想应用于 LLMs 领域?大型语言扩散模型(LLDM)详解

编者按: 当你面对需要高质量逆向推理能力的应用场景时,传统大语言模型是否让你感到力不从心?在诗歌逆向补全、逻辑逆向推导等任务中,为什么即使是 GPT-4o 这样的强大模型也会表现失常? 文章深入介绍了 LLaDA(Large Language Diffusion with mAsking) 这一创新模型的工作原理、训练过程与性能表现。与传统自回归模型不同,LLaDA 借鉴了计算机视觉领域的扩散模型思想,通过逐步去除掩码来生成文本,而非从左到右逐个生成 token。 性能测试显示,8B 参数的 LLaDA 基础模型明显优于同等规模的 LLaMA 2,并与 LLaMA 3 表现相当。更令人惊喜的是,LLaDA 在逆向推理任务中表现出色,有效解决了自回归模型在"逆向诅咒"上的局限性,甚至在诗歌逆向补全任务中超越了 GPT-4o 和 Qwen 2.5。 作者 | AI Papers Academy 编译 | 岳扬 在这篇文章,我们将对《Large Language Diffusion Models》这篇论文进行解析,介绍首个基于扩散模型的 LLM,该模型可与强大的 LLM 相媲美。 Paper...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。