得物算法域全景可观测性从 0 到 1 的演进之路
一、前言 在得物(Poizon)业务场景中,算法生态已演进为涵盖交易搜索、社区推荐、图像识别及广告策略的多维复杂系统。请求从Java网关下发,进入 C++ 构建的高性能算法核心(DSearch检索、DGraph图计算、DFeature特征提取等)。 随着系统复杂度的指数级增长,我们对现有系统的可观测性进行了全面梳理,为了提高稳定性,我们希望建设一个业务场景维度全链路变更事件中心, 以"聚焦做好可观测性"为核心目标,通过建设监控平台的事件中心与全链路可观测的核心产品,整合各平台资源与数据,提升系统的整体透明度和稳定性,从而提升业务稳定性和故障止血效率,为产品迭代奠定坚实的基础。 二、可观测性的"四大支柱"与联动愿景 在业界,可观测性通常被定义为Trace、Metric和Log三位一体。我们的目标是打造一套 "以场景为魂,以联动为骨" 的可观测体系,打破数据孤岛,实现算法治理的智能化转型。提出了 "四大支柱联动": Trace为径: 超越单纯的拓扑记录。通过Baggage机制,将复杂的业务语义与算法策略注入链路,实现调用流与业务流的深度耦合。 Metric为脉: 通过Trace自动生成场景...


