首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://my.oschina.net/u/4197945/blog/5536366

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

NOC-SLA 之得物C端业务监控实践

原创|得物技术-木鱼耗子 前言 伴随公司业务快速发展,我们生产环境产品和应用越来越复杂,彼此连接依赖也越来越复杂;何一个应用出异常都有可能影响系统可用性,造成全局影响。通过去年2021年C端故障全年度来看,从故障发现,响应时间、故障应急有待提升,故NOC要优化现有的告警响应质量,制定新的NOC——SLA体系化【】‘’‘’‘拍拍拍拍拍拍拍拍拍拍拍;1. 得物交易C端介绍 1.1 C端概念 什么是C端? C端指的是消费者、个人用户Consumer;顾名思义就是面向个人用户提供服务的产品,是直接服务于用户的,得物C端分为两个场景“交易”“社区”两个组成,C端包含线上交易、社区、算法,涉及到交易下的订单、出价&库存、营销、商品,社区域前后端、算法交易推荐&社区推荐为重要依赖。 从交易角度看: 用户登陆游览商品详情在到支付购买,整个面向用户的交易流程就是交易C端业务。 从社区角度看: 用户登陆登发帖,在到社区游览点赞、互动所产生的社交就是社区C端业务。 1.2 C端出现问题会怎么样? 在2021年6中旬,商品服务异常由于技术问题导致订单连续下跌,影响用户下单购买体验。 ...

告警消息何去何从?在飞书中飞起来

作者简介 袁振,SUSE Rancher 技术支持经理,负责订阅客户售后技术支持团队,为订阅客户提供技术支持服务。2016 年开始接触容器、Kubernetes 技术,对自动化运维、Devops、Kubernetes、prometheus 和其他云原生相关技术具有较深入的研究,对 SRE 运维体系建设、SRE 运维系统架构设计有着丰富的实践经验。 背景 通过《Prometheus 监控实战》这本书,我们认识到一个良好的监控系统应该提供以下服务: 全局视角,从最高层(业务)依次展开; 协助故障诊断; 作为基础设施、应用程序开发和业务人员的信息源; 内置于应用程序设计、开发和部署的生命周期中; 尽可能的自动化,并提供自服务。 拥有良好的监控系统还不够,我们还需要一个告警消息。告警消息可以为我们提供一些指示,表明我们环境中的某些状态已经发生了变化,而且通常是一些更糟糕的情况。好的告警消息的关键应该是能够在正确的时间、以正确的理由和正确的速度发送,并且其中应该包含有用且重要的信息。 告警消息发送的目的地也成为了其中一个关键环节。从传统的 E-mail、电话、短信通知到现在层出不穷的企业办公通信...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。

用户登录
用户注册