是数据中心定义了DCIM
好的DCIM软件应该是款有价值的工具,帮助管理运营,并对即将发生的问题进行告警,几乎无需人力投资。它还能做更多事情,但首先你得HOLD住它。
所有的数据中心基础架构监控管理DCIM工具都有一个共同点:数据。但是一款能告知你所有关于数据的事的DCIM产品,还能与你分享更多你想知道的事情。
没有人能准确定义DCIM,或者精准解释它能做什么。为什么?每款工具都不同,而他们监控的数据中心基础架构很广泛。除了基础的告警,还有其他更多的细节信息。它非常实用充分利用输入的人员支持运营。数据中心很复杂,能从DCIM工具受益,但要选择对工具才行。
在DCIM之前,数据中心运营者知道温度在升高、冷却单元失效或者UPS分流就很开心了。现在,服务器、空调、UPS系统、制冷设备、移动式插座与其他所有设备的运行情况与状态都清晰明了。处于能效与可靠性的目的,管理数据中心很重要。但是设备设计者显然考虑到由于256是一个很好的二进制数字,他们就该充分利用每一个数字节点,无论重要与否。用“太多信息”描述DCIM很方便。
真是这样么?我们可以轻松获取大量数据让人们去消化,但我们真的需要那么多的信息么?数据与信息之间是有差别的。数据是每一笔交易,而信息是对数据点的图形描述,例如一面红旗。
你的DCIM工具应该完成同样的任务。包捕获的不仅是基础数据,还包括IT资产追踪功能,这非常有用,但这些不是主要的销售卖点,或作出购买决策的原因。好的DCIM产品可以将大量的性能数据转换成实际的管理信息。定义好的DIM包的是目标的完成程度,而这是评估一款工具时最该考虑的。
如果DCIM工具最重要的任务不是收集数据,而是将其浓缩成有用的信息,那什么使得信息更有用呢?
从一个数据中心到另一个,有用的监控输出会不同,严重依赖于所监控的事物,以及实际上可用的数据。同样,考虑谁在使用与维护该工具。
每个DCIM产品提供标准的图形用户界面GUI。主屏应该具有逻辑性,让任何用户都能快速抓取至少85%的显示信息。如果无法做到,它就不是直观设计的,也没你想要的GUI。在紧急情况下,几乎任何人都能够知晓什么出错了,即使他们没有使用DCIM系统,或进行过培训。好的DCIM工具也应该基于所有数据产生简单易懂的趋势,并且在关键系统崩溃之前提供告警。
维护DCIM应该不是一份全职工作。在数据中心,人员配备十分紧凑。如果花费太多时间维护DCIM,投入的回报就很低。维护时间是DCIM设计的部分功能,但它也能造成超买一个系统。
一个强健的DCIM应该是模块化的。可以根据自身需求组装模块。用顺手了,在添加模块时评估效用、成本与维护需求。
作者:何妍
来源:51CTO

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
知乎张瑞: 浅析机器学习理论与实践 | 业界对话
张瑞,研究生毕业于北京邮电大学,毕业后一直从事搜索引擎及自然语言处理方向的研发工作。曾就职于百度及豌豆荚。现任知乎机器学习团队负责人。 特约记者丨杨润琦(南京大学),刘冲(北京邮电大学) 杨润琦:能否和我们介绍一下知乎的机器学习团队?目前主要负责哪些方面的工作和任务呢? 张瑞:我们团队是一个横向的功能团队,也就是说整个知乎平台上用到的机器学习场景都会交给我们团队负责,也包括建设一套完整的机器学习栈。我们将所有的应用场景分为两大模块,六大方向。两大模块分别是基础数据和基础技术,另一个是和业务相关的,用于改善内容流通和产品体验。 基础数据和基础技术主要包含用户画像和内容分析两部分工作。首先用户画像我们会根据用户的交互行为、回答问题、自身资料等数据挖掘其社会学属性、兴趣爱好等等,也会根据其问答行为对其在某个领域的权威度进行分析。其次内容分析部分主要是针对知乎上面所有的内容(包括文本、图像、音视频等)建立一套完善的内容分析流水线。 一般所有发送到知乎上面的内容都会在发布的第一瞬间通过该实时计算框架,结合自然语言处理、图片识别、或者音视频降噪等技术进行一个基础但是很重要的分析工作。比如说文本类内...
- 下一篇
浪潮存储双活解决方案:抓住数据的命脉
随着"互联网+"与产业融合的深入,越来越多企业把应用、数据、系统进行集中处理,数据大集中的同时更面临极大数据安全风险,企业对业务连续性的需求越来越迫切,数据库、虚拟化及其它重要业务系统环境均以集群和HA方式提供了业务连续性保障;而集群或HA所依赖的共享存储系统成为IT架构中的最后一个单点故障。 3电,口 1、客户"特烦恼":数据灾难如何恢复? 突发事件造成的非计划宕机的事件不可避免,尤其是企业集中化管理的数据中心,如下图是Business Continuity QuickPoll的大数据分析结果,对各种行业及突发事件发生后所花的时间进行详细分析得出的结论。 由上图可以看出,非计划宕机时间在10小时以内的用户约为71%,其它用户宕机恢复时间则要达到10小时以上,甚至部分用户的数据是不能被恢复的。非计划宕机的恢复时间直接影响着企业的隐形成本,宕机时间越长则隐形成本越高;过长的非计划宕机恢复时间对于企业是致命的。 灾难突发时如何保障企业核心业务7*24小时业务连续性,如何在IT层面保护社会效益和经济效益,核心还是在于共享存储数据安全。当前,保障数据安全的先进手段,莫过于双活数据中心的搭建。 ...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS关闭SELinux安全模块