Gartner:2017年将有过半大数据项目不成功-低调大师

Gartner:2017年将有过半大数据项目不成功

2018-04-15 652

Gartner预测，2017年将有60%的大数据项目在试验阶段就会失败，并最终会被放弃。

在大数据正热的当下，这一结论无疑给众多的热心者泼了一道冷水。

随着企业努力在数字时代实现数据驱动，我们的生态系统正在发生重大变化。不光是企业应用程序生成的海量数据日增，在企业外部广泛的用户和难以数计连接的各种“事物”所产生的数据也呈指数级递增。这都导致企业围绕数据的洞察会变得越来越复杂。

我们不仅要问，企业在将数据资产链接到战略价值的这一过程中究竟出现了什么问题?

有专业人士认为，二者之间的主要障碍是缺乏技能或专业知识，以及技术战略与整体公司需求之间不匹配。

专业差距

我们都知道，大数据并非新近事物。早些年，当大数据处于起步阶段时，当时可用技术并不成熟。一些早期发展起来的知名网络公司，如谷歌、Facebook等不得不从根本上建立基础设施来处理相关问题。他们的成功也因此引来了更多的追随者，许多企业试图用自己基于Hadoop的大数据项目来效仿前者。

效仿的结果是，后者的IT和数据专业人员对Hadoop作为一个技术工具包能够做什么，以及对产生结果需要多少时间的预期出现偏差。Gartner的一项调查结果显示，在受访者中近半数公司缺乏部署这种技术的技能。

研究人员认为，当前大数据已经过于依赖技术。许多大数据项目之所以失败，是因为它们需要大量的前期资源，企业要为之部署刚性架构，而一旦项目进行中，其灵活性很难提高。

成功的大数据项目应该是从企业想要解决的业务问题和希望获得的价值的深刻理解开始。否则，无论企业想实现什么目标，项目都将无法达到预期或提供足够的投资回报，最终结果就会被放弃。

第二点是需要建立一支专业团队，将IT、数据科学和业务线的视角紧密结合在一起。研究人员给出的建议是，业务专家可以通过数据计划确定需要解决的主要业务挑战。IT专家可以提供访问数据和精确定位，以及执行项目所需的基础设施技能。最后，数据专家可以提供分析和提取洞察所需的数学和定量技能。围绕这些技能建立的团队对项目能否成功至关重要。

第三点是短时间值。团队越早组建，并产生具体和可衡量的价值，企业组织和高级管理层就越容易在这个项目持续投资。

而研究表明，大多数基于Hadoop的项目在这三个方面都是失败的。更多的项目太过专注于技术本身的工作。此外，难以找到足够的技能，并且需要太多的时间和精力来建立基础设施。最后，初始投资太高，交付投入时间太长，使得很难快速试验和迭代成功。

一个更好的方法

那么，是不是失败的局面就很难扭转呢?观察者留意到这样一个趋势，在大数据项目中，企业尝试通过采用基于云的数据仓库和数据湖解决方案作为Hadoop项目的替代品。从云中获得价值，而不是在基础设施建设上过多投资，会使大数据项目变得将更容易和更快。

正确的云解决方案可以避免过多的前期资本支出，而且也可以获得相对轻松和有效的扩展，并以高度管理的解决方案的形式将技术负担转移给技术供应商。

因此，如果企业自身没有足够的经验和技能，建设考虑云方案，避开成本高昂的基础设施。

本文出处：畅享网
本文来自云栖社区合作伙伴畅享网，了解相关信息可以关注vsharing.com网站。

微信关注我们

原文链接：https://yq.aliyun.com/articles/585694

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

连接HBase的正确姿势

在云HBase值班的时候，经常会遇见有用户咨询诸如“HBase是否支持连接池？”这样的问题，也有用户因为应用中创建的Connection对象过多，触发了zookeeper的连接数限制，导致客户端连不上的。究其原因，都是因为对HBase客户端的原理不了解造成的。本文简单介绍HBase客户端的Connection对象与socket连接的关系，并给出Connection的正确用法。 Connection是什么在云HBase用户中，常见的使用Connection的错误方法有：（1）自己实现一个Connection对象的资源池，每次使用都从资源池中取出一个Connection对象；（2）每个线程一个Connection对象。（3）每次访问HBase的时候临时创建一个Connection对象，使用完之后调用close关闭连接。从这些做法来看，这

2018-04-14

856

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/beliefer/article/details/78549991 前言 HiveThriftServer2是Spark基于HiveServer2实现的多Session管理的Thrift服务，提供对Hive的集中式管理服务。HiveThriftServer2作为Yarn上的Application，目前只支持yarn-client模式——即Driver运行在本地，ApplicationMaster运行在NodeManager所管理的Container中。yarn-client模式相较于yarn-cluster模式，在Driver和ApplicationMaster之间引入了额外的通信，因而服务的稳定性较低。为了能够提高HiveThriftServer2的可用性，打算部署两个或者多个HiveThriftServer2实例，最终确定了选择HA的解决方案。网上有关HiveThriftServer2的HA实现，主要借助了HAProxy、Nginx等提供的反向代理和负载均衡功能实现。这种方案有个问题...

2018-04-15

615

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。