Hadoop何以快速成为最佳网络安全工具？-低调大师

Hadoop何以快速成为最佳网络安全工具？

2017-07-31 565

pache Hadoop 今年10岁了

这个以处理大量数据的实验做为开端的开源软件框架，已经稳步成长为以前所未有的方式解锁信息价值的成熟企业解决方案。今天，企业运用Hadoop解决各种各样的问题，从改善人类健康，到挖掘最大金融投资潜力，等等等等。10年间，业内见证了一个以Hadoop为中心的庞大生态系统的诞生和快速发展。

现代企业场景里，安全和风险从业者迅速认识到，数据洞见是理解、识别和解决企业威胁的关键。

我们开始意识到，网络安全，从很多方面上讲，就是个数据分析问题。正是由于这个原因，Hadoop，携其对海量数据的吸收、处理和分析能力，被广泛采纳来解决我们面临的各种挑战。

安全方面，Hadoop让用户可以圈住他们企业产出的所有数据。他们对网络、用户、终端乃至物联网(IoT)产生的信息都有完全的访问权——正是生产对可疑行为、异常和其他威胁指标的分析结果所需的那些东西。除此之外，Hadoop还能让企业可以利用机器学习和各种灵活的即插即用程序，无论它们来自专利产品还是开源市场。有了Hadoop，你就有了足以应付当前和新兴挑战的解决方案。

情况并不总是这样的。10年前，安全社区中很多人都觉得安全信息和事件管理(SIEM)，以及其他遗留产品就足够了。我们以为这些就能提供生产必要分析结果所需的全部相关信息，可以应对网络安全问题。但随着云、移动、分布式计算和IoT的飞速发展，我们明白了，这些系统根本不够强大到能处理所有动态数据源，也无法应付膨胀至今的巨大规模。

SIEM和其他遗留解决方案，本就不是为海量数据设计的;分析师想紧跟对手发展速度，确保有效检测能力，用这些遗留系统也肯定是获取不到所需全部分析结果或上下文的。

安全人员受制于此类工具提供的数据和分析时，解决风险的可能做法也同样被限制了。受限的功能，让我们这些负责公司防御的人，只能找到商用、已知和不怎么高级的攻击。随着Hadoop的出现，可用安全用例一下子扩展了许多。

多亏有了更大的数据集和更宽泛的可用分析技术，我们可以解答关于攻击、威胁和风险的问题了。有了Hadoop，企业可以获得用户行为分析以识别和缓解内部人威胁，标定网络中的可疑横向移动，甚至跨部门共享威胁情报。

安全人员职业生涯总是围绕着3个问题：更快的事件检测，加强事件响应，以及理解这些情况对企业的影响。有了Hadoop，所有这三点都成为了可能，因为，从设计上，Hadoop就提供对信息、分析和上下文理解的访问。

安全社区不再受单一应用风险视角的限制。Hadoop的灵活性，让团队可以获取问题的解答，而不是只能看到各安全应用和系统吐出的不同观点。值得指出的是，Hadoop处在集成专利和开源安全技术以产出全面网络安全防御的前沿。比如说，在开源方面，开放网络洞见(ONI)项目，便是采用开放数据模型和大数据分析，向Hadoop平台引入高级威胁检测解决方案的首批项目之一。

以上便是Hadoop何以快速成为网络安全工具不二之选的总体介绍。该平台还有很多实际应用，其开放性也让网络安全人员得以引入可以减少整体风险和暴露面的一系列功能。当然，这些，又是另一个值得探讨的话题了。

作者：nana

来源：51CTO

微信关注我们

原文链接：https://yq.aliyun.com/articles/187683

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

TensorFlow 与 Apache Spark 结合：雅虎开源“TensorFlowOnSpark”

雅虎昨日宣布开源 TensorFlowOnSpark。它使得深度学习框架 TensorFlow 能与 Apache Spark 中的数据集兼容。对于使用 Spark 来处理不同类型数据的机构和开发者来说，这无疑是一个好消息。TensorFlowOnSpark 的开源代码，已基于 Apache 2.0 协议在 GitHub 上发布。众所周知，深度学习有海量数据需求。雷锋网了解到，许多业内公司利用 Spark 对超大规模的数据集进行管理。让深度学习框架直接、方便地获取这部分数据，将为 ML 开发提供极大助力。雅虎在官方博客中宣布了这一消息，并解释了此前雅虎 Big ML 开发团队遇到的问题： “现有的深度学习框架，往往需要设立单独的深度学习数据组。这强迫我们为同一个机器学习流水线创建多个程序。维护多个独立的数据组，要求我们在它们之间传输

2017-07-31

693

Hive是基于Hadoop的数据仓库工具，可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理，提供了类似于SQL语言的查询语言–HiveQL，可通过HQL语句实现简单的MR统计，Hive将HQL语句转换成MR任务进行执行。一、概述 1-1 数据仓库概念数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反应历史变化(Time Variant)的数据集合，用于支持管理决策。数据仓库体系结构通常含四个层次：数据源、数据存储和管理、数据服务、数据应用。数据源：是数据仓库的数据来源，含外部数据、现有业务系统和文档资料等; 数据集成：完成数据的抽取、清洗、转换和加载任务，数据源中的数据采用ETL(Extract-Transform-Load)工具以固定的周期加载到数据仓库中。数据存储和管理：此层次主要涉及对数据的存储和管理，含数据仓库、数据集市、数据仓库检测、运行与维护工具和元数据管理等。数据服务：为前端和应用提供数据服务，可直接从数据仓库中获取数据供前...

2017-07-31

558

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。