Logstash + DataHub + MaxCompute/StreamCompute 进行实时数据分析-低调大师

Logstash + DataHub + MaxCompute/StreamCompute 进行实时数据分析

2016-10-17 817

Logstash是一款开源日志收集处理框架，有各种不同的input、filter、output插件，用户使用这些插件可以将各种数据源导入到其他系统。
logstash-output-datahub插件，实现将数据导入DataHub的功能，通过简单的配置即可完成数据采集和向DataHub的传输任务。
结合StreamCompute(Galaxy)用户可以方便的完成流式数据从采集，传输，开发到结果数据存储与展示的整套解决方案。
同时，还可以通过创建Collector同步任务将数据同步到MaxCompute(ODPS),之后在MaxCompute上进行完备的数据开发工作。

接下来，会将各个流程步骤在文章中作详细描述，以帮助用户使用Logstash＋DataHub＋StreamCompute/MaxCompute快速构建起自己的流式数据应用。

数据

微信关注我们

原文链接：https://yq.aliyun.com/articles/61766

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

后Hadoop时代，我们该如何去架构自己的大数据平台

过去数年，大数据开源生态圈完成了从无到有的转变，时下更是各种技术框架林立——从收集到处理，一直到数据可视化和储存，每个点都或多或少存在多个不同的替代方案。那么，在这个Hadoop已经不是唯一的时代，企业又该如何选择开源大数据技术，来架构一个稳定可靠的大数据平台？ 2016年10月27日，云栖社区特邀请了kyligence创始人兼CEO韩卿 & 阿里云技术专家曹龙与大家一起共同探讨这个问题，点击这里直接报名。 Hadoop老矣？对于大数据玩家来说，Hadoop绝不陌生，正式立项于2006年，Doug Cutting在GFS和MapReduce启发下开发，开源大数据领域的开辟者，也奠定了大数据技术高速发展的根基。天生高贵，Hadoop一度是开源大数据的绝对霸主，也是时下装机量最高的大数据框架，那么“后Hadoop”时代又从何而来？开源大数据生态繁花似锦随着互联网，特别是移动互联网的高速发展，越来越多入网设备对企业原有基础设施造成了严峻挑战；而在这之外，大量设备带来的海量数据同样让这些企业有了从中提取洞见并指导实践的可能。因此在这两个需求的刺激下，大量针对具体业务场景的技术被...

2016-10-16

892

文章转自ruanxi 前言在《数据库系统中的Code Generation技术介绍》一文中，我们阐述了代码的CPU执行效率对于大规模分布式OLAP系统的重要性。现在简单总结如下： OLAP系统中查询往往比较复杂，比如多表Join, 各种聚合函数以及窗口函数，其中涉及大量的Hash计算（比如采用Hash Join, Hash Aggregation），排序（比如采用Merge-Sort Join）操作，CPU开销比较大。 SSD等高性能存储硬件的使用，以及内存计算的普及（比如Spark中利用RDD来Cache部分数据）大大提高了I/O性能，使得CPU日益成为计算的瓶颈。在大规模分布式OLAP系统中（比如MaxCompute），因为需要实现分布式Join，聚合以及窗口函数，一个作业可能会由多级Task组成，Task与Task之间可

2016-10-17

779

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。