# Apache Spark系列技术直播# 第七讲【大数据列式存储之 Parquet/ORC 】-低调大师

# Apache Spark系列技术直播# 第七讲【大数据列式存储之 Parquet/ORC 】

2018-12-25 743

主讲人：诚历（孙大鹏）阿里巴巴计算平台事业部EMR技术专家

简介：Parquet 和 ORC 是大数据生态里最常用到的两个列式存储引擎，这两者在实现上有什异同，哪个效率更好，哪个性能更优，本次分享将和您一起探索两大列式存储。

ppt链接：https://yq.aliyun.com/download/3234

视频链接：https://yq.aliyun.com/live/785

加入Apache Spark中国技术交流钉钉群与大牛交流经验

微信关注我们

原文链接：https://yq.aliyun.com/articles/682793

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

日志上云利器 - Aliyun LOG Java Producer

背景日志无处不在，它作为记录世间万物变化的载体，在运维、研发、运营、安全、BI、审计等领域有着广泛的应用场景。阿里云日志服务是日志类数据的一站式服务平台，其核心组件 LogHub 凭借着高吞吐、低延迟、可自动伸缩等特性，逐渐成为大数据处理领域特别是实时数据处理场景下的基础设施。那些运行在 Flink、Spark、Storm 等大数据计算引擎中的任务往往会将数据处理结果或中间结果实时写入 LogHub，下游系统基于 LogHub 中的数据提供查询分析、监控告警、机器学习、迭代计算等能力。下图展示了面向 LogHub 的大数据处理系统架构图。要让整个系统稳定地运行，提供便捷高效的数据写入手段是前提。直接使用 API 或 SDK 往往无法满足大数据场景下对数据写入能力的要求，在这样的背景下 Aliyun LOG Java Produce

2018-12-25

935

Spark2.4.0 SparkEnv 源码分析更多资源 github: https://github.com/opensourceteams/spark-scala-maven-2.4.0 时序图前置条件 Hadoop版本: hadoop-2.9.2 Spark版本: spark-2.4.0-bin-hadoop2.7 JDK.1.8.0_191 scala2.11.12 主要内容描述 SparkEnv对象构建 SparkEnv类中做如下操作 ).new SecurityManager() ).new NettyRpcEnvFactory() ).创建NettyRpcEnv ).Utils.startServiceOnPort(启动sparkDriver) ). new BroadcastManager ).注册端点MapOutputTracker ).ShuffleManager:SortShuffleManager ).默认内存管理器：UnifiedMemoryManager ).注册端点MapOutputTracker ).SortShuffleManager ).Unif...

2018-12-25

676

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。