阿里云 MaxCompute 2021-2 月刊-低调大师

阿里云 MaxCompute 2021-2 月刊

2021-03-02 1834

MaxCompute 2月新发布功能

1、MaxCompute SQLML 功能（中国区）商业化发布查看文档 >>

MaxCompute SQLML 支持使用SQL语言在 MaxCompute 中创建、训练和应用机器学习模型，实现 AI 普惠。

适用客户

各个领域的 SQL从业人员/ 数据工程师 / 数据分析师 / 数据科学家

发布功能
MaxCompute SQLML 可以让数据工程师、分析师和数据科学家使用 SQL 语言在 MaxCompute 中创建、训练和应用机器学习模型，使 SQL 从业人员利用现有的 SQL 工具和技能就能应用机器学习的能力，同时无需做数据迁移，实现机器学习的普惠。

2、MaxCompute 湖仓一体功能商业化发布查看文档 >>

MaxCompute 湖仓一体方案融合数据湖的灵活性、生态丰富性与数据仓库的企业级能力，构建数据湖和数据仓库融合的数据管理平台。

适用客户

有以下诉求企业中的 CTO / 数据平台架构师 / 大数据部门主管 / 数据开发人员等

• 已经基于 Hadoop 集群搭建数据平台，同时对集群资源弹性有需求，希望利用 MaxCompute 的弹性与大规模机器学习能力，快速迭代创新业务
• 企业有多个 Hadoop 集群，需要各个集群之间数据打通，利用 DataWorks / Dataphin 构建企业数据中台
• 以阿里云 OSS 构建数据湖应用，希望借助云数仓实现数据统一分析和管理

发布功能

MaxCompute 湖仓一体方案通过数据仓库 MaxCompute、数据湖（对象存储 OSS 或 Hadoop HDFS）共同实现。本次发布两种构建湖仓一体的方式：

• 与阿里云 OSS + DLF 构建湖仓一体能力：通过 MaxCompute 和 OSS 实现。该方式需要配套使用阿里云产品数据湖构建 DLF（Data Lake Formation）。数据湖的元数据（Schema）全部位于DLF中。MaxCompute可以利用DLF对湖数据的元数据管理能力，提升对OSS半结构化格式（AVRO、CSV、JSON、PARQUET、ORC）数据的处理能力。

• 与 Hadoop HDFS 构建湖仓一体能力：通过MaxCompute和Hadoop HDFS（包括本地机房搭建、基于云上虚拟机搭建以及阿里云 E-MapReduce等）实现。您需要填写MaxCompute湖仓一体方案使用申请表，提交申请后，MaxCompute团队技术人员会联系并协助您完成后续操作。

3、MaxCompute zOrder 排序支持与 Distribute by 共用查看文档 >>

适用客户

开发者、分析师

发布功能

在表或分区写入数据时，查询语句指定zOrder by字段，根据指定的一列或多列按zOrder 方式进行局部排序再写入，可以提高后续在排序数据上做一列或多列交互式查询时的效率。

4、MaxCompute 支持在 values 表达式中使用非常量表达式查看文档 >>

适用客户

开发者，分析师

发布功能

MaxCompute对 Valuse 表达式进行扩展。原先仅支持常量，扩展后还支持非常量表达式，便于用户在Values表达式中使用函数等非常量表达式。在生成数据，测试计算逻辑时使用更方便。使用方法示例： select * from values (udf(1)),(to_date('20190101', 'yyyyMMdd')),(getdate()),(datetime '2019-01-02 00:00:00') t(d);

5、MaxCompute SQL 支持SkewJoin Hint用于优化join时数据长尾问题查看文档 >>

适用客户

开发者

发布功能

MaxCompute SQL 支持SkewJoin Hint用于优化join时存在数据长尾问题,，加快Join的执行速度。

6、MaxCompute 推出 Freeride 及 Analyze 两种优化器元数据收集工具查看文档 >>

适用客户

开发者，分析师

发布功能

MaxCompute推出Freeride（同步）和Analyze（异步）两套优化器元数据收集工具，用于优化计算和查询性能。

7、MaxCompute 内置函数新增或增强

适用客户

开发者、分析师、开源或其他生态用户

发布功能

MaxCompute 日期函数、字符串函数、聚合函数、其他函数等内置函数新增用法或增强兼容性。

日期函数文档 >> 字符串函数文档 >> 聚合函数文档 >> 其他函数文档 >>

8、MaxCompute SQL array 数据类型处理函数新增和增强查看文档 >>

适用客户

开发者、分析师、有半结构化数据处理需求的用户

发布功能

MaxCompute 新增array_intersect函数，用于计算两个array的交集。
增强内建函数sort_array，增加isAsc参数，对给定数组排序时让用户选择是升序还是降序，默认是升序。

9、MaxCompute 外表Hive兼容模式支持用户自定义serde类查看文档 >>

适用客户

开发者，外表用户，有开源或自定义数据格式处理需求的用户

发布功能

用户可以在创建外表时使用using jar的方式，使用自定义的serde类实现外表对特殊数据格式的兼容。

10、MaxCompute 外表 OSS 写入场景能力增强查看文档>>

适用客户

开发者，有导出数据需求的用户，有使用第三方引擎读取导出的数据需求的用户

发布功能

MaxCompute 支持使用 OSS Multi-upload 写 OSS 外表，数据直写到表目录下，不包含.odps 子目录。

11、MaxCompute命令行提供关闭表头显示，便于shell调用查看文档 >>

适用客户

开发者

发布功能

MaxCompute 可以通过参数设置关闭命令行stdout输出结果的表头显示，便于用户获取动态返回值用于其他操作。

12、MaxCompute支持云HBase外部表查看文档 >>

适用客户

开发者，分析师，联邦查询用户

发布功能

MaxCompute Hbase外部表支持读写云HBase，在MaxCompute中进行数据导入、写出或联邦查询。

13、MaxCompute支持RDS外部表（公测）查看文档 >>

适用客户

开发者，分析师，联邦查询用户

发布功能

RDS是阿里云客户主要使用的数据库服务，MaxCompute支持RDS外部表对RDS (RDS MySQL 5.x)进行读写操作。

14、MaxCompute外表支持JDBC方式读写MC-Hologres（公测）查看文档 >>

适用客户

开发者，分析师，联邦查询用户，有对MaxCompute与MC-Hologres同步数据需求的用户

发布功能

MaxCompute支持创建MC-Hologres外部表，并通过JDBC方式MaxCompute读写同步MC-Hologre数据。

15、MaxCompute支持Unload语句把数据导出到OSS外部存储查看文档 >>

适用客户

开发者，分析师，对存储优化有需求的用户，在对象存储上使用其他引擎处理分析MaxCompute导出数据的用户

发布功能

MaxCompute支持Unload语句导出数据到OSS，方便用户使用OSS存储数据，并方便OSS上其他计算引擎使用导出的数据。

MaxCompute 产品官网 >>
阅读往期月刊 >>

微信关注我们

原文链接：https://yq.aliyun.com/articles/782351

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Kafka评传——从kafka的消息生命周期引出的沉思

kafka脱胎于雅虎项目，在现今的消息系统中，存在着举足轻重的意义。在笔者看来学习Kafka这款系统既有利于思考分布式消息队列的推演，也有利于发掘rabbitmq中的不足，以史为鉴可以知兴替，学习老大哥rabbitmq中的精华，摒弃其中的糟粕，提升下一代消息队列服务的性能，荣幸之至。不妨看看消息队列的官方介绍 In computer science, message queues and mailboxes are software-engineering components typically used for inter-process communication (IPC), or for inter-thread communication within the same process. They use a queue for messaging – the passing of control or of content. Group communication systems provide similar kinds of functionality. 翻译过来就...

2021-03-03

1097

WEB工程模块拆分设想 author: HuiFer 首先来看目前使用到的一些开发模块，通常有dao、api、service、task、base、web五种，上述五种内容含义如下： dao：存储数据库实体和mapper相关内容。 api：存储open feign相关接口，为SpringCloud提供服务。 service：存储当前项目中关于业务处理的代码。 task：存储关于定时任务相关代码。 base：存储请求参数，返回参数，枚举等JavaBean对象，不具备高级功能。 web：存储controller、拦截器、过滤器等于web有关代码。上述这种模块分包是一个比较常用的方式，但是上述分包在笔者开发过程之中产生了很多问题，比如快速找到某一个对象的转换，快速找到某一个对象的缓存处理等问题。为此提出了一种新的分包模式。领域模型首先从HTTP请求开始，对于一个请求会有两个内容，请求对象，请求响应对象，一般而言这两个对象是一个比较独立不会有特殊方法的对象(即一个普通的JavaBean)，对于这块内容笔者将其分在了领域模型(domain-model)，在缓存中的对象也可以放在领域模型中...

2021-03-04

1086

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。