DLA支持MaxCompute(ODPS)数据源

2019-06-18 1106

DLA支持MaxCompute(ODPS)数据源

1. 概述

支持功能包括：

MaxCompute（ODPS）的数据查询，目前复杂数据类型以字符串形式返回；
一条命令同步对应project下的所有表。

不支持数据回流ODPS。

其他说明：

基于MaxCompute tunnel拉取数据；
通过在查询中指定WHERE <分区列> = <分区key>的形式进行分区过滤（裁剪），避免全表扫描数据，目前支持如下一些形式进行分区过滤（裁剪）：
- WHERE <分区列> = <分区key>
- WHERE <分区列> = <分区key1> OR <分区列> = <分区key2> ...
- WHERE <分区列> IN (<分区key1>, <分区k

微信关注我们

原文链接：https://yq.aliyun.com/articles/705889

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

2019国内外大数据挖掘工具有哪些？有什么特点?

数据挖掘工具是使用大数据挖掘技术从互联网的海量数据中发现、采集并挖掘出有有价值数据一种软件。利用特定的技术，例如：Hadoop、Spark……实现对互联网非机构化的大数据进行挖掘并获得正确、有价值数据的一种快速、便捷的方法。 RapidMiner 作为数据挖掘工具， RapidMiner是一款免费预测性分析和数据挖掘软件工具，具有丰富数据挖掘分析和算法功能，过程简单，强大和直观。可以用简单脚本语言自动进行大规模进程，拥有图形用户界面的互动原型。 KNIME 一款开源的数据挖掘工具，采用用Java编写的，并且基于Eclipse，集成各种开源项目。并利用其扩展机制来添加提供附加功能的插件。拥有整合文本挖掘，图像挖掘以及时间序列分析的方法。 KNIME兼容多种形式，例如：图像、文本……，同时支持基于Hadoop的数据格式兼容多种数据分析工具和语言。 NLTK 处理语言数据程序，支持文本分词、词频统计、删除停止词、标记非英语语言文本、从 WordNet 获取同义词、从 WordNet 获取反义词、词干提取…… 同时，NLTK 提供了一个语言处理工具，包括数据挖掘、机器学习、数据抓取、情感分析等...

2019-06-18

975

一、背景概述 HBase作为海量在线存储引擎，被广泛应用于推荐、风控、物联网、画像、表单等大数据场景。Phoenix作为HBase的SQL层，极大降低了用户使用门槛，并且实现了二级索引、加盐表、动态列等大量实用功能。HBase底层存储基于LSM，LSM能将业务的随机写转为顺序写，能有效提升写吞吐，但是其查询只适合于Rowkey的前缀匹配，查询模式单一；Phoenix二级索引，底层是跟原表关联的索引表，同样也是前缀匹配，一个表可以有多个索引，这样可以增加查询范式，但是索引数目不能太多，否则写放大的问题会比较严重。对于更加复杂的查询场景，比如表单、日志查询里面的模糊查找，用户画像里面的随机条件组合等等，HBase + Phoenix的组合就不能支持。该问题是基于LSM的NoSQL数据库的通用问题，除了HBase，Cassandra、Le

2019-06-18

704

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。