E-Mapreduce如何处理RDS的数据
一、引言
目前网站的一些业务数据存在数据库中,这些数据往往需要做进一步的分析,如:需要根据一些日志数据关联分析,或者需要进行一些如机器学习的分析。在阿里云上,目前E-Mapreduce能满足这种分析的需求。
在E-Mapredcue中操纵RDS中数据(这里以mysql为例),一般有三种方式,下面分别说明下。
为了实验,笔者创建了一个mysql的示例,创建了一个数据库school,在其中创建一个表student,并导入了一部分的数据。
二、从mysql导入到oss中,再启用e-mapreduce分析
从mysql导入到oss中,可以使用 数据集成这个产品。
1、 使用数据集成 把数据导入到OSS中(都是页面配置)
- 进入数据集成的控制平台,创建一个Pipeline或者Ecs Pipeline
- 在新创建的Pipeline中,新建作业。目前没有直接的页视