初创企业的选择——MaxCompute
经过多番对比选择,发现阿里的MaxCompute是一个具有良好生态,以及周边服务套件的大数据开发平台。从数据的采集,清洗到数据的处理,数据挖掘,数据的应用展现,数据流转的生命周期中,MaxCompute都有很好的周边产品。而MaxCompute也能无缝对接在ec2,存储等其他服务的数据。因此我们决定使用阿里云MaxCompute作为我们的大数据开发平台。
系统中每天都有大量的运行结果从用户的iot设备中返回,进入Datahub中暂存,然后统一归档到MaxCompute等待处理。而有些返回的数据是错误的,或者是重复的,需要编写SQL计算任务来清洗与转换。
另一个作用巨大的套件则是推荐引擎。一部分数据通过在APP进行客户端埋点,另一部分则是数据仓库中的身体运动数据。和MaxCompute对接后,产出API接口供业务服务器调用。我们的业务主要是一些运动建议,以及周边产品的一些推荐。在推荐引擎控制台中,通过对指标的定义,来修正推荐效果。
上云的好处是显而易见的。大大减少了无用的技术资源投入,尽可能的专注于业务开发。无需在基础设施中投入,为平台的部署,运维,稳定性投入大量的精力。另外MaxCompute图形化的任务界面,也让开发人员轻松的了解任务的运行状态,数据的流转流程。