案例详解|大数据上云助力新零售企业数智化转型，挖掘数据的价值-低调大师

案例详解|大数据上云助力新零售企业数智化转型，挖掘数据的价值

2020-02-05 1064

传统大卖场营收持续下滑，必须通过业务创新走出困境

　　曾经风光无限的零售大型超市业态--大卖场，当初代表先进零售模式进入中国市场，激起零售行业蓬勃发展的大浪潮，但是近年来，随着人们消费方式的巨大转变以及来自电子商务的冲击，传统大卖场的发展发生逆转。传统的零售技术和模式已经无法满足顾客的需求，同时传统门店面临租金高，成本高，人流量减少等困境，亟需寻求新的发展。
以数字化改造为手段，提升大卖场精细化运营能力成为行业共识。面对新消费时代，商家可以借助大数据和人工智能等技术手段，快速从业务数据中找到业务特点，同时具备千人千面精准营销的能力，从而提升会购物体验，增强复购和会员粘性。数据中台是大数据时代的概念，大量的业务行为数据集中到数据中台做大数据分析，企业可对各类业务行为进行分析，给企业在营收、库存管理、商品管理等各个方面的决策提供数据依据。
　　D客户是中国连锁超市领军企业，年销售额过千亿，全国覆盖华东、华南、华中、东北、华北等多个大区，全国门店数四百家左右，单店平均面积在2万平米以上。近年来，在整个商超业绩下行的趋势下，D客户年度净利润保持百分之十几同比增长的同时，单店营收呈现负增长，所以几年前就启动了数字化改造，提升精细化运营能力，寻求新的发展。

为什么上云-数据分析效率低，影响业务分析与决策

　　D客户基于商品、会员、仓储、供应商、商户等业务行为产生大量的数据，基于这些数据要做大量的数据分析完成营收分析（成本、损耗、收入、价格等），库存管理（滞销、临保、缺货、周转率等），商品管理和商品竞争（淘汰、品类覆盖、价格指数等）。而D客户在IDC自建的大数据平台，数据吞吐量规模存在瓶颈，查询性能也不够理想，导致数据分析能力弱，效率低，影响业务分析与决策，如全年商品汰换率目标无法达成。
　　阿里云为企业大数据实施提供了一套完整的一站式大数据解决方案，覆盖企业数仓、商业智能、机器学习、数据可视化等多个领域，助力企业在DT时代更敏捷、更智能、更具洞察力。通过对客户现状的分析，推荐D客户使用的大数据产品MaxCompute有如下好处：

数据产生价值周期更快：阿里云MaxCompute比自建的Hive 2.0+Tez快90%，使得数仓离线计算的数据处理时间不到原来自建方式的1/3。
托管服务免运维，让企业专注业务：最重要的是采用阿里云Maxcompute，客户将所有精力都放在业务上，节省了自建机房在学习成本、开发成本、管理成本、投入机房资源和运维成本的总成本，相比自建Hadoop物理集群，使用阿里云数加MaxCompute的总成本有较大降低，应用开发效率有很大提高。
开箱即用提升效率：基于阿里云数加MaxCompute提供的开放接口和各类工具，以及一站式的大数据开发套件，项目实施难度低，让开发者将精力全部放在数据处理、分析和应用上，极大的降低大数据应用开发的技术难度。
专业服务保驾护航：阿里云平台所提供的7×24小时技术支持服务则可以让客户随时随地获得专业的技术支持，让IT不再成为业务发展的限制。依托于阿里云在安全性方面有全面考虑的底层平台和众多的安全监控工具，客户的各类应用数据即使放在云端也可以确保万无一失。

为什么上云-云下IDC资源利用率较低，部署冗余，人力支出高，资源弹性和扩展性不足

　　D客户通过在自建IDC服务器资源构建大数据平台，资源利用率不高，部署较为冗余，升级和维护困难，运维和基础设备开发人力支出成本比较高，而且随着自建IDC规模的扩大，企业成本大幅上升。
　　选择阿里云，可以按需使用云服务，无需人力维护物理设备，相对成本线性，实际TCO更低。

为什么上云-享受技术红利，提升效率

　　选择阿里云，阿里巴巴每年数百亿的研发投入带来的技术红利，云上即享。阿里云将达摩院机器智能技术实验室所有的智能技术，如智能语音、NLP、知识图谱、人脸识别、机器翻译等技术通过阿里云官网开放给用户，目前阿里云官网上大约有适用于300多个场景的130多个AI产品供用户使用。D客户上云后就尝试使用了阿里云智能推荐产品，阿里云智能推荐内置大量推荐算法以及模型训练的样本，训练深度、效率和准确率相比D客户原自建的推荐产品有很大的提升。

上云步骤与方案-丰富的解决方案，搬站工具和最佳实践使得企业上云周期短、切换影响小

　　阿里云拥有丰富的迁云工具和解决方案，截止2019年4月，阿里云官网已上线200+云产品、200+解决方案，100+上云最佳实践，帮助企业客户快速完成迁云方案评估，迁云实施和生产流量切换，全面提升企业业务的可靠性、安全性。
　　下面以D客户大数据平台上云切换为例介绍大数据上云步骤。

图１上云前架构示意图

　　图１为D客户在上云之前的大数据平台整体架构，大数据平台为自建IDC集群，规模在40+台，数据量近300TB（压缩策略为1：3），整体以Hadoop+Spark生态为架构，另外采购列式存储的MPP数据库Vertica作为上层应用依赖的核心数据库。

图２云上架构示意图

　　经历1月的POC测试后，D客户项目管理层最终决定，D客户数据中台基于阿里DataWorks+MaxCompute为主要核心来构建，最终解决方案如上图２所示。迁移方案具体说明如下：

Hive历史数据（csv、txt、parquet、orc文件）通过MMA进行迁移。
MySQL/Oracle业务数据通过DataWorks-数据集成/DataX进行增量方式拉入MaxCompute。
Kakfa数据为日志数据，通过DataWorks -DataX脚本模式增量写入。

　　成熟的自动化迁移工具在本案例中起到至关重要的作用，大大缩短了迁移进程，并降低了迁移难度。以线下Hadoop的Hive数据迁移到云上MaxCompute为例，通过迁移工具MaxCompute Migration Assist（MMA）来加速迁移工作，如图３所示。

图3 通过MMA迁移工具迁移Hive数据示意图

　　 MMA的工作流程主要分为四个步骤：

Metadata抓取
Meta carrier连接用户的Hive Metastore服务，抓取用户的Hive Metadata并在指定目录下生成一个目录，包含搬站所需的Metadata。用户可自行修改该目录下的文件来自定义搬站工具的一些行为。
MaxCompute DDL与Hive UDTF生成
利用上述步骤抓取到的Metadata，生成另一个目录，包含用于创MaxCompute表和分区的所有的DDL语句，还包含用于数据迁移的Hive UDTF SQL。
MaxCompute 表创建
运行上述批量生成的MaxCompute DDL，创建Hive迁移所需映射到MaxCompute的表与分区。
Hive数据迁移
在用户Hadoop集群上运行上述步骤中所生成的Hive UDTF SQL，进行传输数据。需要注意的是，该UDTF是执行在用户Hadoop集群上，故需要关注到资源占用情况以及Hadoop集群到MaxCompute集群的网络连通性情况。

客户收益

通过大数据平台上云并建立数据中台，整合线上业务和渠道，线下门店和B2B渠道的数据，D客户形成9大数据主题域，建立战略决策、管理决策、门店运营的数据运营体系，为业务提供及时的数据决策支持，效率提升的同时保证商品汰换的效率和频度。
阿里云提供了完善的云上托管的数据处理方案、大规模计算储存、细粒度节点依赖管理等功能，D客户上云后，节省了30%的服务及人力成本。托管服务，无需对复杂作业进行运维，使企业更加专注于业务。
使用成本低，同时提供更高的数据吞吐量和查询性能，可视化编辑界面，方便操作，且与阿里云大数据产品生态融为一体。
电商平台相关单品推荐点击率提升70%到150%

附录

本案例涉及到的最佳实践列表：

MMA迁移工具
https://help.aliyun.com/document_detail/142727.html?spm=5176.10695662.1996646101.searchclickresult.c8c4262e5167ek&aly_as=EwWrWsnf
DataWorks一站式大数据智能云研发平台
https://data.aliyun.com/product/ide?spm=5176.12825654.h2v3icoap.156.e9392c4aA8nWLQ&aly_as=nV7UhLXe
Hive数据如何同步到MaxCompute之实践讲解 – 基于MMA
https://yq.aliyun.com/articles/727330?spm=5176.10695662.1996646101.searchclickresult.c8c4262e5167ek
Hadoop数据迁移MaxCompute最佳实践 – 基于DataWorks
https://help.aliyun.com/document_detail/90315.html?spm=5176.10695662.1996646101.searchclickresult.19642d0cDQWghl&aly_as=jEkgU2CG
Kafka数据迁移MaxCompute最佳实践 – 基于DataWorks
https://help.aliyun.com/document_detail/120535.html?spm=5176.10695662.1996646101.searchclickresult.19642d0cDQWghl&aly_as=J1PvdnP0
Elasticsearch数据迁移至MaxCompute – 基于DataWorks
https://help.aliyun.com/document_detail/121009.html?spm=a2c4g.11186623.4.4.2cf1145bNtEpla

微信关注我们

原文链接：https://yq.aliyun.com/articles/743835

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

关于远程办公，微软MVP 15年研发团队的经验分享

今天是2月5日，春节假期结束后的第三天了。为了能够应对来势汹汹的疫情，众多互联网企业纷纷开启了远程办公模式。不知道各团队前两天的远程办公效果如何，我们 Worktile 管理层在大年初四就开始讨论远程办公的事情，并且将可能出现的问题都尽量提前想到并做了准备。从这两天实际执行的情况看，我所在的研发团队执行的还不错，基本没有受到什么明显的影响。因此我们希望将我们远程办公的一些思考、准备和实践分享给大家，共渡难关。先简单介绍下，我是 Worktile 基础平台部的负责人，部门包括负责核心组件开发的平台组和负责线上及公司内部服务器管理的运维组。我们的运维团队一直都是一个分布式团队，成员包含北京和杭州，我本人之前也有几年跨国公司的工作经历，对远程工作并不陌生。接下来我想就以下几个方面聊一下我们 Worktile 研发团队是如何实施远程办公的。明确远程办公的原则首先，作为研发线的一名主管，我首先给自己明确了一条远程办公的原则——信任，并且首先是自上而下的信任。也就是说，远程办公首先要求管理者，无论是公司CEO还是普通的小组长，都要完全信任自己的团队成员是有责任、有担当，能够自觉的按时按质完成...

2020-02-06

728

问题一、如果把MaxCompute计算费用从按量付费变为包年包月，是否会引起数据变化或者服务重启？不会，目前，MaxCompute支持在按量计费和包年包月两种计费方式之间进行转换，但您必须提前开通好两种模式的MaxCompute资源。具体限制以及操作步骤可参考官方文档：https://help.aliyun.com/document_detail/35455.html 问题二、在MaxCompute中可以在Java业务代码中调起一个任务开始执行吗?可以，在业务代码中调MaxCompute的Java sdk执行SQL任务。可参考官方文档：https://help.aliyun.com/document_detail/34614.html 问题三、在MaxCompute中如何获取系统当前时间？可以使用MaxCompute内建函数GETDA

2020-02-05

759

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。