实战云端CRM变革，挖掘零售电商潜能-低调大师

实战云端CRM变革，挖掘零售电商潜能

2016-12-24 690

自从电商开始真实运作的那天，人们便开始关注电商平台上的标准化数据所带来的潜在价值。但要采集和分析这些数据并不是一件容易的事。不同平台上的海量实时数据给数据采集带来了很大挑战，同时数据分析需求的多样性和时效性也急需通用而快速的分析平台支持。阿里云有得天独厚的电商基因，通过阿里内部各类业务需求的历练，其积累了大量的实践经验，特别是在电商平台数据处理方面的沉淀。这使得当我们基于阿里云的云计算服务来处理这些电商平台数据时有一种“回娘家”的感觉。

基于阿里云的数据采集

数据采集并不仅是获取数据并保存好，更重要的是要保证数据采集的商业价值。数据采集的商业价值基于海量和实时两大点。这也就意味着我们不仅要应对几乎无限增长的数据规模，还要保证很高的时效性。具有电商基因的阿里云的各个产品帮助我们紧紧抓住了商业价值的这两点基础。

基于阿里云来解决采集的数据规模不断增长的问题

我们在考虑设计一个可以对应无限增长的数据规模的采集服务时会考虑四个方面。

可扩展性：CRM系统几乎承担了所有的数据存储和计算的任务。在数据量越来越多以后，系统容纳不下了的情况是不被允许的。要做到无论数据怎么增长，都可以在不改变现有架构的情况下支持，这是首先要考虑的。
快速伸缩性：采集能力可以在较短的时间内快速增长和回退，以面对波峰波谷的快速变化。零售电商的数据量，波峰波谷很明显。例如每天中午、下班时间和晚上是高峰，新春大促、五一大促、双十一和双十二大促是高峰。如果系统架构没有快速伸缩性，要么无法应对促销活动，要么就是要按照波峰来设计系统，因过高的成本影响商业价值。
线性成本：我们每接入一个客户，所付出的成本不会随着客户数量的增加而增加。例如，接入前100个客户时，每个客户的数据采集成本是1元，接入10000以上客户时，每个客户的采集成本应该还是1元而不是10元。如果失去了对线性成本的控制，未来的发展会大大受限。
性能可预期：在现在的资源和数据数量的情况下，根据性能指标可以大致计算出：什么时候扩容，什么时候提升配置，需要预留多少处理能力等。

先看一下我们实际的数据采集的局部架构图，如图1所示。

aa80ef5f0a47c99bae0a2f716b52426481efc840

我们首先会把所有不同平台的卖家进行统一编号。然后根据不同的模来分配给不同的采集程序。采集程序会根据卖家的编号找到对应的库并进行保存。我们考虑到未来的可能性，目前分了64个库，每16个库放在一台RDS（阿里云的关系型数据库服务，可以认为是数据库所在的虚拟服务器）上。

现在就来说一下这个设计如何满足以上四点需求。对于可扩展性，从图1中可以看到，整个采集过程都是按照横向扩展方式设计的。由于数据采集需要数据计算和数据存储能力，所以可以看到，对于数据计算能力可以通过增加模数和ECS来最大扩展到一个卖家一台ECS的比例。对于数据的存储能力可以通过增加RDS来最大扩展到一个库一台RDS的比例。也就是说，在单个电商卖家的数据量没有达到计算和存储能力的极限的情况下，可以几乎无限扩展。

e2fded6e9e112e937bcddad9e88f7adbfc459f6d

但实际使用过程中，情况会比预先考虑的更复杂，最常见的情况就是卖家数据不均衡，如图2所示。当一个卖家的数据量超过一般卖家几百倍时，该怎么办呢？我们仍然可以用同样的思路来解决这个问题，如图3所示。

26fcf3d544c1459541623d33081ae3496c83227c

对于数据采集的计算能力，我们可以通过增加维度来获得。对于大卖家，不仅可以根据卖家编号取模，还可以根据买家编号取模，这样就把大卖家切成多个小卖家，让不同的采集程序来处理。对于数据采集的存储能力，可以调整RDS与数据库的映射关系让数据库得到更多的RDS支持，最多当然是一个RDS对应一个数据库这样的映射关系。说到这里，还要考虑一台RDS撑不住怎么办？根据实际的使用情况，一台中型RDS一秒钟可以处理200笔订单。如果不存在性能问题，那么这个卖家一小时就要成交72万笔。我们现在接入的卖家订单数远远小于这个数值。

如果考虑的是活动瞬发值，那么就要参考第二个设计思路：快速伸缩的实现。阿里云的RDS和ECS是可以按时间计费升级的，这给我们带来两个好处。一个好处是能够应对波峰波谷的波动。在临时性的数据量增长的情况下，只需要临时升级ECS和RDS即可。横向扩展是一种相对静态的增长方式，面对临时瞬发的活动类波峰变化，只需要付少量费用临时动态升级就可以很好地对应。另一个好处是这给我们留了很大的余地。在横向扩展时，我们默认会使用中型的ECS和RDS，为设备在纵向升级时留出足够的余量，在临时需要更多处理能力时可以一键达成目的。

基于阿里云来解决数据时效性的问题

很多情况下，我们认为数据是静态的，采集过来就好了。而实际上数据时刻在变。如果采集不及时数据就消失了，或如果采集到了但没及时处理那么时效性背后的商业价值也会丢失。下面以淘宝交易数据为例说明及时采集带时效性数据的必要性。

淘宝的原始交易数据从【等待买家付款】到【买家已付款】的变化是在同一条记录上进行的。可能当前是【等待买家付款】的状态，下一秒就变成【买家已付款】，再下一秒就变成【卖家已发货】。如果我们采集【等待买家付款】花了2秒钟，那么【买家已付款】的状态就会漏采集，系统无法做该状态下的操作。例如，CRM提供的营销工具会在【买家已付款】状态下发“亲，我们已收到你的付款，我们会赶快给你发货。”这样的通知。如果漏了这个状态，这条通知就不会发出。那么CRM的商业价值就丢失了一部分，这是难以接受的。

更难以接受的是造成负向的商业损害。如果有一个营销工具会在【等待买家付款】的时候，发送短信告诉买家：“亲，你要的商品我们已经帮你保留了，请尽快付款。”如果处理这类时效性花了10秒钟才处理完成，但在10秒内订单状态早就变成【买家已付款】了。那就会发生给已经付款的买家发送催付的短信，这会让买家难以接受和造成很大的困惑，增加了卖家服务的压力和维持客户关系的压力，造成商业价值的损害。

正因为时效性数据和商业价值的关系非常紧密，所以我们需要花大力气来处理它。这个例子中的营销工具需要根据十几个维度进行筛选后才能决定需要对什么客户发送什么短信。这些筛选维度有原始数据的维度也有统计数据的维度，例如向收货在江浙地区的买家发送短信，这来自原始的交易数据，也有向买过n次的买家发送短信这样的统计数据，这十几个维度的组合按照传统的从数据库查询的方式对数据库的压力极大。如果直接根据数据库性能预判来扩容的话，每个卖家的成本会很高。所以我们通过ECS和RDS之外的阿里云工具来解决。所以基于云计算技术来及时地采集时效性数据和处理时效性数据，我们有三个手段：

判性能：这个和前面的数据采集时的预判性能是一样的，是保证的基础。只有可以预判，才有可能尽早发现和处理（图4）。
最短路径：通过对于时效性数据的流转路径的排查，找出可以省略的部分路径，加快时效性数据的处理速度（图5）。
快速I/O存储：对时效性数据的采集处理，需要用到存储，此时可以用快速的存储产品来承担一般数据库存储的功能（图6）。

最短路径就是将对时效性数据的处理和数据源之间的距离缩到最短。不等数据进入数据库再开始查询和处理，直接在采集程序处开始使用数据。这样能节省其他路径的时间。看起来似乎很完美，但实际上忽略了一个问题，数据库有它的价值，它可以提供数据存储、查找、统计等功能。但不进入数据库怎么查找和统计数据呢？对于涉及到时效性处理的一部分数据，我们用快速I/O的方法来代替部分数据库的功能。

当采集数据还在内存中时，我们通过让OTS（阿里云开放结构化数据服务，可以看做高速的键值存储）或OCS的持久化版本（阿里云开放缓存服务，当使用持久化缓存时，与OTS效果类似）作为中间存储来进行实时的数据统计和计算。第一次的时候将采集数据存入中间存储，随后每一次都根据本次和之前的值进行统计和计算。OTS可以达到10w级别的QPS，与RDS整整差了一个级别的性能。OCS与之类似。因此，可以将OTS和OCS看做性能弱化容量无限的持久化内存存储。在实践中，我们在中间存储数据的计算上，每一条数据只有不到0.1毫秒的性能损失，这样可以避免时效性数据处理时的n次聚合查询和普通查询的负担。不过这里还少说一部分。OTS和OCS持久化存储都可以理解为键值存储，它可以用来存储特定维度的数据，但不能进行多维度查询。例如可以将某一卖家和某一买家的组合作为键，这个卖家和这个买家的统计信息作为值来使用。但不能进行之前说的1x维度组合查询。所以我们更进一步地使用图7中的方法得到自由维度查询功能。

a5e3be7f9a2946f1f2d0df4a14ef5883c05f6de5

我们将需要的原始数据和它的统计信息变成一条数据库记录，这样不但可以自由组合查询维度，而且避免了n次普通查询和聚合查询的消耗。例如，我们将一次交易的原始数据和交易双方的统计数据一起保存成一条宽表记录，这条记录会有如买家A在卖家B这里买了什么，付了多少钱，这样的原始数据，还会有这个买家在这个卖家那里一共买过多少次，至今付过多少钱这样的统计数据。通过这样的手段把可以n次的查询缩减为一个查询。

不过问题还没完，我们所做的一切都是为了快速处理时效性数据。只是按照刚才那样做的话，随着宽表的数据量的增加，查询速度会越来越慢，并且由于维度是自由组合的，数据库索引并不能解决问题。另外，宽表中的信息来自多个表，这些表可能存在多对多关系，例如刚才的一条记录中会有像是买家A在卖家B买了什么，可能是多个商品。在一般的关系中，一个交易的ID和商品的ID是一对多关系，那么把它们合并到一条记录中就只能把多个表的相关信息并列成一个值放入宽表中。例如用逗号分隔商品1、商品2、商品3，对于这样的多值维度，用数据库的like效率很低，因此我们引入了搜索引擎来处理这个问题，如图8所示。

bef796170adac7fadc62f51e4afcb5cf2796dd20

根据分词符号和分词词典将一域多值切分后，与其他查询维度一起，通过倒排文件把需要查找的维度进行交并处理。这样就可以解决数据库索引不支持多维组合和一域多值查询的麻烦。当然，搜索引擎从RDS中抓取数据后建立索引需要额外的时间，为了既得到搜索引擎多维组合和一域多值的分词好处，又尽量减少搜索引擎从RDS中取数据建索引的时间消耗，我们可以让本来要存入RDS的记录先进入搜索引擎，再写入RDS，而不是让搜索引擎在写入RDS后，再读取一次。这样可以节省一些时间。我们会尽量满足两边的要求。到现在，就算对于时效性数据的处理非常复杂，也可以在数据失效前完成处理。

至此，数据采集的两大问题终于被基本解决了。现在来看CRM提供的另一项重要服务----数据分析。

基于阿里云的数据分析

由于数据分析往往基于特定的场景，很难找到通用的模型，所以在此并不打算介绍具体的数据分析。而是将我们遇到数据分析的类型和阿里云产品的解决方案放在一起进行介绍。

我们在数据分析时会遇到四种场景，如图9所示。越往下需要的代价越大。简单指的是需要得到的分析结果依赖的过程较短，例如对热门商品的排序，只涉及一个排序查询；或者分析男女购买的比例，只涉及两次聚合查询。如果像刚才那个数据采集中处理时效性数据的场景，需要1x次查询包括聚合查询，那就属于复杂分析。实时指的是，数据分析的结果依赖于到目前为止的数据，同理非实时就是数据分析的结果依赖于某个固定区段的历史数据。例如前一天的，或前一年的。对于这四种等级我们有相应的处理办法：

994c9d0dbb1225d6a7b159fb669ab39150c1b170

1.简单非实时的情况（图10）分两类，因为是非实时的，可以理论上预先计算。但预先计算需要满足一个条件，就是数据查询的维度组合是有限的，或者说是不能过多的。例如查询维度是前一天的男性购买次数，这是可以的，但如果需要分析的维度不仅有时间和性别，还有年龄、名称、收货地址、电话号码和邮箱之类的组合，就会预先计算过多的报表，以至于还不如实时统计查询。

5fe562f9f01d011affb9981ff26d34aa3a05be40

2.对于第2等级，简单实时的情况（图11），我们考虑两个点：一个是这个简单实时的分析调用频率如何，另一个是客户对这个简单实时分析的敏感度如何。对于调用频率高的分析，我们需要对结果进行缓存处理，以免无谓的高频多次调用。另外，对于客户实际敏感度不高的分析，我们可以人为将实时变成半实时或非实时的。例如对于热门商品的分析，客户并不会像看股票一样一直盯着，虽然理论上热门商品的列表需要的是实时结果，然而实际上在1小时内无论客户分析多少次，热门商品在一小时内都不会重新分析。这其实和对高频率查询的解决方式是一样的，只是切入点不同，高频是为了避免无谓的查询，例如某些数据变化的最小时间间隔是10秒钟，10秒钟内查询无论多少次，结果都是不会变的。而根据敏感性来降低实际的分析次数是基于客户对数据实时性的实际需求来做的。只是两者的目的不同。无论怎样，缓存（OCS）是分析的好帮手。

e2a267dac43893ed2e9cf4feae44ef32a73de400

3. 当组合维度有限时，复杂非实时查询（图12）和简单非实时查询是一样的，例如可在半夜计算当天的分析需求，在第二天来使用。但如果分析的复杂度很高在一个晚上算不完的话，那么简单的半夜分析结果的方式就行不通了。ODPS给了我们很好的解决方案。我们每天定点将数据上传至ODPS，整合后通过ODPS分析，可以大大缩短计算时间，再复杂的查询计算，几乎都能在20分钟内拿到结果。这让我们感觉到复杂非实时分析不再是一个根本性的问题。

203bbc4bb47a1ad2aed9c9af1cc364e825885ce0

4.复杂实时的查询是非常苛刻的，真正的场景并不多，但还是有。例如，之前在数据采集中说的那个基于1x次包含聚合查询的时效性数据处理，就可以算是复杂的实时的数据分析。解决方法前面讲过了，依靠OTS、OCS、TIS（索引查询服务）和ECS的计算能力是可以进行不限维度的复杂的实时数据分析的。其实对于这种场景，单纯的某些方法和服务已经无法解决了，需要依赖具体的业务场景，从快速存取、快速计算、快速查询等方面去组合，将计算、存储和查询都保持在一个非常高速的通道上，达到一个非常实时的效果。

对云计算的一点感想

云计算带来的影响

我认为，云计算的产生和普及为解决软件业中永恒的难题――“复杂度”找到了一条可能可行的路，并且由于对此致命难题的撼动而产生深远的影响。

对于技术本身的影响：软件的复杂度会随着规模的扩大而产生非线性的增长，类似一条幂次函数的曲线。这一方面说明，规模过大的软件需要的资源投入会是较小规模的幂次倍数。另一方面说明，如果可以保持软件规模小而轻，那么即使资源较少，也可以去维持。云计算的各类产品就好像铁路、医院、运动场等基础设施。将非业务模块的其他部分上云，可以很大程度地减少软件的复杂度和由此带来的资源消耗。
对业务的影响：当所有的软件上的资源都投入在业务本身上时，我们的玩法会越来越多变和轻量。按照小步快跑的思路，不断地尝试需求和反馈迭代，可以使得产品紧紧地与需求绑定在一起，不会被软件过大的身躯拖住脚步，让每一个开发任务都和最终的商业价值紧密联系。
对组织的影响：现在软件业中的很多组织方式和管理方式的出现，就是为了对抗以更大组织规模的开发方式应对更复杂的软件带来的混乱。当软件的规模缩小到仅表达业务上的逻辑，那么组织就不再需要如此庞大和复杂。团队成员的交流也更简单而直接，每个人都做好自己负责的工作就好。另外，参与者的改变，也会带来组织结构的变更。上云后，运维人员、管理人员都不再需要，组织规模也会变小。
对产业的影响：如果对于特定高精尖技术的需求都能由云来提供，那么小企业的竞争力和大企业会站在更加平等的位置。只要你有好的创新和想法，资源的多少不再决定最终的胜负，这会大大激发产业创新，带动产业变化。
对整个社会的影响：就好像第一次工业革命整个社会的生产力提高了好几个等级。云计算与之非常类似。原来每个企业建设自己的硬件、系统、软件、业务等整个IT体系时，需要系统管理员、设备管理员、系统运营维护人员……云计算出现后，一个维护基础系统的团队，就可以维护管理成千上万台设备。一套基础系统的解决方案，可以解决成千上万家企业的问题。整体的生产力大大提升，社会效率会变得非常有竞争力。

云计算带来的新机会

随着云计算的发展，软件的业务部分和基础技术部分会越来越分离，加上竞争的平等，使得问题变成了“怎样做业务创新，怎样用好云”，而不是“技术能否撑得住业务，要不要用云”。在这个背景下，能理解业务同时有基于云产品快速架构系统能力的架构师会变得更加重要。同时创新企业会越来越多，越来越多的人不用再专注于技术本身，而是有更多的时间站在技术和业务之间，思考怎么快速用云产品提高业务能力。

原文链接

微信关注我们

原文链接：https://yq.aliyun.com/articles/67159

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

SLS：海量日志数据管理利器

SLS：海量日志数据管理利器日志是大规模集群管理系统中非常关键的部分，服务器上的各种日志数据（如访问日志、应用日志等）可以帮助我们回答如运维、开发、运营、客服、安全等各种问题，例如：运维：服务是否正常，流量和QPS是多少；开发：线上有没有异常和错误发生；运营：多少账号开通了服务，其中开通失败原因是什么；客服：系统登录不上了，是客户的问题还是系统的问题；安全：谁访问了不该访问的数据。然而要想从日志中获取这些信息，通常需要开发大量脚本和工具，从头到底搭建端对端系统，并且为了保证服务可靠性和稳定性，要做大量维护开发工作。阿里云自主研发的针对日志数据的实时、大规模集中式管理服务SLS（Simple Log Service，简单日志服务），能够提供一个从日志采集、过滤、处理、聚合到在线查询的完整的海量日志处理平台，满足各种类型的日

2016-12-24

707

杭州湖畔网络技术有限公司是一家专业提供SaaS化电商ERP服务的创业公司，主要用户群体为经营淘宝、天猫、京东等主流电商平台、自建商城、线下渠道的商家及中小企业。作为SaaS服务提供商，服务数万乃至数十万级用户是业务架构初期就必须考虑的问题。庞大的用户群以及海量的用户数据意味着基础设施的构建必须兼顾高效与稳定，而按照通用的基础设施建设方案的话，需要面对成本过高、实现复杂、需要投入太多精力等问题，这对当时的湖畔网络这样的初创公司来说，完全不能承受。因此，更经济、更方便扩展的云服务平台成为首选。在对比现有各家云服务后，我们选择了稳定性与成熟度都经过大量用户检验的阿里云。但要构建高性能的SaaS应用，仅凭云服务基础设施是不够的。如何基于云服务平台设计并实施符合自身业务特点的系统架构，也是决定产品性能的关键。本文将讲述我们如何利用云服务，使用相对经济的方案，解决海量用户的数据库使用问题。架构我们的SaaS化电商ERP服务的整体架构是基于阿里云服务平台实施的，如图1所示。采用SLB（Server Load Balance，负载均衡）作为Web集群访问入口，负责为Web端的多台服务器进行流量...

2016-12-24

645

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。