MaxCompute确定需求的业务调研及分析
云栖号快速入门:【点击查看更多云产品快速入门】
不知道怎么入门?这里分分钟解决新手入门等基础问题,可快速完成产品配置操作!
在进行数据仓库构建之前,首先需要确定数仓构建的目标与需求,进行全面的业务调研。您需要了解真实的业务需求是什么,以及确定整个业务系统能解决什么问题。
业务调研
充分的业务调研和需求分析是数据仓库建设的基石,直接决定数据仓库能否建设成功。在数仓建设项目启动前,您需要请相关的业务人员介绍具体的业务,以便明确各个团队的分析员、运营人员的需求,沉淀出相关文档。
您可以通过调查表、访谈等形式详细了解以下信息:
1.用户的组织架构和分工界面。例如,用户可能分为数据分析、运营、维护部门,各个部门对数仓的需求不同,您需要对不同部门分别进行调研。
2.用户的整体业务架构,各个业务模块之间的联系与信息流动的流程。梳理出整体的业务数据框架。
3.各个已有的业务系统的主要功能及获取的数据。
本教程中以A公司的电商业务为例,梳理出业务数据框架如下图所示。A公司的电商业务板块分为招商、供应链、营销、服务四个板块,每个板块的需求和数据应用都不同。在您构建数仓之前,首先需要明确构建数仓服务的业务的板块和需要具体满足的业务需求。
此外,您还需要进一步了解各业务板块中已有的各数据功能模块。功能模块通常和业务板块紧耦合,对应一个或多个表,可以作为构建数仓的数据源。下表展现的是一个营销业务板块的数据功能模块。
本教程中,假设用户是电商营销部门的营销数据分析师。数据需求为最近一天某个类目(例如:厨具)商品在各省的销售总额、该类目Top10销售额商品名称、各省客户购买力分布(人均消费额)等,用于营销分析。最终的业务需求是通过营销分析完成该类目的精准营销,提升销售总额。通过业务调研,我们将着力分析营销业务板块的交易订单功能模块。
需求分析
在未考虑数据分析师、业务运营人员的数据需求的情况下,单纯根据业务调研建设的数据仓库可用性差。完成业务调研后,您需要进一步收集数据使用者的需求,进而对需求进行深度的思考和分析。
需求分析的途径有两种:
- 根据与分析师、业务运营人员的沟通获知需求。
- 对报表系统中现有的报表进行研究分析。
在进行需求分析阶段,您需要沉淀出业务分析或报表中的指标,以及指标的定义和粒度。粒度可以作为维度的输入。建议您思考下列问题,对后续的数据建模将有巨大的帮助:
- 业务数据是根据什么(维度、粒度)汇总的,衡量标准是什么?例如,成交量是维度,订单数是成交量的度量。
- 明细数据层和汇总数据层应该如何设计?公共维度层该如何设计?是否有公共的指标?
- 数据是否需要冗余、沉淀到汇总数据层中?
举例: 数据分析师需要了解A公司电商业务中厨具类目的成交金额。当获知这个需求后,您需要分析:根据什么(维度)汇总、汇总什么(度量)以及汇总的范围多大(粒度)。例如,类目是维度,金额是度量,范围是全表。此外,还需要思考明细数据和汇总数据应该如何设计、是否是公共层的报表、数据是否需要沉淀到汇总表中等因素。
需求调研的分析产出通常是记录原子与派生指标的文档。
本文来自 阿里云文档中心 MaxCompute 确定需求
【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/zhibo立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
配置负载均衡实例的图文详解
云栖号快速入门:【点击查看更多云产品快速入门】不知道怎么入门?这里分分钟解决新手入门等基础问题,可快速完成产品配置操作! 创建负载均衡实例后,您需要对负载均衡实例进行配置才能进行流量转发,您需要添加至少一个监听和一组后端服务器。本指南指引您配置一个TCP监听并添加部署了静态网页的两个ECS实例(ECS01和ECS02)作为后端服务器。 操作步骤 1.登录负载均衡管理控制台。2.在实例管理页面,单击实例操作列的监听配置向导。3.在协议&监听页签下,根据如下信息,配置监听规则,其它配置保持默认选项。 选择负载均衡协议:本教程选择TCP协议。 监听端口:用来接收请求并向后端服务器进行请求转发的负载均衡系统的前端协议和端口。本教程端口设置为80。 开启监听带宽限速:设定不同的带宽峰值来限定后端ECS实例的不同应用所能对外提供的服务能力。本教程创建的公网负载均衡实例是按流量计费的,不受带宽峰值限制,所以不进行配置。 调度算法:负载均衡支持如下三种调度算法,本教程选择轮询。(1).加权轮询模式:将访问请求依序分发后端服务器,后端服务器的权重越高,被分发的几率也越大。 (2).加权最小连接数...
- 下一篇
Gartner发布中国AI初创企业报告:多数企业聚焦于这3项技术
云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 近日,国际著名数据调查机构Gartner发布了《Market Guide: China AI Startups》调查报告。 该报告主要对中国的AI应用情况进行了全面调查,报告显示,目前中国的AI初创企业主要围绕计算机视觉、自然语言处理和机器学习等技术,为零售、医疗保健、金融银行、语音识别、机器人流程自动化、聊天机器人等行业提供商业场景化支持。 计算机视觉领域中,垂直行业包括:医疗数据分析、零售数据分析、制造业质量检查、金融领域人脸识别、机器人流程自动化、公共部门监测等。 自然语言处理领域中,垂直行业包括:对话式人工智能聊天机器人,基于语音的虚拟助手机器人,以及各种与文本相关的应用程序延伸,例如智能电子邮件,CRM,智能搜索等。 其中对话式智能人工客服场景应用包括:智能IVR、语音质检、坐席辅助、客户画像、外呼机器人、培训机器人、以及洞察分析系统等,从而实现全面自动化、辅助、人机协作的业务流程。 机器学习技术多用于欺诈和风险预测性维护,或以PaaS形式支持创建AI应用程序。 报告指出,如今...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS6,CentOS7官方镜像安装Oracle11G
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果