淘宝用户购物行为分析
在本案例中,我们将使用 Databend Cloud 对来自天池实验室的淘宝用户购物行为数据集进行分析,一起发现有趣的购物行为。 该数据集为 CSV 格式,包含了 2017 年 11 月 25 日至 2017 年 12 月 3 日之间,有行为的约一百万随机用户的所有行为(包括点击、购买、加购、喜欢)。数据集的每一行表示一条用户行为,由以下 5 列组成,并以逗号分隔: 列名称 说明 用户 ID 整数类型,序列化后的用户 ID 商品 ID 整数类型,序列化后的商品 ID 商品类目 ID 整数类型,序列化后的商品所属类目 ID 行为类型 字符串,枚举类型,包括:'pv':商品详情页 pv,等价于点击; 'buy':商品购买; 'cart':将商品加入购物车; 'fav':收藏商品 时间戳 行为发生的时间戳 准备工作 下载数据集 下载淘宝用户购物行为数据集到本地,然后使用以下命令解压: unzip UserBehavior.csv.zip 将解压后的数据集文件 (UserBehavior.csv) 压缩为 gzip 格式: gzip UserBehavior.csv 创建外部 Stage 登入...