海量数据 "写入、共享、存储、计算" 最佳实践
标签
PostgreSQL , 冷热分离 , 数据共享 , 打破孤岛 , 无盘工作 , 存储计算分离 , 行为数据 , 轨迹数据 , 金融数据 , 监控数据 , 物联网 , GIS , 范围 , 数组 , 图片
背景
数据是为业务服务的,业务方为了更加透彻的掌握业务本身或者使用该业务的群体,往往会收集,或者让应用埋点,收集更多的日志。
随着用户量、用户活跃度的增长,时间的积累等,数据产生的速度越来越快,数据堆积的量越来越大,数据的维度越来越多,数据类型越来越多,数据孤岛也越来越多。
日积月累,给企业IT带来诸多负担,IT成本不断增加,收益确不见得有多高。
上图描绘了企业中可能存在的问题:
1. 数据孤岛问题严重(如果没有大数据平台时)。
2. 对成本预估不足,计算能力扩容麻烦,又或者铺张浪费严重。
3. 数据冗余问题突出。
4. 存储成本昂贵。
5.
