携程基于Flink的实时特征平台
本文来自7月26日在上海举行的 Flink Meetup 会议,分享来自于刘康,目前在大数据平台部从事模型生命周期相关平台开发,现在主要负责基于flink开发实时模型特征计算平台。熟悉分布式计算,在模型部署及运维方面有丰富实战经验和深入的理解,对模型的算法及训练有一定的了解。 本文主要内容如下: 在公司实时特征开发的现状基础上,说明实时特征平台的开发背景、目标以及现状 选择Flink作为平台计算引擎的原因 Flink的实践:有代表性的使用示例、为兼容Aerospike(平台的存储介质)的开发以及碰到的坑 当前效果&未来规划 一、在公司实时特征开发的现状基础上,说明实时特征平台的开发背景、目标以及现状 1、原实时特征作业的开发运维; 1.1、选择实时计算平台:依据项目的性能指标要求(latency,throughput等),在已有的实时计算