每日一博 | 标签评分:海量标签如何进行系统治理?
本篇是「标签画像系列」的第四篇,此前我们已经介绍过了标签画像体系建设方法论、标签体系设计与加工、标签加工与落库,这次我们来介绍一下「标签评分」。 标签评分是标签治理的一个重要措施,通过给标签打分,可清晰直观的从各个维度评估标签,掌握标签真实使用情况,进行标签持续优化,助力业务运营。同时,也能帮助数据团队判断哪些标签更应该投入计算与存储资源,合理规划集群资源。 一、为何要使用标签评分? 经过前期标签体系设计、标签加工,标签终于可以上线,让业务人员使用,发挥价值了! 随着标签上线一段时间后,我们开始关心每天占用计算资源与存储空间,跑出来的上百个标签,业务同学真的用到了多少,业务收益是否能覆盖数据成本呢?标签上线后,其质量怎么样,是否存在老规则不适用、需要持续优化的情况? 带着这一问题,我们需要用一种方法来评估标签上线后的使用情况,标识各个标签的价值。参考电影评分、花呗评分等形式,我们决定也给标签打个分、排个序,简单明了。 二、标签评分模型 标签评分模型,经过考虑我们选取了5个维度作为评分入参: 标签总评分= a * 标签使用度评分 + b * 标签关注度评分 + c * 标签质量评分 + ...
