在零售技术做 AI 的 95 后:我们这样搞定技术难题
在京东零售技术团队中,有很多年轻的算法工程师,他们大多是95后,在加入京东的短短几年内,用实力“啃”下了一个个硬骨头。 从大模型训练的效率优化、生成效果的极致调优,到算法落地的工程难题、业务场景的创新应用,他们用行动证明——做难而正确的事,才是技术人最快的成长路径。 每个技术突破的背后,是数百次实验的坚持,是推翻重来的勇气,更是对技术极致的追求。 一起看看这群技术年轻人解决技术难题的故事。 技术难题: 判断广告图片合不合格就像评价"这幅画美不美",涉及大量主观标准,人类一眼能看出的商品变形、错位等问题,AI评委经常"看不懂"。 现有的奖励模型给出的决策常常无法精准指导AI调整,如何让AI像人类一样精准理解图片中复杂的审美和商业要求,并给出具体改进方向的评判指引? 我的解题思路: 拿到这道题时,我在思考:是否可以用多个奖励小模型的组合来替代单一奖励大模型呢?让每个小模型专注评判图片的某一类问题,如商品形状、摆放位置、色彩搭配等,降低单一模型的学习难度,同时提升评判的精细度;另一方面多奖励模型意味着更灵活的业务规则嵌入和更丰富的模型组合方式,提高了奖励信号质量...
