蚂蚁数科推出多语种视觉大模型训练框架
蚂蚁数科在香港金融科技节上发布了一项“多语种多模态大模型训练框架”技术,旨在解决当前大模型在多语言环境中的应用瓶颈。该框架在埃及阿拉伯语、印尼爪哇语、巴哈萨语及巽他语等资源稀缺的小语种上表现尤为突出。
这一突破的核心在于创新的语言感知优化框架。该框架通过 “以目标语言进行思考” 的机制,结合细粒度多维度的奖励策略与自动化数据解决方案,实现在小语种的深度理解和处理。
根据测试结果,与同等规模的开源模型相比,该框架在主流多语言视觉问答(Multilingual Visual Question Answering, VQA)基准测试中准确率提升了约9.5%,在部分任务中甚至优于 GPT-4o 和 Gemini-2.5-flash 等国际主流闭源模型,获得评测总分第一。
在安全能力方面,蚂蚁数科还推出了图像安全框架,结合视觉分析与常识推理的伪造识别路径,能够高效识别图像中的视觉不一致性和逻辑矛盾。这一技术不仅能够定位篡改区域,还能进行可解释分析,显著提升数字内容的风险控制能力。
作为蚂蚁数科全球业务的核心技术,这两项能力已在 ZOLOZ 文档识别鉴真产品(RealDoc)中实现了规模化应用,支持119种语言,能够高效处理多语种商务文档、合同和证件,覆盖保险理赔、信贷审核及跨境贸易等多个场景。
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
元宝接入微信支付,新增三大 AI 功能:自动收款、宣传润色等
微信官微发布消息称,元宝正式接入微信支付,开通微信支付经营收款码的中小商户能在微信内轻松搞定收款算账、社群文案。 微信右上角点击“收付款-二维码收款”,打开“经营收款码”再点击“收款码下单模式设置-拍菜单识别”,选择拍照或相册上传。不用挨个手动录入菜品和金额,“在线化菜单”秒生成。元宝识别出的菜单还可以直接变成收款时顾客付款可选的付款项。此外,用户下单时,还能在付款的同时备注名称、联系方式和特殊需求。 社群带货的老板们,还可使用社群文案功能,打开“收款链接-复制链接”,选择发送到聊天,就能选用“元宝AI润色文案”,还能选择不同宣传对象和语言风格,生成专属带货文案。
-
下一篇
SUSE 成为首个集成 Agentic AI(自主式 AI)的 Linux 企业发行版
SUSE 宣布推出业界首款集成 Agentic AI(自主式 AI)的企业级 Linux——SUSE Linux Enterprise Server 16(SLES 16)。 官方介绍称,SLES 16 是面向 AI 时代、为企业级应用而生的全新一代 Linux 平台。它采用了全新的系统架构,不仅延续了 SLES 系列一贯的稳定与安全基因,更在自主式 AI 、长生命周期支持、自动化运维及安全供应链方面进行了全面升级。 SUSE 使用 Model Context Protocol (MCP) 安全连接 AI 模型与数据源,维持对模型提供商的自由选择, 以统一的基础设施和智能化运维能力,帮助企业轻松应对从数据中心到边缘、从传统应用到 AI 工作负载的多样挑战,企业能运行 AI 驱动的自动化但无需依赖单一生态系统。 SLES 16 提供了 16 年的生命周期,为 2038 年问题做好了准备。和 SLES 15 相比,SLES 16 在技术细节方面还有下面一些更新: 区别 SLES 15 SLES 16 小版本标准支持周期 18个月 2年(24个月) 小版本命名方式 使用 SP 方式命名 使...
相关文章
文章评论
共有0条评论来说两句吧...


微信收款码
支付宝收款码