蚂蚁数科推出多语种视觉大模型训练框架-低调大师

蚂蚁数科推出多语种视觉大模型训练框架

2025-11-04 166

蚂蚁数科在香港金融科技节上发布了一项“多语种多模态大模型训练框架”技术，旨在解决当前大模型在多语言环境中的应用瓶颈。该框架在埃及阿拉伯语、印尼爪哇语、巴哈萨语及巽他语等资源稀缺的小语种上表现尤为突出。

这一突破的核心在于创新的语言感知优化框架。该框架通过 “以目标语言进行思考” 的机制，结合细粒度多维度的奖励策略与自动化数据解决方案，实现在小语种的深度理解和处理。

根据测试结果，与同等规模的开源模型相比，该框架在主流多语言视觉问答（Multilingual Visual Question Answering， VQA）基准测试中准确率提升了约9.5%，在部分任务中甚至优于 GPT-4o 和 Gemini-2.5-flash 等国际主流闭源模型，获得评测总分第一。

在安全能力方面，蚂蚁数科还推出了图像安全框架，结合视觉分析与常识推理的伪造识别路径，能够高效识别图像中的视觉不一致性和逻辑矛盾。这一技术不仅能够定位篡改区域，还能进行可解释分析，显著提升数字内容的风险控制能力。

作为蚂蚁数科全球业务的核心技术，这两项能力已在 ZOLOZ 文档识别鉴真产品（RealDoc）中实现了规模化应用，支持119种语言，能够高效处理多语种商务文档、合同和证件，覆盖保险理赔、信贷审核及跨境贸易等多个场景。

微信关注我们

原文链接：https://www.oschina.net/news/381527

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

元宝接入微信支付，新增三大 AI 功能：自动收款、宣传润色等

微信官微发布消息称，元宝正式接入微信支付，开通微信支付经营收款码的中小商户能在微信内轻松搞定收款算账、社群文案。微信右上角点击“收付款-二维码收款”，打开“经营收款码”再点击“收款码下单模式设置-拍菜单识别”，选择拍照或相册上传。不用挨个手动录入菜品和金额，“在线化菜单”秒生成。元宝识别出的菜单还可以直接变成收款时顾客付款可选的付款项。此外，用户下单时，还能在付款的同时备注名称、联系方式和特殊需求。社群带货的老板们，还可使用社群文案功能，打开“收款链接-复制链接”，选择发送到聊天，就能选用“元宝AI润色文案”，还能选择不同宣传对象和语言风格，生成专属带货文案。

2025-11-04

232

SUSE 宣布推出业界首款集成 Agentic AI（自主式 AI）的企业级 Linux——SUSE Linux Enterprise Server 16（SLES 16）。官方介绍称，SLES 16 是面向 AI 时代、为企业级应用而生的全新一代 Linux 平台。它采用了全新的系统架构，不仅延续了 SLES 系列一贯的稳定与安全基因，更在自主式 AI 、长生命周期支持、自动化运维及安全供应链方面进行了全面升级。 SUSE 使用 Model Context Protocol (MCP) 安全连接 AI 模型与数据源，维持对模型提供商的自由选择，以统一的基础设施和智能化运维能力，帮助企业轻松应对从数据中心到边缘、从传统应用到 AI 工作负载的多样挑战，企业能运行 AI 驱动的自动化但无需依赖单一生态系统。 SLES 16 提供了 16 年的生命周期，为 2038 年问题做好了准备。和 SLES 15 相比，SLES 16 在技术细节方面还有下面一些更新：区别 SLES 15 SLES 16 小版本标准支持周期 18个月 2年（24个月）小版本命名方式使用 SP 方式命名使...

2025-11-04

196

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。