360 开源视觉语言对齐模型 FG-CLIP2
360 集团近日开源视觉语言对齐模型 FG-CLIP2。这款模型在涵盖长短文本图文检索、目标检测等在内的29项权威公开基准测试中,全面超越了科技巨头Google的SigLIP 2与Meta的MetaCLIP2。
根据介绍,FG-CLIP2 在模型核心上实现了三大根本创新:第一,层次化对齐架构,让模型能像人眼一样,同时把握宏观场景与微观细节,实现从“看得见”到“看得清”的跨越。
第二,动态注意力机制,使模型可以智能聚焦于图像关键区域,以最小算力代价换取精准的细节捕捉能力。第三,双语协同优化策略,从底层解决了中英文理解不平衡的难题,实现了真正的双语原生支持。
FG-CLIP2依托于自研的超大规模高质量数据集FineHARD。该数据集不仅包含详尽的全局描述和千万级的局部区域标注,还创新性地引入了由大模型生成的“难负样本”。
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
用智能体重塑 DevOps:Gitee 如何打造全域研发引擎
10月16日,开源中国郑州研发中心总经理常毅受邀出席第27届中国国际软件博览会「人工智能+软件」分论坛并发表演讲。常毅围绕《智能 DevOps,企业级 DevOps 全域智能体系》,系统介绍了 Gitee 在企业智能研发领域的探索与实践,全面展示了以「Gitee DevOps + Xtreme 极智 AI」为核心的智能化研发体系。 💡DevOps 走向智能时代:从工具到智能体的飞跃 在演讲中,常毅指出,AI 真正的价值不在于「加一点智能」,而在于在关键环节实现「极致提升」:极致的工作效率、极致的信息效率、极致的代码质量、极致的交付可靠性。 围绕这一目标,Gitee 提出了融合 DevOps 与智能体(Agent)的全新架构,以 Gitee DevOps 为地基,以智能体驱动为核心,构建出一整套覆盖研发全流程的智能化体系,既解放人力、又保障质量,让企业研发真正步入 AI 原生时代。 💡五大模块,覆盖企业研发核心场景 这一体系由五大模块组成,贯穿从写文档、写代码到测试交付、协同管理、度量分析等各类场景: 智能文档创作:自动生成流程图、架构图,进行文档规范检测与内容撰写; 智能协同管...
-
下一篇
腾讯投资 AI Agent 初创公司 Genspark,估值突破 10 亿美元
外媒The Information援引知情人士报道,百度集团前副总裁景鲲创办的AI Agent初创公司Genspark,正在进行新一轮融资,规模逾2亿美元(约合人民币14.2亿元),投后估值预计超10亿美元(约合人民币71.1亿元)。 消息人士称,腾讯、红杉中国已确认参投,其他潜在投资方还包括韩国LG Technology Ventures与日本SBI Investment等机构。目前,融资计划尚在推进中。 今年3月,Genspark刚完成一笔1亿美元(约合人民币7.1亿元)的A轮融资,投后估值为5.3亿美元(约合人民币37.6亿元)。而仅仅半年后,其估值便迅速翻倍。 值得注意的是,腾讯与红杉中国也参与了Manus母公司“蝴蝶效应”(Butterfly Effect)的投资。据Manus创始人兼CEO肖弘在2025年3月接受腾讯科技采访时透露,该公司已完成两轮融资,第二轮由腾讯、红杉中国、真格基金以及美团联合创始人王慧文共同参投,彼时该公司估值达到1亿美元(约合人民币7.1亿元)。
相关文章
文章评论
共有0条评论来说两句吧...



微信收款码
支付宝收款码