快手发布开源多模态大模型 Kwai Keye-VL-1.5
快手近日正式发布多模态大语言模型Keye-VL-1.5-8B。
https://huggingface.co/Kwai-Keye/Keye-VL-1_5-8B
据介绍,与之前的版本相比,Keye-VL-1.5的综合性能实现显著提升,尤其在基础视觉理解能力方面,包括视觉元素识别、推理能力以及对时序信息的理—表现尤为突出。Keye-VL-1.5在同等规模的模型中表现出色,甚至超越了一些闭源模型如GPT-4o。
Keye-VL-1.5采用四阶段渐进式训练流水线,以系统化方式提升模型性能。在视觉编码器预训练阶段,使用SigLIP-400M权重初始化ViT,并通过SigLIP对比损失持续预训练以适应内部数据分布。
第一阶段重点优化投影MLP层,实现跨模态特征的稳固对齐;第二阶段解冻全部参数进行端到端多任务预训练,显著增强基础视觉理解能力;第三阶段进行退火训练,利用高质量数据微调模型,弥补上一阶段中高质量样本接触不足的问题,同时将序列长度扩展至128K、调整RoPE逆频率配置,并引入长视频、长文本和大尺度图像等长上下文数据。
最终,通过同质-异质融合技术对不同数据混合比例下的模型权重进行平均,减少固定数据比例带来的内在偏差,在保持多样化能力的同时提升模型的鲁棒性。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
AI 编程公司 Replit 发布第三代自主编码 Agent
Replit宣布推出第三代自主编码 Agent(Agent 3),官方称其自主性提升至前代的 10 倍,单次可连续运行 200 分钟,全程无需人工干预。 自主性增强:Agent 3 可以自主测试和修复代码,甚至在后台持续改进用户的应用,将用户从重复性工作中解放出来。它能够像人类一样在浏览器中 “点击” 和 “操作”,检查应用中的按钮、表单和 API,确保一切正常运行。 持续运行能力:该版本能够持续自主运行超过三小时,相比之前的版本有了很大的进步。 提升开发效率:Agent 3 能够根据用户需求生成高质量代码,并主动提供优化建议,从而提升开发效率。 新系统通过自研测试框架在浏览器内自动点击按钮、填写表单、调用 API 并修复错误,其速度比主流 Computer Use 模型快 3 倍,成本则降低了 90%。 Agent 3 支持自然语言提示,用户可以用简单描述启动复杂项目,并在手机端通过 Live Monitoring 实时查看进度。其另一项突破是能够生成子 Agent 与自动化流程,成品可直接接入 Slack、Notion、邮件等平台,进一步扩展工作流。
-
下一篇
OpenAI 与微软达成非约束性协议:允许将营利部门转型公益股份公司
OpenAI 宣布与其主要投资方微软签署了一份非约束性谅解备忘录(MOU),开启双方合作的新阶段。 该协议的核心在于 OpenAI 计划将其营利部门转型为公益股份公司(Public Benefit Corporation,简称 PBC),这一转型若获得美国各州监管机构的批准,将为 OpenAI 带来更多的融资机会,并可能为未来上市铺平道路。 OpenAI 董事会主席布雷特・泰勒表示,公司的非营利组织将继续存在,并将保持对运营的控制权。在这份非约束性协议下,OpenAI 的非营利组织将获得新设 PBC 的股份,预计估值可能超过1000亿美元,约合7121.59亿元人民币。具体交易条款尚未披露,双方仍在积极推进最终协议的签署。 根据现有的协议,微软是 OpenAI 的主要云服务提供商,并享有优先使用其技术的权利。然而,随着 ChatGPT 业务的迅速发展,OpenAI 在谈判中希望降低微软对其的控制。泰勒表示,OpenAI 与微软正在与加州和特拉华州总检察长办公室沟通,说明转型计划需要获得监管机构的批准。 据《华尔街日报》报道,双方的谈判在过去几个月曾一度陷入僵局。微软希望掌控 OpenA...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Red5直播服务器,属于Java语言的直播服务器
- MySQL数据库在高并发下的优化方案
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- MySQL8.0.19开启GTID主从同步CentOS8
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Dcoker安装(在线仓库),最新的服务器搭配容器使用