您现在的位置是:首页 > 文章详情

豆包 1.5·深度思考模型发布

日期:2025-04-17点击:19

在今日火山引擎AI创新巡展杭州站现场,火山引擎总裁谭待发布了最新的豆包1.5·深度思考模型,升级豆包·文生图模型3.0、豆包·视觉理解模型。

同时,面向Agent服务,发布OS Agent解决方案、GUI Agent大模型——豆包1.5·UI-TARS模型;面向大规模推理,发布AI云原生·ServingKit推理套件。

据透露,截至2025年3月底,豆包大模型日均tokens调用量已超过12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。IDC报告显示,2024年中国公有云大模型调用量激增,火山引擎以46.4%的市场份额位居中国市场第一。

豆包1.5·深度思考模型在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出。同时,模型采用MoE架构,总参数200B,激活参数为20B,低于业界同类模型参数规模的50%,具备显著的推理成本优势。基于高效算法,豆包1.5·深度思考模型在提供行业极高并发承载能力的同时,实现20毫秒极低延迟。

此外,豆包1.5·深度思考模型还具备视觉理解能力,可以像人类一样,不光基于文字思考,更能基于所见画面思考,思考更立体,让模型同时拥有“大脑”和“眼睛”。

升级的豆包·文生图模型3.0则能够实现更好的文字排版表现、实拍级的图像生成效果,以及2K 的高清图片生成方式。可以广泛应用于影视、海报、绘画、玩偶设计等营销、电商、设计场景。

新版本的豆包·视觉理解模型具备更强的视觉定位能力,支持多目标、小目标、通用目标的框定位和点定位,并支持定位计数、描述定位内容、3D 定位。可应用于线下门店的巡检场景、GUI agent、机器人训练、自动驾驶训练等。新版本在视频理解能力上也有大幅提升,比如记忆、总结理解、速度感知、长视频理解等。

更多详情可查看官方公告

原文链接:https://www.oschina.net/news/345068
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章