深数所发布 500 个行业多模态算料集
在日前举办的“数·算·网”融合发展暨粤港澳大湾区算力服务联盟第一期交流研讨会上,深圳数据交易所发布了500个垂直行业多模态算料集,按照大模型应用的不同阶段,有的放矢地提供数据源,让国产大模型厂商“寻数有路”。
此次深数所发布的首批500个人工智能大模型高质量训练数据集,由37家不同的数据商提供,涵盖12个“数据要素×”领域,3家境外数据商,7类数据模态(文本、图像、音频、视频、多模态、3D、GIS等)。
且本批数据集首次汇聚了来自中国气象局、中国知网、中译语通、万邦同和、微梦数据(新浪微博)、前海数据、海天瑞声、拓尔思、数据堂、智慧芽、网智天元、柏川数据、深信科技等数据商的数据集作为大模型算料。其中大部分算料为全国首发。
深数所人工智能行业有关人士表示,数据作为一个高效的“乘法”因子,能够与不同行业结合,显著提升行业的生产效率或创新能力,而人工智能技术则通过“加法”方式为传统产业带来渐进式的改进和优化,两者相互交织,共同成为数字经济发展的双翼。
“数据都是零散的,国产大模型厂商无法实现批量采集数据,我们此次推出的算料集就是,将大模型需要的训练数据进行逻辑的汇聚,从而形成了一个大模型训练数据产业高地。”

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
彭博社:苹果计划以 AI 为重点的 M4 芯片改造 Mac 产品线
彭博社援引知情人士消息称,为了刺激低迷的电脑销售,苹果公司计划生产新的 M4 处理器以全面改造其整个 Mac 产品线,从而突出 AI 功能。 其中,iMac、低端 14 英寸 MacBook Pro、高端 14 英寸 MacBook Pro、16 英寸 MacBook Pro 和 Mac mini 机器将在 2024 年率先采用 M4 芯片,随后在 2025 年中期的某个时候更新 13 英寸和 15 英寸 MacBook Air 机型,Mac Studio 和 Mac Pro 则将在晚些时候获得更新。 报道指出,M4 芯片将至少分为三个不同的级别,包括代号为 Donan 的入门级 M4 芯片、中端的 Brava 芯片和性能最高的 Hidra 芯片。这三个版本的芯片都将拥有高于 M3 的 AI 处理能力。 苹果将为入门级 MacBook Pro、MacBook Air 和低端 Mac Mini 添加 Donan 芯片。为高配置的 MacBook Pro、Mac Minis 和 Mac Studio 保留中端 Brava 芯片,为 Mac Pro 添加顶级 Hidra 芯片。 去年 10 ...
- 下一篇
Solon 的事务管理工具类(TranUtils)
Solon 在编码上,是强调注解与手写并重的一个风格。它有个@Tran注解,用于事务管理(可以参考:《事务的全局控制及应用》)。这里,主要是讲讲它的手动处理工具类TranUtils。 1、看看它的接口: public final class TranUtils { //执行事务 public static void execute(Tran tran, RunnableEx runnable) throws Throwable; //是否在事务中 public static boolean inTrans(); //是否在事务中且只读 public static boolean inTransAndReadOnly(); //监听事务 public static void listen(TranListener listener) throws IllegalStateException; //获取链接 public static Connection getConnection(DataSource ds) throws SQLException; //获取...
相关文章
文章评论
共有0条评论来说两句吧...