首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://my.oschina.net/u/6839317/blog/10772378

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

中国电信星辰 AI 大模型开源

中国电信宣布将自研星辰 AI 大型模型全面开源,公开其底层代码、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力。 用户既可以直接调用大模型,也可以根据自身业务需求对大模型进行微调或个性化设置,或者加载自己的知识库或数据,从而调整出更符合自身业务需求、更加个性化的理想结果。 根据介绍,由中国电信完全自主研发的国内领先星辰系列大模型,构建了语义、语音、视觉及多模态大模型完备的基础框架。其中语义大模型于11月份发布千亿参数版本,在大模型知名榜单CSL排名第五、GAOKAO排名第七、AGIEval排名第八。 视觉大模型赋能100+城市治理下游任务,算法日均调用量达3.3亿次;多模态大模型聚焦图文生成和图文理解能力,采集超过12亿的风格数据,文图检索精度达到SOTA,支持20+风格生成。 语音大模型可实现高精度多方言的语音识别以及多语种、多风格、多音色的语音合成。与此同时,中国电信星辰系列大模型在覆盖视觉、语义、语音等多模态领域的20项国内外权威竞赛中斩获多项大奖,充分展现了国资央企在人工智能领域的自研实力和决心。 2023 年11月,中国电信宣布成立了中电信人工智能科技有限...

从工程化角度,详解鹏程·脑海大模型训练过程

从工程化的角度,对鹏城.脑海大模型训练语料处理、模型训练优化、模型应用等方面做出了全面详细的经验分享。 我们有幸邀请到了鹏城实验室高效能云计算所算法工程师陶恒韬老师来进行鹏城.脑海大模型训练过程的讲解。在课程中,陶老师从工程化的角度,对鹏城.脑海大模型训练语料处理、模型训练优化、模型应用等方面做出了全面详细的经验分享。 鹏城.脑海大模型介绍 鹏城·脑海(PengCheng Mind)大模型计划:旨在打造自然语言预训练大模型底座,将实现2000亿参数稠密型AI大模型 鹏城·脑海大模型: 以中文为核心的文本大模型基座 2000亿级别参数,稠密型自回归式语言模型 依托“鹏城云脑II”千卡集群,基于昇思MindSpore多维分布式并行技术进行预训练 保障大模型的数据安全隐私,输出内容符合中文核心价值观 大模型能力持续演进,快速迭代更新 训练语料处理和使用 语料清洗工程化:收集数据——格式预处理——数据清洗——脱敏过滤——样本间和样本内去重——数据集质量评估 脱敏过滤:通过分类模型进行过滤,并不断迭代优化,包含敏感词和文本过滤器、广告词过滤器、质量评估器 样本间和样本内去重:样本间采用计算has...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

JDK

JDK

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。