Stability AI 开源大型语言模型 StableLM,只会一点点中文
Stability AI 是 Stable Diffusion 图像生成工具背后的公司,如今他们不再局限于开发图像/视频生成方面的 AI,于今天正式发布了一套开源的大型语言模型(LLM)—— StableLM,首次涉足目前由 OpenAI、Meta 和 Google 等科技公司主导的语言模型领域。
StableLM 跟 ChatGPT、Bard 这些一样,被设计用来生成文本和代码。它是通过使用开源数据集 the Pile 训练而来的,这个数据集包含的数据来源就有维基百科、Stack Exchange 和 PubMed。不过,Stability AI 在 the Pile 的基础上进行了扩展,所使用的数据集大小是标准 the Pile 的 3 倍。
Stability AI 现在已经将这个 StableLM 模型发布到了 GitHub 上,开发者可以使用或经过调整后再使用。StableLM 模型还处于 Alpha 阶段,它的参数也比较少,只有 30 亿和 70 亿个参数,之后他们还会推出有 150 亿到 650 亿参数的模型。
对于 AI 可能会产生的风险,Stability AI 也给出了提醒:
对于任何没有额外微调和强化学习的预训练大型语言模型来说,用户得到的回应质量可能参差不齐,并且可能包括冒犯性的语言和观点。这有望随着规模、更好的数据、社区反馈和优化而得到改善。
除了将代码托管在 GitHub 上,Stability AI 还在 Hugging Face 上发布了一个演示版本,经过测试 StableLM 会说中文,但只会一点点(回复内容对应不上,语句也不通顺)。
在 Stable Diffusion 发布后,Stability AI 遭到了很多艺术家的投诉和起诉,指控它通过使用网络抓取的受版权保护的图像开发 AI 图像生成工具,侵犯了艺术家们的权利。在之前的纠纷还没解决的情况下,如今推出 StableLM 不知道是否还会引发更多的诉讼。
Stability AI 在去年 10 月融资了 1 亿美元,公司估值也超过了 10 亿美元。但 AI 是一个投入非常高,可能短期也很难产生收益的领域,也不知道这 1 亿美金现在还剩多少,为了在这个领域持续发展,Stability AI 会不会继续融资,亦或是投入某个大型公司的怀抱呢?
项目地址:链接

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
JeecgBoot 3.5.1 版本发布,开源的企业级低代码平台
项目介绍 JeecgBoot 是一款企业级的低代码平台!前后端分离架构 SpringBoot2.x,SpringCloud,Ant Design&Vue3,Mybatis-plus,Shiro,JWT 支持微服务。强大的代码生成器让前后端代码一键生成!JeecgBoot 引领低代码开发模式 (OnlineCoding-> 代码生成 -> 手工 MERGE), 帮助解决 Java 项目 70% 的重复工作,让开发更多关注业务。既能快速提高效率,节省成本,同时又不失灵活性! 当前版本:v3.5.1 | 2023-04-20 源码下载 后端:https://github.com/jeecgboot/jeecg-boot 前端:https://github.com/jeecgboot/jeecgboot-vue3 技术交流 开发文档:https://help.jeecg.com 官方网站:http://www.jeecg.com 在线演示:http://boot3.jeecg.com 快速入门:入门视频|代码生成 QQ 交流群:791696430 升级日志 小版本升级,修复...
- 下一篇
基于 DolphinDB 机器学习的出租车行程时间预测
DolphinDB 集高性能时序数据库与全面的分析功能为一体,可用于海量结构化数据的存储、查询、分析、实时计算等,在工业物联网场景中应用广泛。本文以纽约出租车行程时间预测为例,介绍如何使用 DolphinDB 训练机器学习模型,并进行实时数据的预测,为基于智能网联汽车的车联网企业提供基于机器学习方法的即时预测方案。 1. 概要 随着手机移动应用与网约车平台的迅速发展,网约车出行逐渐成为城市生活中一种重要的出行方式。相较其他出行方式而言,选择网约车的乘客对出行时效性有更高的要求,本文将基于乘客上车时间及上下车地点等静态信息,使用 DolphinDB 机器学习方法训练模型,预测网约车行程时间。 在此基础上,本文将介绍如何使用DolphinDB 流数据处理系统对业务系统产生的持续增长的网约车订单动态数据进行实时的收集、清洗、统计、入库,并实时展示行程时间预测结果。 行程时间实时预测流程 2. 数据介绍 2.1 数据来源及训练方法 本文训练和预测采用Kaggle提供的来自纽约出租车委员会的数据集,训练方法参考了获奖者beluga的模型,使用 DolphinDB 对原始数据进行数据预处理,完成位...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Linux系统CentOS6、CentOS7手动修改IP地址
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS8安装Docker,最新的服务器搭配容器使用
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Windows10,CentOS7,CentOS8安装Nodejs环境
- SpringBoot2全家桶,快速入门学习开发网站教程