阿里云开源通义千问大模型:免费、可商用
通义千问-7B(Qwen-7B) 是阿里云研发的通义千问大模型系列的70亿参数规模的模型。
近日,阿里云开源了QWen-7B 和QWen-7B-Chat模型。目前,两个模型均已在AI模型社区「魔搭ModelScope」上线。
开源地址
Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。在Qwen-7B的基础上,阿里云使用对齐机制打造了基于大语言模型的AI助手Qwen-7B-Chat。
通义千问-7B(Qwen-7B)主要有以下特点:
- 大规模高质量训练语料:使用超过2.2万亿tokens的数据进行预训练,包含高质量中、英、多语言、代码、数学等数据,涵盖通用及专业领域的训练语料。通过大量对比实验对预训练语料分布进行了优化。
- 强大的性能:Qwen-7B在多个中英文下游评测任务上(涵盖常识推理、代码、数学、翻译等),效果显著超越现有的相近规模开源模型,甚至在部分指标上相比更大尺寸模型也有较强竞争力。
- 覆盖更全面的词表:相比目前以中英词表为主的开源模型,Qwen-7B使用了约15万大小的词表。该词表对多语言更加友好,方便用户在不扩展词表的情况下对部分语种进行能力增强和扩展。
可在魔搭社区找到相关的详情信息:https://modelscope.cn/models

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
腾讯混元大模型开始应用内测
根据多家媒体的报道,腾讯自研的“腾讯混元大模型”已经进入应用内测阶段。腾讯员工近期收到了内部邮件邀请,可以通过网页或者小程序体验混元大模型,腾讯内部多个业务也已经接入混元大模型进行测试。 腾讯表示,从零开始、完全自研的腾讯混元大模型目前已经进入公司内应用测试阶段。此前,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等多个腾讯内部业务和产品,已经接入腾讯混元大模型测试并取得初步效果,更多业务和应用正在逐步接入中。腾讯将不断升级迭代,持续优化大模型能力,在条件成熟后,为行业和客户更好地提供服务。 除了较为常见的聊天对话,腾讯混元大模型设置了一个名为“灵感发现”的栏目,主打内容创作。根据指引,员工可以让AI生成小红书种草文案、短视频脚本、社群营销文案以及朋友圈文案等;还支持不同风格的“绘画”模式,比如赛博朋克风、像素插画风、马赛克风格等。 除此以外,作为通用大模型,腾讯混元大模型也囊括了多样化的场景,比如: 在“工作”场景下,员工可以写邮件、面试大纲、PPT大纲、调研问卷等; 在“编程”场景下,员工可以体验域名推荐、代码生成、代码解释、SQL语句生成等;...
- 下一篇
IBM 和 NASA 开源用于分析卫星数据的 AI 模型
IBM 宣布在 Hugging Face 上开源其 watsonx.ai 地理空间基础模型 -- 基于美国国家航空航天局 (NASA) 的卫星数据构建。这将是 Hugging Face 上最大的地理空间基础模型,也是首个与 NASA 合作构建的开源 AI 基础模型。 公告指出,作为与 NASA 签署的《太空法案协议》的一部分,IBM 在今年早些时候开始为地理空间数据建立 AI 基础模型。现在通过 Hugging Face 提供地理空间基础模型,可以推进 AI 访问和应用的民主化,从而在气候和地球科学领域产生新的创新。 IBM Research AI 副总裁 Sriram Raghavan 称,“开源技术在加速气候变化等关键发现领域的重要作用从未如此清晰......我们可以利用协作的力量来实施更快、更有影响力的解决方案,从而改善我们的星球。” IBM 和 NASA 在一个名为 Harmonized Landsat Sentinel-2 satellite data (HLS) 的地理空间数据集上联合训练了该模型。该数据集包括由 NASA 的 Landsat-8 卫星拍摄的地球表面图像,还...
相关文章
文章评论
共有0条评论来说两句吧...