阿里云开源通义千问大模型:免费、可商用
通义千问-7B(Qwen-7B)是阿里云研发的通义千问大模型系列的70亿参数规模的模型。 近日,阿里云开源了QWen-7B 和QWen-7B-Chat模型。目前,两个模型均已在AI模型社区「魔搭ModelScope」上线。 开源地址 魔搭ModelScope:https://modelscope.cn/models/qwen/Qwen-7B/summaryhttps://modelscope.cn/models/qwen/Qwen-7B-Chat/summary Hugging Face:https://huggingface.co/Qwen GitHub:https://github.com/QwenLM/Qwen-7B Qwen-7B是基于Transformer的大语言模型, 在超大规模的预训练数据上进行训练得到。预训练数据类型多样,覆盖广泛,包括大量网络文本、专业书籍、代码等。在Qwen-7B的基础上,阿里云使用对齐机制打造了基于大语言模型的AI助手Qwen-7B-Chat。 通义千问-7B(Qwen-7B)主要有以下特点: 大规模高质量训练语料:使用超过2.2万亿tokens的...
