Meta Llama 3 正式发布
Meta 宣布正式推出下一代开源大语言模型 Llama 3;共包括 80 亿和 700 亿参数两种版本,号称“是 Llama 2 的重大飞跃”,并为这些规模的 LLM 确立了新的标准。
目前,Llama 3 已集成到智能助手 Meta AI 中。预计 Meta Llama 3 将很快在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM 和 Snowflake 上提供,并得到 AMD、AWS、戴尔、英特尔、NVIDIA 和高通提供的硬件平台的支持。
“由于预训练和训练后的改进,我们的预训练和指令微调模型是当今 8B 和 70B 参数规模的最佳模型。我们训练后程序的改进大大降低了错误拒绝率,改善了一致性,并增加了模型响应的多样性。我们还看到了推理、代码生成和指令跟踪等功能的极大改进,使 Llama 3 更加易于操控。”
此外,Meta 还开发了自己的测试集。包含 1,800 个 prompts,涵盖 12 个关键用例:寻求建议、头脑风暴、分类、封闭式问答、编码、创意写作、提取、塑造角色/角色、开放式问答、推理、重写和总结。
在模型架构方面,Llama 3 选择了一个相对标准的纯解码器 Transformer 架构。与 Llama 2 相比,做了几个关键的改进。Llama 3 使用一个包含 128K tokens的分词器,可以更有效地编码语言,从而显著提高模型性能。
为了提高 Llama 3 模型的推理效率,在 8B 和 70B 两种规模上都采用了分组查询注意力(GQA)机制;同时在 8192 个tokens的序列上训练模型,使用掩码确保自注意力不会跨越文档边界。
为了训练出最好的语言模型,Meta 在预训练数据上投入了大量资金。Llama 3 使用超过 15 万亿个公开可用来源的 token 进行了预训练,训练数据集相较 Llama 2 大了有七倍,代码量是 Llama 2 的 4 倍。它支持 8K 上下文长度,是 Llama 2 容量的两倍。
其中超过 5% 的 Llama 3 预训练数据集由涵盖 30 多种语言的高质量非英语数据组成,以为即将到来的多语言使用用例做好准备。不过“预计这些语言的性能水平不会与英语相同。”
值得一提的是,Meta 公司还在训练更大的模型,拥有超过 4000 亿参数。在接下来的几个月中,他们预计将发布多个具有新功能的模型,包括多模态、以多种语言交谈的能力、更长的上下文窗口和更强的整体功能。一旦完成 Llama 3 的训练,还将发布一份详细的研究论文。
更多详情可查看官方公告。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
云原生虚拟数仓 PieCloudDB Database 4 月更新盘点
第一部分 PieCloudDB Database 最新动态 增强本地缓存文件生命周期管理 PieCloudDB 在最新版本中增强了本地缓存文件生命周期管理,执行器节点重启之后可以继续使用之前缓存在本地的数据文件,从而节约重新从远端下载数据文件的带宽资源,提升查询首次响应速度。 Interconnect Proxy 多进程支持 PieCloudDB 在最新版本中支持为执行器节点配置多个 Interconnect Proxy 代理进程。多个代理进程可以提升 Interconnect 的跨节点网络处理能力,解决部分查询带来的 Interconnect 流量过大导致 proxy 进程成为瓶颈的问题。 用户可以在启动集群时,通过“pdb_ic_proxy_num_worker = 进程数”配置选项来启用该功能。 支持 Flink Connector 组件 PieCloudDB 现支持通过 Flink Connector,与流处理引擎 Apache Flink 进行交互,具备数据的实时导入能力,能够保证精准一次的导入语义。让用户能够充分利用 Flink 的计算和处理功能,从而为用户带来了更多灵活性...
- 下一篇
特斯拉裁员事件记录
4/15 周一 4:30am: 一早打开笔记本,发现账号被封了。原以为是IT部门的常规问题,没太放在心上。 5:00am: 我通常会在自动驾驶的路上查看邮件(通勤总时长1小时30分钟)。 邮件里写道:“遗憾的通知您,因本次公司重组,您的职位已经取消。” 5:05am: 给经理发了个短信,经理回复说:“大家都收到这消息了,稍后会有进一步的说明。” 5:50am: 试图刷卡进门时,保安却收走了我的工牌,并告知我已被解雇。 6:00am: 坐回车里,完全不敢相信这是真的。 Tesla 任职时间线: 2019年7月22日至2024年4月15日 我在Tesla工作了将近五年,整整半个十年! 2023年时,我曾多次选择在工作日住在车里,只是为了避免长时间通勤。在工厂里解决洗漱,在停车场过夜,在休息室用微波炉热饭。 为了公司,我付出了许多。尽管如此,这只是人生篇章中即将翻页的一小部分,新的篇章正等着我去书写。我今年29岁,职场路上还有很长的旅程要走。 我的职场生涯是从一名普通的生产助理做起,逐步晋升至生产领班,最终成为生产主管。一路上,我学会了如何在不断变化的环境中调整自己,如何用有限的资源达成更多...
相关文章
文章评论
共有0条评论来说两句吧...