书生·浦语2.0(InternLM2)大语言模型正式开源
1月17日,书生·浦语2.0(InternLM2)发布会暨书生·浦源大模型挑战赛启动仪式在上海举行。上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.0(InternLM2)。
开源地址
- Github:https://github.com/InternLM/InternLM
- HuggingFace:https://huggingface.co/internlm
- ModelScope:https://modelscope.cn/organization/Shanghai_AI_Laboratory
据介绍,InternLM2是在2.6万亿token的高质量语料上训练得到的。沿袭第一代书生·浦语(InternLM)的设定,InternLM2包含7B及20B两种参数规格及基座、对话等版本,满足不同复杂应用场景需求。秉持“以高质量开源赋能创新”理念,上海AI实验室继续提供InternLM2免费商用授权。
InternLM2 的核心理念在于回归语言建模的本质,致力于通过提高语料质量及信息密度,实现模型基座语言建模能力获得质的提升,进而在数理、代码、对话、创作等各方面都取得长足进步,综合性能达到同量级开源模型的领先水平。其支持200K token的上下文,一次性接收并处理约30万汉字的输入内容,准确提取关键信息,实现长文本中“大海捞针”。
此外,InternLM2的各项能力获得全面进步,相比于初代InternLM,在推理、数学、代码等方面的能力提升尤为显著,综合能力领先于同量级开源模型。
根据大语言模型的应用方式和用户关注的重点领域,研究人员定义了语言、知识、推理、数学、代码、考试等六个能力维度,在55个主流评测集上对多个同量级模型的表现进行了综合评测。评测结果显示,InternLM2的轻量级(7B)及中量级(20B)版本性能在同量级模型中表现优异。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
ICLR 2024 录用结果公布,MetaGPT 喜提 ICLR 2024 Oral (1.2%)
一年一度的ICLR顶会录用结果公布了!今年共7000多篇投稿论文,录用率31%。 邮件显示,今年ICLR 2024组委会共收到了7262篇投稿,总体录用率约为31%,与去年相似(2023年总投稿数5000)。 其中spotlights论文的录用率为5%(约有363篇),Oral论文的录用率为1.2%(约有85篇)。 ICLR提交的论文主题大致包括:700篇有扩散,NeRF少于100篇,900多篇大模型,100多篇ChatGPT(8篇Bard,16篇Claude),170篇关于Llama,200篇CLIP,200篇NLP,大约750篇视觉研究。 在即将到来的国际计算机学习表征会议(ICLR 2024)上,一个重要的研究成果“MetaGPT: Meta Programming for Multi-Agent Collaborative Framework”将被展示为口头报告。这一荣誉仅授予了总提交论文中的1.2%。 该项目是关于多智能体系统的先进研究,旨在通过元编程提升协作机器学习模型的效能。项目由一支国际研究团队完成,他们对这一成就表示欣喜。 该论文的选中体现了团队的创新能力和科研成果的...
- 下一篇
我成为开源贡献者的原因竟然是做MySql-CDC数据同步
今年下半年机缘巧合下公司决定搭建自己的数据中台,中台的建设势必少不了数据集成。首先面临的就是数据集成技术选型的问题,按照社区活跃度、数据源适配性、同步效率等要求对市面上几个成熟度较高的开源引擎进行了深度调研。 最终经过内部讨论决定用Apache SeaTunnel作为数据集成的基础能力。 贡献经历 在了解Apache SeaTunnel之前,自己基本没有深入参与过开源项目,大多都是工作需要从而来使用。虽然内心有想尝试开源,但由于没有合适的机会,就一直没有实践。而SeaTunnel目前正处于高速迭代的阶段,这让我看到了一丝契机。 碰到问题 大概是在今年的7月份,公司在使用MySql-CDC做数据同步时遇到了一个问题,在数据同步前期任务可以正常运行,但是在运行一段时间后发现Server端日志中出现大量的GC输出,并且看到GC对内存回收效率不高。 尝试解决 因为在这之前我们的批作业是能够正确完成,所以首先排除了由于使用不当的原因。由于是内存问题,我们尝试减小JVM堆内存参数,并开启了JMX内存监控,重新运行CDC任务尝试复现问题,不出意外问题再一次出现了,根据内存监控发现CDC任务运行过程中...
相关文章
文章评论
共有0条评论来说两句吧...