OpenBuddy 发布基于 Llama 2 的新一代跨语言对话模型，开源可商用-低调大师

OpenBuddy 发布基于 Llama 2 的新一代跨语言对话模型，开源可商用

2023-07-26 1386

OpenBuddy-LLaMA2-13B 是一个基于 Llama 2 的全新跨语言对话模型。

Llama 2 是 Meta 最新发布的模型基座，它的数据比前一代模型更为充分，且对月活7亿以下的商用予以支持。这意味着，更多的公司和团队可以使用这个模型进行商业开发，推动各类应用的普及和创新。

然而，和之前的版本相同，Llama 2 仍具备一定的局限性：LLaMA模型基座以英语训练数据为主，未考虑跨语言场景应用。模型本身在英语上表现较好，但在中文等非英语语系的语言上，模型的输出难以令人满意。

此外，LLaMA2-Chat模型本身的泛化能力、多轮对话能力也存在局限性。

针对LLaMA2的局限性，OpenBuddy团队凭借在微调模型方面的经验，设计并实验了多种微调方案。最终选取了13B作为第一个版本的模型基座，因为它是个人用户可部署且具备涌现潜力的最佳模型大小。

在经过多轮微调和反复试验后，OpenBuddy团队成功完成了OpenBuddy-LLaMA2-13B的首个版本的训练工作。

OpenBuddy-LLaMA2-13B

在测试OpenBuddy-LLaMA2-13B的过程中，团队发现模型涌现出了强大的泛化能力和思辨能力，这是目前他们的研发历程中，最令人满意的13B模型。

模型具备一定的批判性思考能力，不会盲目信任用户给出的信息，且能够指出用户的错误或信息不足之处：

模型还具备一定程度的分析、归纳能力，在部分场景下，能够发现输入信息中的潜在规律，并给出分析结果：

此外，模型的内容创作能力、指令遵循能力也有进一步的提升，能够产生符合用户需求的内容：

据介绍，OpenBuddy-LLaMA2-13B模型还参与了HuggingFace的Open LLM Leaderboard测试榜单，并取得了非常靠前的成绩。模型在英文综合能力评分上超过了Vicuna、WizardLM 1.0、Meta官方的Llama2-chat等多种13B模型，甚至能够接近MPT-30B等数倍规模的大模型。

微信关注我们

原文链接：https://www.oschina.net/news/250986

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

信通院公布第三批《信息安全技术软件产品开源代码安全评价方法》国家标准试点验证结果

为进一步推动国内开源供应链安全发展，提升各企事业单位开源供应链安全管理能力，降低开源供应链安全风险，2023年7月18日上午9:00，由中国信息通信研究院和中国通信标准化协会合办的“2023中国互联网大会开源供应链论坛”在北京举办。作为论坛的重磅环节，中国信通院发布了第三批《信息安全技术软件产品开源代码安全评价方法》国家标准试点验证结果。在tc260的指导下，中国信息通信研究院牵头立项《信息安全技术软件产品开源代码安全评价方法》国家标准并持续推进标准编制工作。本标准从软件产品中开源代码来源、开源代码安全质量、开源代码知识产权和开源代码管理四方面进行安全评价，为各单位对于自身软件产品开源代码安全性自评价提供参考，为第三方机构对于软件产品开源代码安全能力进行审查和评估时提供依据，也可为主管监管部门提供参考。同时旨在为加强网络安全和信息化建设贡献力量，营造开源代码安全的网络空间。软件产品开源代码安全评价方法体系框架图为提高标准落地实施性，对标准内容进行持续完善，中国信通院分批次组织《信息安全技术软件产品开源代码安全评价方法》国标试点验证工作，经过验证准备和报名、技术测试、材料审查...

2023-07-26

984

GLM 技术团队宣布开源最新的代码模型 CodeGeeX2-6B。CodeGeeX2 是多语言代码生成模型 CodeGeeX 的第二代模型，基于 ChatGLM2 架构注入代码实现。我们希望每一位程序员，都能在自己机器上跑上一个自己的编程助手。为实现这一目标，我们现将「代码生成模型 CodeGeeX2-6B」开源。同时我们也将对该模型持续进行迭代升级，以提供更加强大的代码辅助能力。公告称，得益于 ChatGLM2 的更优性能，CodeGeeX2-6B 在多项指标上取得了较大的性能提升。与 150 亿参数的 StarCoder-15B 相比，CodeGeeX2-6B 凭借 60 亿参数便具备了近 10% 的优势。更多特性包括：更强大的代码能力：基于 ChatGLM2-6B 基座语言模型，CodeGeeX2-6B 进一步经过了 600B 代码数据预训练，相比一代模型，在代码能力上全面提升，HumanEval-X 评测集的六种编程语言均大幅提升 (Python +57%, C++ +71%, Java +54%, JavaScript +83%, Go +56%, Rust +321...

2023-07-26

982

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。