微软推出小模型 Phi-2，性能优于 Llama 2/Mistral 7B-低调大师

微软推出小模型 Phi-2，性能优于 Llama 2/Mistral 7B

2023-12-13 403

微软宣布推出一个 27 亿参数的语言模型 Phi-2，并声称其性能可与大 25 倍的模型相匹配或优于。“展示了出色的推理和语言理解能力，展示了参数少于 130 亿的基础语言模型中最先进的性能。”

其基准测试结果表明，只需 27 亿个参数，Phi-2 就能在各种综合基准测试中超越 Mistral 和 Llama-2 模型在 7B 和 13B 参数下的性能。与大 25 倍的 Llama-2-70B 模型相比，Phi-2 在多步推理任务（即编码和数学）上实现了更好的性能。

此外，Phi-2 的性能与最近发布的 Google Gemini Nano 2 不相上下，甚至更胜一筹。

且与经过调整的现有开源模型相比，Phi-2 响应中的“毒性”和偏差也要更少。

此前，谷歌发布的 Gemini 演示视频曾展示了其解决复杂物理问题，以及对学生进行纠错的能力。微软研究人员也将 Phi-2 进行了同样的测试，并表示它同样能够正确回答问题，和使用相同的提示纠错。

Phi-2 是微软“小语言模型（SLM）”系列中的最新版本。第一个版本是拥有 13 亿参数的 Phi-1，针对基本的 Python 编码任务进行了微调。9 月，该公司将重点扩展到常识推理和语言理解，推出了一个新的 13 亿参数模型 Phi-1.5，性能可与大 5 倍的模型相媲美。

微软表示，Phi-2 的效率使其成为想要探索增强人工智能安全性、可解释性和语言模型道德发展等领域的研究人员的理想平台。目前，Phi-2 现已通过 Microsoft Azure AI Studio 的模型目录发布。

更多详情可查看官方博客。

微信关注我们

原文链接：https://www.oschina.net/news/270831/microsoft-phi-2-small-language-model

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Wi-Fi 7 将于 2024 年初全面登场，速度比 Wi-Fi 6 提升 5 倍

WiFi联盟宣布将在明年 1 月 9 日至 12 日参加 CES 2024，并确认基于 IEEE 802.11be 的 Wi-Fi CERTIFIED 7 认证标准将于第一季度末之前正式推出。与目前的 Wi-Fi 6 标准相比，该标准有望提供千兆位速度和其他改进。英特尔（Intel）和博通（Broadcom）去年展示的Wi-Fi 7（也称802.11be）速度高达5 Gbps，大大超过了Wi-Fi 6的典型最高速度约1.7 Gbps。Wi-Fi 7 允许在 2.4GHz、5GHz 和 6GHz 频率之间无缝切换，兼容设备可同时使用这些频率，从而实现了这一目标。此外，6GHz 频谱可提供 320MHz 的超宽信道，吞吐量比 Wi-Fi 6 翻了一番，这是速度提升的关键因素。通过从 1024 QAM 升级到 4K QAM，新标准还将传输速率提高了 20%。 Wi-Fi 7 连接也有望比以前的规格更加稳定。多链路操作可智能平衡流量，使网络能有效容纳更多设备。联盟表示，新标准将非常适合增强现实和虚拟现实应用。美国联邦通信委员会（FCC）最近初步批准了 6GHz 频谱上的超高速 Wi-Fi ...

2023-12-13

451

问题描述公司某规则引擎系统，在每次发版启动会手动预热，预热完成当流量切进来之后会偶发的出现一次长达1-2秒的Young GC（流量并不大，并且LB下的每个节点都会出现该情况）在这次长暂停之后，每一次的年轻代GC暂停时间又都恢复在20-100ms以内 2秒虽然看起来不算长吧，但规则引擎每次执行也才几毫秒，这谁能忍？而且这玩意一旦超时，出单可能也跟着超时失败！问题分析在分析该系统GC日志后发现，2s暂停发生在Young GC阶段，而且每次发生长暂停的Young GC都会伴随着新生代对象的晋升(Promotion) 核心JVM参数（Oracle JDK7） -Xms10G -Xmx10G -XX:NewSize=4G -XX:PermSize=1g -XX:MaxPermSize=4g -XX:+ 可能有人会问，为什么给这么大内存？祖传代码，内存小了跑不动！启动后第一次年轻代GC日志 2023-04-23T16:28:31.108+0800: [GC2023-04-23T16:28:31.108+0800: [ParNew2023-04-23T16...

2023-12-13

421

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。