2023 年度 npm 回顾
Socket 发文对包管理器 npm 在 2023 年的表现进行了回顾。主要聚焦于生态系统中的一些主要趋势、npm 在过去一年中的发展情况,以及深入探讨 npm 在这一年中所面临的一些恶意软件和垃圾邮件问题等等。
Socket 是一家提供扫描工具来检测开源代码中安全漏洞的初创公司,旨在保护应用程序免受潜伏在开源供应链中的恶意依赖项的影响。
文中指出,截至 2023 年底,Socket 已经从 npm 注册表中摄取了来自近 90 万个维护者的近 40 万个软件包。npm 的官方统计数据则显示,到 2023 年底,实时包数量超过 250 万个,每月下载量超过 1840 亿次。250 万和 400 万的数据差异表明,许多软件包最终都会从平台中删除。
在 npm 上发布软件包不需要走审查流程,因此操作起来十分简单;也正因此,npm 注册表拥有一个“比其他语言生态系统存在更多恶意软件包”的名声。但 Socket 指出,根据其在 Python 生态系统中的一些发现表明,有关 npm 的这一认知并不完全正确。
数据显示,2023 年 npm 注册表共发布了 10,518,566 个软件包版本,还有 1,241,583 个未发布版本。其中 3 月和 4 月更新的软件包最多,可能是源于 2023 年 3 月和 4 月发生的大规模以 John Wick 为主题的垃圾邮件和网络钓鱼活动。
2023 年共新增了 165,486 个维护者,按照这一增长速度,预计将在 2024 年突破 100 万软件包维护者大关。
Socket 还统计了发布和使用最多的软件包类型,并按依赖包的数量显示了排名前 50 的 npm 软件包:
一个明显的现象是,TypeScript 已经变得非常流行。排在第二位的是 React,这一结果也并不令人意外;因为它拥有庞大的组件生态系统,且在生态系统中占据主导地位。榜单中唯一的前端库是 Vue.js,Angular (@angular/core
) 则出现在第 62 位。
按照每周下载量来计算,排名前 20 的 npm 软件包有:
其中,多产的开源开发者和维护者 Sindre Sorhus 在此榜单中占有重要地位,榜单中一半的软件包都与其有关。
从 2023 年首次发布的软件包角度看,Top 20 结果如下:
值得一提的是,Socket AI 扫描了 npm 软件包内的数百万个文件发现,2023 年有五千多个软件包被识别为恶意软件,不过这些软件包已经被删除。除了恶意软件的增加之外,npm 还面临多次垃圾邮件活动。
还有一些有趣的发现包括:
- 名称最长的包(214 个字符是 npm 上包名称允许的最大长度),以下是超出了可用字符数的上限的软件包:
ifyouwanttogetthesumoftwonumberswherethosetwonumbersarechosenbyfindingthelargestoftwooutofthreenumbersandsquaringthemwhichismultiplyingthembyitselfthenyoushouldinputthreenumbersintothisfunctionanditwilldothatforyou
koishi-plugin-uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu
this-package-exports-the-number-214-and-its-name-is-also-two-hundred-and-fourteen-characters-long-which-is-the-longest-name-currently-allowed-by-the-npm-registry-to-see-how-a-name-that-long-would-look-if-you-did-ii
this-package-exports-the-number-214-and-its-name-is-also-two-hundred-and-fourteen-characters-long-which-is-the-longest-name-currently-allowed-by-the-npm-registry-to-see-how-a-name-that-long-would-look-if-you-did-it
- aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
- 最大的包:
@chainsafe/eth2-spec-tests
(5.96 GB)、kuzzle
(5.88 GB)、modez
(4.39 GB)、@mpetrunic/eth2-spec-tests
(4.13 GB)、docloop
(3.38 GB)、@twigeducation/ts-fe-components
(3.22 GB)、similar-persian-words
(3.04 GB)、npmtest-3355
(3.03 GB)、jinnyaug_npm
(3 GB)、gony_package_test
(2.63 GB) -
维护者最多的包:
@seek/asia-translations@1.0.0
(554 名维护者)、@condenast/seawasp-bull-queue@0.1.4
(530 名维护者)、@condenast/cna-st-codec@0.1.4
(530 名维护者)、@bbc/storyplayer@0.4.16
(494 名维护者)、@bbc/digital-paper-edit-client@0.8.2-alpha.2
(494 名维护者)、@bbc/stt-align-node@1.0.0
(494 名维护者)、@bbc/newslabs-helper-analytics@3.1.3
(493 维护者)、@bbc/local-election-2020-assets@0.0.1
(491 维护者)、@bbc/digital-paper-edit-storybook@1.7.0
(491 维护者)、@bbc/object-based-media-schema@0.3.3
(490 名维护者)
更多详情可查看官方博客。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Umi-OCR — 用过最好的开源 OCR 软件、支持离线运行
Umi-OCR 是一款免费、开源、可批量的离线 OCR 软件,基于 PaddleOCR,适用于 Windows10/11 平台。 特性 免费:本项目所有代码开源,完全免费。 方便:解压即用,离线运行,无需网络。 批量:可批量导入处理图片,结果保存到本地 txt / md / jsonl 多种格式文件。也可以即时截屏识别。 高效:采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。 精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。 说明目录 简单上手截图、批量识别~ 排版优化如何合并一个自然段内的文字? 忽略区域如何排除截图水印处的文字? 多国语言添加更多PP-OCR支持的语言模型库! 命令行调用用命令行或第三方工具来调用Umi-OCR! 更多小技巧 问题排除无法启动引擎 / 多屏幕截图异常 ? 下载 Umi-OCR 软件本体含简体中文&英文通用识别库。 配套多国语言识别扩展包可导入繁中,英,日,韩,俄,...
- 下一篇
社区发布 | 深度求索 670 亿大模型技术报告发布
2024 开年巨献,深度解读 DeepSeek大模型背后的技术秘密.. 一个月前,深度求索开源了670 亿参数的大模型 (DeepSeek LLM 67B) ,在近 40 个中英文榜单上全面超越了700 亿的 LLaMA 2。 全系列模型已开源至 Hugging Face, 无需申请免费商用 ,目前已累积 超 5.8 万次下载 。 https://hf.co/deepseek-ai 今天,我们将 40+ 页的DeepSeek LLM技术报告发布至 Arxiv,并在本文深度解读其后的关键技术。 论文地址:https://arxiv.org/abs/2401.02954 技术报告 Highlights 自建全面Scaling Laws,为模型扩大更好奠基 深入探索了 超参数的Scaling Law s :为选择最佳超参数(Batch Size、 Learning Rate)提供了经验框架 详细论证了 数据质量 对Scaling Laws的影响 :同等数据规模下,数据质量越高,最优参数规模越大 完整的对齐实践细节,全方位的AGI能力评估 对比开源模型(左图),DeepSeek LLM 67B...
相关文章
文章评论
共有0条评论来说两句吧...