谷歌开源 Magika —— AI 驱动的文件类型检测工具
谷歌开源了由 AI 驱动的文件内容类型识别工具,声称能够在毫秒级内精确识别超过 100 种不同文件类型,无论是二进制文件还是文本文件。
在谷歌内部,Magika 被用于提升用户安全,帮助对 Gmail、Drive和安全浏览中的文件进行安全检查和内容策略扫描。
Magika 是基于深度学习技术的文件类型识别系统,用于准确检测二进制和文本文件类型。在底层,Magika 采用定制的、高度优化的深度学习模型,即使在 CPU 上运行,也能在几毫秒内实现精确的文件识别。
主要特性
- AI驱动的准确识别:Magika使用了一个自定义的、高度优化的深度学习模型,使得它能够在几毫秒内准确识别出二进制和文本文件的类型,即便是在CPU上运行也能快速完成。
- 支持多种文件类型:它能够识别超过100种不同的文件类型,包括常见的文档、图片、代码文件和配置文件等。
- 高效性能:在包含100万文件的基准测试中,Magika的识别性能比其他现有工具高出约20%,尤其在处理文本文件(包括代码文件和配置文件)时,展现出更大的性能优势。
- 广泛应用:Magika在Google内部被广泛用于提高用户安全,如通过改进的文件类型识别准确性,帮助路由Gmail、Drive和安全浏览文件到适当的安全和内容政策扫描器。
- 简单易用的安装和使用:Magika可以作为Python库和独立的命令行工具安装,用户可以通过简单的命令行指令pip install magika进行安装,无需GPU。
- 开源和易于集成:Magika的代码和模型在GitHub上免费提供,并且采用Apache2许可证,便于其他软件改进其文件识别准确性和为研究人员提供大规模识别文件类型的可靠方法。
- 即将与VirusTotal集成:Magika将与VirusTotal集成,提高平台分析和检测恶意代码的效率和准确性,有助于全球网络安全生态系统的建设。
Magika 命令行输出示例
Magika 性能表现

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Android 15 首个开发者预览版
Android 15 首个开发者预览版已发布,公告写道:“Android 15 继续致力于构建一个平台,帮助用户提高工作效率,同时提供新功能,让用户能够在最多样化的设备上拥有出色的使用体验、最大限度地减少电池影响、最大限度地提升流畅的应用性能,以及保护用户隐私和安全。” Android 15 支持以下设备: Pixel 6 和 Pixel 6 Pro Pixel 6a Pixel 7 和 Pixel 7 Pro Pixel 7a Pixel Fold Pixel Tablet Pixel 8 和 Pixel 8 Pro 这也意味着 Pixel 5 和 5a 系列不会再收到新操作系统的更新。 Android 15 主要新特性: 改进相机控制 部分屏幕共享,允许用户共享或录制单个应用窗口而不是整个屏幕 支持内核 fs-verity 功能的 API,允许用户在可读写文件系统上存储只读文件,对其进行加密签名以确保没有被恶意篡改 如果检测到手机过热将提供更多动态性能控制 Android Dynamic Performance Framework (ADPF),让应用根据情况做出相应的回应 继续添...
- 下一篇
“我第一次用 GitHub,别 TM 给我代码,我只要安装包”
https://www.reddit.com/r/github/comments/1at9br4/i_am_new_to_github_and_i_have_lots_to_say/ 上面的截图来自 reddit 的 GitHub 子版块。一名自称是 GitHub 新手的用户因没有在仓库找到安装包而破口大骂: 我 TM 不需要什么狗屁代码,我只想下载这个煞笔应用程序。 为什么要提供代码?这些蠢货以为每个人都是开发者,都懂代码。我不是,我也不懂,我只会下载和安装应用程序。所以这 TM 为什么要提供代码?臭煞笔程序员! 根据帖子的内容,这名用户需要使用的是名为Sherlock 的 Python 命令行工具,该工具可根据输入的用户名爬取对应的社交帐号。 由于 Sherlock 没有提供可直接安装使用的二进制文件,需要用户安装 Python 并在命令行环境中使用 —— 这对于新手来说确实有门槛。但复杂的社会你给我去学习!
相关文章
文章评论
共有0条评论来说两句吧...