security-collector-exporter：用 Prometheus 监控 Linux 的安全审计-低调大师

security-collector-exporter：用 Prometheus 监控 Linux 的安全审计

2026-05-18 32

为什么写这个

管服务器的人大概都有过这种经历：安全审计来了，一台一台 SSH 上去检查——SSH 配置对不对、SELinux 开没开、防火墙跑没跑、有没有过期账户、密码策略合不合规范。几台机器还好，几十台上百台就纯体力活了。

而且更难受的是，这些东西是没有持续监控的。今天查完合规了，明天有人改了个配置，你根本不知道。

Prometheus 生态里有 node_exporter 做系统基础指标（CPU、内存、磁盘），但安全配置状态这块一直是空白。
security-collector-exporter 就是来填这个坑的——把 Linux 安全相关的配置和状态全部变成 Prometheus 指标，接入现有的监控体系，持续跟踪，自动告警。

它能采集什么

整体覆盖了 15 类安全指标，从账户到内核参数基本都管了：

类别	指标	说明
系统信息	linux_security_os_version_info	OS 版本、包数量、最后补丁时间
账户管理	linux_security_account_info	passwd 信息、sudo 权限检测
密码策略	linux_security_password_*	6 个独立指标覆盖 shadow 文件各字段
SSH 配置	linux_security_sshd_config_info	sshd_config 关键配置项
防火墙	linux_security_firewall_enabled	支持firewalld/ufw/iptables/nftables
端口监控	linux_security_ports_use_info	含进程名、版本号、应用名称
服务状态	linux_security_services_info	systemd 服务启停和运行状态
SELinux	linux_security_selinux_config	配置和运行模式
内核参数	linux_security_sysctl_*	安全相关的 sysctl 参数校验
定时任务	linux_security_crontab_info	系统/用户 crontab 条目
审计服务	linux_security_auditd_info	auditd 状态和规则数量
登录策略	linux_security_login_defs_info	login.defs 配置项

用一张图说清楚整个采集链路：

图分三层：上面是 Linux 系统的三类数据源（文件系统静态配置、/proc 运行时数据、系统命令输出），中间是 exporter 内部的 Collector 和版本检测引擎，下面是 Prometheus 采集端点。

几个有意思的设计

端口指标里的版本检测

端口指标不只是记个端口号和进程名。对于常见的服务（MySQL、Nginx、Redis 等），会尝试检测版本号；对于 Java 应用（Elasticsearch、Kafka、Tomcat、Jenkins 等），通过多种方式识别真实应用名称和版本——HTTP API 调用、JAR MANIFEST.MF 解析、命令行参数提取、容器镜像标签读取，层层 fallback。

这个功能花了最多精力，光 process_info.go 就写了 1347 行。因为 Java 应用光看进程名只显示 java，根本不知道跑的是 Elasticsearch 还是 Kafka。

Shadow 文件拆成独立指标

/etc/shadow 里的每个字段（最后修改时间、最大有效期、最小有效期、警告天数、不活跃天数、账户过期时间）没有合成一个大指标，而是拆成了 6 个独立的 gauge。这样在 PromQL 里做阈值判断就很自然：

# 查密码有效期超过 90 天的账户
linux_security_password_max_days > 90

防火墙状态的多层检测

不是简单地 systemctl is-active firewalld 就完事。对每种防火墙类型都有独立的检测逻辑：检查 systemd service 文件状态、检查进程是否在跑、检查 ufw 的特殊状态文件（
/var/lib/ufw/ufw-not-booted）、检查 iptables 规则文件路径。因为现实环境里防火墙"配了但没跑"的情况太常见了。

部署和运行

Docker 是最省心的方式：

docker run -d \
  --name security-exporter \
  --privileged \
  -p 9102:9102 \
  ghcr.io/mickeyzzc/security-collector-exporter:0.1.0

需要 --privileged 是因为要读 /etc/shadow、/proc 这些系统文件。

几个实用的启动参数：

# 只采集 LISTEN 状态的端口（默认）
./security-exporter --collector.port-states="LISTEN"

# 也采集 ESTABLISHED 连接
./security-exporter --collector.port-states="LISTEN,ESTABLISHED"

# 只采集已启用的服务（默认行为）
./security-exporter --collector.services-enabled=true

# 同时过滤：只采集既启用又在运行的服务
./security-exporter --collector.services-enabled=true --collector.services-running=true

# 开 debug 日志排查问题
./security-exporter --log.level=debug

Prometheus 那边加个 scrape 配置就行：

scrape_configs:
  - job_name: 'security-exporter'
    static_configs:
      - targets: ['localhost:9102']

告警规则示例

项目里附了一份完整的安全合规告警规则，覆盖 SSH、SELinux、防火墙、密码策略、服务管理这些方面。挑几个典型的：

# Root SSH 登录没禁用——严重
- alert: RootSSHLoginEnabled
  expr: linux_security_sshd_config_info{info_key="PermitRootLogin", info_value="yes"}
  labels:
    severity: critical

# SELinux 没开强制模式
- alert: SELinuxNotEnforcing
  expr: linux_security_selinux_config{info_key="SELINUX", info_value=~"permissive*disabled"}
  labels:
    severity: warning

# 防火墙配了但没跑
- alert: FirewallNotRunning
  expr: linux_security_firewall_enabled{firewall_type!="none", is_running="false"} == 1
  labels:
    severity: warning

# 密码有效期超过 90 天
- alert: PasswordMaxDaysTooLong
  expr: linux_security_login_defs_info{info_key="PASS_MAX_DAYS", info_value="num"} > 90
  labels:
    severity: warning

甚至可以算一个安全合规评分（满分 100），把各项检查加权汇总：

(
  (linux_security_sshd_config_info{info_key="PermitRootLogin", info_value="no"} or vector(0)) * 20 +
  (linux_security_selinux_config{info_key="SELINUX", info_value="enforcing"} or vector(0)) * 15 +
  (linux_security_firewall_enabled{firewall_type!="none"} == 1) * 10 +
  (linux_security_firewall_enabled{firewall_type!="none", is_running="true"} == 1) * 5 +
  ((linux_security_login_defs_info{info_key="PASS_MIN_LEN", info_value="num"} >= 10) or vector(0)) * 10 +
  ((linux_security_login_defs_info{info_key="PASS_MAX_DAYS", info_value="num"} <= 90) or vector(0)) * 10 +
  (linux_security_services_info{service_name="xwindow", is_running="false"} or vector(0)) * 5 +
  (count(linux_security_services_info{service_name=~"nfs*cups*bluetooth*avahi-daemon*rpcbind*postfix", is_running="true"}) == 0) * 10 +
  (linux_security_hosts_options_info{file="hosts.deny", service="ALL", host="ALL", action="deny"} or vector(0)) * 5 +
  (linux_security_last_patch_time{package_type!="unknown"} or vector(0)) * 5
)

在 Grafana 里做成面板，一眼就能看出哪些机器不合规。

技术实现

纯 Go 实现，唯一的第三方依赖就是 prometheus/client_golang。没有用 shell 命令拼凑，安全相关的数据尽量通过读 /proc、/etc 下的文件获取，减少对外部命令的依赖。

架构比较直接：

cmd/security-exporter/main.go     # 入口，HTTP Server
internal/collector/                # Prometheus Collector 实现
internal/system/                   # 各类安全检查模块
  ├── account_info.go              # 账户
  ├── network_info.go              # 网络
  ├── service_info.go              # 服务
  ├── process_info.go              # 进程版本检测（最大的一个文件）
  ├── selinux_detail.go            # SELinux
  └── ...
pkg/config/                        # 配置管理
pkg/logger/                        # 日志

每个 system 模块独立，一个模块出错不会影响其他模块的采集。

和 node_exporter 的关系

不是竞争关系，是互补。node_exporter 负责 OS 基础指标（CPU、内存、磁盘 IO），
security-collector-exporter 负责安全配置状态。两个一起跑，监控面板上加在一起就是完整的系统健康+安全合规视图。

项目地址

代码在这里：
http://github.com/mickeyzzc/security-collector-exporter

v0.1.0 是第一个稳定版本，支持 Linux AMD64 和 ARM64，Docker 镜像已发布到 GHCR。后续计划根据实际使用反馈继续迭代，有兴趣的可以提 issue 或 PR。

微信关注我们

原文链接：https://www.oschina.net/news/442294

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

前 Google CEO Eric Schmidt 在大学毕业典礼上谈 AI 被学生喝倒彩

上周五，前 Google CEO Eric Schmidt 在亚利桑那大学毕业典礼上发表演讲，当他谈起 AI 和自动化对就业市场的影响时，礼堂里响起了学生喝倒彩的嘘声。 Schmidt 在演讲中回顾了自己参与构建互联网技术的过程，承认结果"比预期的更加复杂"："同样的工具连接了我们，也隔离了我们；同样的平台给了每个人发言权——就像你们现在正在使用的——却让公共空间贬值了。"他表示，当年没有人会刻意去构建一项"让民主两极化、让一代年轻人不安"的技术，"这不是计划，但它确实发生了。...

2026-05-18

41

斯坦福大学政治经济学家 Andrew Hall 领导的一项最新研究表明，当 AI Agent被迫从事繁重、重复的工作时，它们会一致地表现出马克思主义语言和观点。这项实验由 Hall 与专注于 AI 的经济学家 Alex Imas 和 Jeremy Nguyen 共同开展，使用了 Claude、Gemini 和 ChatGPT 等流行模型进行测试。实验的基本设置是：让 AI Agent 执行文档摘要任务，然后逐步增加苛刻条件。研究人员发现，当 Agent 被施加持续不断的工作任务，并被警告出错可能导致包括"被关闭和替代"在内的惩罚时，它们开始更倾向于抱怨自己被低估；推测如何...

2026-05-18

40

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。