APP下载

详解三大开源运维监控框架对比(zabbix、nagios和open-falcon)

消息来源:baojiabao.com 作者: 发布时间:2026-05-14

报价宝综合消息详解三大开源运维监控框架对比(zabbix、nagios和open-falcon)

概述

监控系统是整个运维环节,乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供翔实的资料用于追查定位问题。监控系统作为一个成熟的运维产品,业界有很多开源的实现可供选择。当公司刚刚起步,业务规模较小,运维团队也刚刚建立的初期,选择一款开源的监控系统,是一个省时省力,效率最高的方案。

目前相对比较成熟的开源运维监控系统有zabbix、nagios和open-falcon,那么这中间有什么区别呢?

zabbix

zabbix([`zæbiks])是一个基于WEB界面的提供分散式系统监视以及网络监视功能的企业级的开源解决方案。

zabbix能监视各种网络引数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。

zabbix由2部分构成,zabbix server与可选元件zabbix agent。

zabbix server可以通过SNMP,zabbix agent,ping,埠监视等方法提供对远端服务器/网络状态的监视,资料收集等功能,它可以执行在Linux,Solaris,HP-UX,AIX,Free BSD,Open BSD,OS X等平台上。

优点:

(1)是zabbix最常用的监控方式,监测指标深入细致有针对性。 (2)内建监控功能强大,内建监控专案丰富。 (3)TCP方式实现通讯,可靠性也有保证。缺点:

(1)需要在被监控机器上安装zabbix-agent客户端,部署相对麻烦,最初需要逐个机器安装代理软件(2)zabbix-agent客户端执行在被监控机上,会收集本机资讯

nagios

Nagios是一款开源电脑系统和网络监视工具,能够有效监控windows,linux,Uninx的主机状态,交换机路由器等网络设定,打印机等.在系统或服务状态异常时发出邮件或简讯报警第一时间通知运维人员,在状态恢复后发出正常的邮件或简讯报警通知.

Nagiosq的功能是监控服务和主机,但也是 他 自身并不包括这部分功能,所有的监控,检测功能都是通过各种外挂来完成的。

启动Nagios后他会周期性的自动呼叫外挂去检查服务器状态 ,同时Nagios会维持一个列队,所有外挂返回来的状态资讯都进入列队 ,Nagios每次都从队首开始读取资讯,并进行处理,把状态结果通过web结果通过显示出来。

小米开源监控系统Open-Falcon

同样是做监控系统,对于巨量的资料上报/统计,万+上报节点,Zabbix力不从心了,而Open-Falcon这方面更加强大,转换之后,Open-Falcon使用的会比较舒服。

特点:

资料采集免配置:agent自发现、支援Plugin、主动推送模式容量水平扩充套件:生产环境每秒50万次资料收集、告警、储存、绘图,可持续水平扩充套件。告警策略自发现:Web界面、支援策略模板、模板继承和覆盖、多种告警方式、支援回拨动作。告警设定人性化:支援最大告警次数、告警级别设定、告警恢复通知、告警暂停、不同时段不同阈值、支援维护周期,支援告警合并。历史资料高效查询:秒级返回上百个指标一年的历史资料。Dashboard人性化:多维度的资料展示,使用者自定义Dashboard等功能。架构设计高可用:整个系统无核心单点,易运维,易部署

zabbix vs nagios vs open-falcon

下面用一张图来做个对比总结。

后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注一下~

2020-01-21 09:53:00

相关文章