Вопрос: Nagios: зависимость службы на одном хосте для всей хост-группы


У меня есть система Nagios с большим количеством хостов, классифицированных в разных хост-группах. На каждом из этих хостов на нем есть две службы, одна из которых предназначена для того, чтобы быть зависимой от другой - если service1 является ПРЕДУПРЕЖДЕНИЕМ или КРИТИЧЕСКИМ, service2 на этом сервере также не должен давать предупреждения. service2 больше предназначен для сбора статистики, а service1 - простая проверка доступности - как таковая, я всегда хочу проверять Service2, но не предупреждать, если service1 сообщает об этом.

Это моя запись services.cfg:

define servicedependency{
    hostgroup                       example-servers
    #host_name                       host1.example.com,host2.example.com
    service_description             service1
    dependent_service_description   service2
    execution_failure_criteria      n
    notification_failure_criteria   u,w,c,o
}

Я попробовал оба указать его через группу хостов и как список отдельных серверов. В идеале я бы сделал это для всей группы хостов в одном, а не для постоянного ведения списка.

Однако это, похоже, не работает, в любом случае. Если service1 не работает, service2 также отображает статус CRITICAL на экране проблем и данных хоста.


5
2018-03-08 15:41


Источник




Ответы:


Из руководства Nagios для «execution_failure_criteria»: «Если вы укажете n (none) в качестве опции, зависимость выполнения никогда не завершится, и проверка зависимой службы будет всегда активно проверяйте (если это позволяют другие условия) ».

Похоже, что вы должны использовать «u, c» вместо этого (не проверяйте, является ли server1 НЕИЗВЕСТНЫМ или КРИТИЧЕСКИМ). Или, возможно, «w, u, c», если состояние WARNING из service1 также должно привести к тому, что service2 не будет выполняться.


0
2018-03-10 00:10



Я бы хотел, чтобы проверка была сделана в любом случае (для данных о производительности), но только для отправки уведомлений, если service1 не является предупреждением / критическим. - jreid9001


Если вы укажете «execute_failure_criteria n», то service2 всегда будет проверяться. Если флажок установлен и находится в состоянии предупреждения или критического состояния, пользовательский интерфейс покажет это состояние. Вы не можете предотвратить это (afaik), но вы можете предотвратить его отправку уведомлений, например «notification_failure_criteria u, w, c».

Я думаю, что вы можете либо установить «execute_failure_criteria» как есть (т. Е. «N»), и жить со статусом, показывая service2 как критическим, когда его невозможно достичь, или изменить его на «c».

Вероятно, вы не хотите подавлять уведомления, если service1 в порядке, что вы делаете с «o» в «notification_failure_criteria u, w, c, o».


0
2018-03-21 17:11