Периодически возникает непонятная нагрузка на сервере, где установлен Zabbix Server. Разбираюсь в чём проблема.
Вот в этой заметке я уже меняю различные параметры и разбираюсь в конфигурации zabbix server, чтобы сбалансировать нагрузку - https://unix-garage.tk/?p=545
Нагрузка характеризуется постоянными сообщениями:
Zabbix housekeeper processes more than 75% busy Zabbix history syncer processes more than 75% busy
Нагрузка периодическая и в моём случае она выглядела на мониторинге вот так:
Поиски в интернета показали, что для решения проблемы редактирую параметры в конфигурации zabbix server, но при этом ничего не объясняют зачем это делают и какие могут быть последствия.
Поиски источника проблемы привели меня к следующей информации. Когда на разных сайтах для решения проблемы нагрузки на сервер я натыкался на редактирование параметра HousekeepingFrequency, я посмотрел что это за параметр.
Как часто Zabbix будет выполнять процедуру очистки базы (в часах). Автоматическая очистка базы данных удаляет устаревшую информацию из базы данных.
Полную информацию можно найти здесь — https://www.zabbix.com/documentation/4.2/ru/manual/appendix/config/zabbix_server
Получается, что это как минимум не «проблема» и теперь понятна природа периодичности данного явления. Zabbix время от времени чистит свои базы от старых данных и поэтому возникает соответствующая нагрузка.
На практике я пока не пробовал редактировать параметры конфигурации zabbix server, поэтому рекомендаций дать пока не могу. Одно верно точно: если нагрузка не критична, то можно пока ничего не делать и ждать окончания чистки.
Теоретически можно уменьшить параметр MaxHousekeeperDelete. Нагрузка будет меньше, но потребуется больше времени на всю процедуру. Но это не точно (с).
# ещё информация по параметрам работы zabbix server
Одной полезной метрикой является свободное место в History Write Cache (HistoryCacheSize в в конфиг-файле сервера). Данный параметр должен всегда быть близок к 100%. Если же кэш переполняется — это означает, что Zabbix не успевает добавлять в базу поступающие данные. (c)