Установка и настройка Zabbix

Zabbix – мощное и доступное средство мониторинга работы серверов (MS SQL, PostgreSQL, 1C:Підприємство, BAS)

Система мониторинга Zabbix позволяет:

  • осуществлять сбор метрик-показателей работы устройств, систем, приложений;
  • вести оперативный контроль работы серверов и систем;
  • получать информацию в графическом виде;
  • получать оперативное оповещение по достижении заданных граничных величин контролируемых показателей.

Система мониторинга Zabbix состоит из двух компонентов: сервера и агента.

Сбор метрик (функции Zabbix агента)

Агенты сбора показателей могут работать практически со всеми распространёнными операционными системами, обеспечивая надёжный мониторинг рабочих параметров.

Zabbix агенты

Комплекс показателей мониторинга работы сервера «1С:Підприємство»

Настраиваемый набор показателей зависит от текущей системы.

Для примера можно представить следующие:

Основные общие показатели работы системы:

  • загрузка процессора (CPU Load,  CPU Utilization);
    (необходимый уровень до 40%)*
  • загрузка системы ввода-вывода (Disk Usage, Disk Queue);
    (необходимый уровень Disk Usage до 70%, Disk Queue 0.1-0.2 сек)*
  • время отклика сервера (ICMP Lost, ICMP Response);
    (необходимый уровень  ICMP Lost =0, ICMP Response 0.2-0.3 сек )*
  • использования оперативной памяти;
  • свободное место на дисках серверов;
  • входящий и исходящий сетевой траффик.

Оперативные показатели работы СУБД:

  • Длительность выполнения текущих запросов СУБД;
    (необходимый уровень  от 3- до 30 (исключительный 90 сек ))*
  • Количество соединений с СУБД;
  • Контроль состояния репликации и архивирования WAL;
  • Контроль объёма доступной оперативной памяти.

Статистические показатели работы СУБД:

  • Размер баз данных, логов транзакций, базы данных temp db;
  • Число выполняемых операций в единицу времени;

Показатели работы сервера 1С: Підприємство

  • количество сеансов (пользовательские, фоновые, http-сервисы);
  • количество рабочих процессов;
  • время серверного вызова;
    (необходимый уровень  0.5 сек )*
  • размер каталога кластера (ЖР и ПТП), каталога временных файлов;
  • потребление памяти рабочими процессами;
  • время реакции системы в целом (сервер 1С: Підприємство +СУБД);
  • «доступная производительность» рабочего процесса.
  • контроль за временем реакции сервера (Host Call Time)
    (необходимый уровень до 0.4 сек)*
  • контроль за временем отклика сервера (ICMP Lost, ICMP Response)
    (необходимый уровень  ICMP Lost =0, ICMP Response 0.2-0.3 сек )*
  • контроль за временем выполнения запроса СУБД
    (необходимый уровень  от 3- до 30 (исключительный 90 сек ))*

* численные пороговые значения приведены для примера и зависят от параметров и режимов работы конкретной системы

Изменение общих показателей (нагрузка на процессор, доступная оперативная память и т. п.) не раскрывает саму причину проблем.

Специфические показатели для специалиста могут являться ключом к причинам падения производительности, указывая направление для дальнейшего изучения проблем. В частности, можно проследить зависимость нагрузки на процессор от числа работающих пользователей или связать её с зависшим серверным вызовом. Получить сигнал о скачкообразном росте размера БД или логов и провести разбор выполнявшихся в это время запросов. Полученная информация может помочь более детально настроить технологический журнал, сузив круг поиска возможных причин проблемы.

Мониторинг (функции Zabbix Сервера)

Настройка мониторинга, триггеров и оповещений осуществляется 1) через веб-интерфейс сервера 2) доработкой скриптов сбора метрик на контролируемых узлах (если необходимо). В процессе эксплуатации контролируемые параметры могут уточняться, их набор оперативно изменяться в зависимости от потребностей.

Zabbix обеспечивает автоматическое обнаружение состояний проблем во входящем потоке метрик благодаря возможностям:

— задавать раздельные критерии «проблема» и «решение»;

— задавать несколько уровней критичности проблем;

— обнаружения аномалий и прогнозирования динамики.

Получение информации о состоянии системы возможно, как путём визуального контроля за поступающими показателями в числовом и графическом виде, так и путём оповещения ответственных лиц (по электронной почте, в отдельных случаях – через телеграмм-канал) о событиях, требующих оперативного контроля или вмешательства. Необходимость постоянно следить за входящими метриками отсутствует.

Долговременное хранение истории показателей позволяет производить анализ изменений поведения системы в течение времени и строить прогнозы дальнейшего развития.

Пользовательские комплексные экраны

Рисунок — пример комплексного экрана

Рисунок — пример графиков комплексного экрана мониторинга нагрузки на процессор сервера СУБД (вверху) и длительности текущих запросов к СУБД (внизу).

Рисунок — пример графиков комплексного экрана мониторинга нагрузки на процессор сервера «1С:Предприятие» (вверху) и количество активных серверных вызовов (внизу).

Аппаратные требования

Достаточной площадкой для размещения Zabbix-сервера для мониторинга нескольких узлов будет машина с числом CPU от 2 ядер, от 512 Мб ОЗУ, от 4 Гб дискового пространства. Объём дискового пространства напрямую зависит от планируемого периода хранения истории и числа контролируемых узлов.

Установка и развертывание Zabbix

Для организации мониторинга необходимо:

1. Развернуть и настроить Zabbix-сервер

Самый простой путь развернуть Zabbix-сервер — выполнить установку из готового образа. На имеющемся линукс-сервере можно выполнить установку необходимых пакетов отдельно.

Веб интерфейс Zabbix-сервера должен быть доступен для разрешенных узлов (порты 80 и 443); Zabbix-сервер и контролируемые узлы сети (агенты) должны быть взаимодоступны по портам 10050-10051 (по умолчанию).

В общих случаях развертывание сервера занимает до одного рабочего дня.

Для выполнения работ необходимы полные административные права и, возможно, помощь штатного системного администратора.

2. На каждом контролируемом узле выполнить установку и настройку Zabbix-агента — службы, которая будет осуществлять сбор рабочих параметров и осуществлять взаимодействие с сервером мониторинга.

Для сбора необходимых метрик используются специальные шелл-скрипты (bash для линукс-систем, power shell для виндоуз).

В общем случае установка и базовая настройка агентов мониторинга занимает 1-2 рабочих дня для пары сервер приложений-сервер СУБД.

Для выполнения работ необходимы полные административные права и, возможно, помощь штатного системного администратора.

Пакет услуг

Наименование

Длительность

1

Установка Линукс сервера для Zabbix сервера

1 день

2

Развертывание сервера Zabbix

1 день

3

Установка и базовая настройка агентов Zabbix

2 дня

  Цена без НДС

11000,00

Отдельные компоненты

Наименование

Цена без НДС

1

Шаблоны для Zabbix сервера

3000

  Скрипты для Zabbix агента

2000