Курс: производственная практика

14.04.20

Тема:МОНИТОРИНГ ПРОИЗВОДИТЕЛЬНОСТИ

Naumen Network Manager осуществляет сбор информации о производительности всей сети в целом, а также отдельных сетевых приложений и компонентов. Система собирает данные, необходимые для выявления причин и предотвращения сбоев, помогая спланировать дальнейшее развитие информационной инфраструктуры вашего бизнеса.

Мониторинг производительности осуществляется по следующим ключевым показателям:

· фактическая пропускная способность коммутаторов и маршрутизаторов;

· загруженность памяти и процессоров сетевых устройств;

· периоды непрерывной работы серверов;

· время отклика сервисов и приложений;

· качество сетевых соединений (потери, задержки пакетов и т.д.);

· использование существующего пространства для хранения данных на серверах, дисковых массивах и других накопителях;

· метрики, заданные пользователями (например, уровень Wi-Fi сигнала).

Все полученные показатели производительности сохраняются и доступны для дальнейшего анализа. Для каждого из показателей предусмотрены соответствующие аналитические инструменты: диаграммы, тревоги, отчеты.

Мониторинг использования процессоров

Naumen Network Manager проводит мониторинг производительности процессоров у серверов, управляемых коммутаторов, маршрутизаторов и другого оборудования сети, которое по протоколу SNMP предоставляет данные о загрузке процессора. Информацию о фактическом использовании ресурсов можно получить отдельно по каждому процессору, а при необходимости и по каждому процессорному ядру.

В системе предусмотрена возможность срабатывания тревоги в случае, если на одном из сетевых устройств загрузка процессора превысила пороговое значение в заданный пользователем период времени. При этом настройки процедур оповещения, тревог и инициации корректирующих действий можно конфигурировать для каждого устройства в отдельности или задавать сразу для группы.

Возможен мониторинг загрузки процессора для запущенных на удаленных устройствах отдельных процессов.

Контроль дискового пространства и загрузки оперативной памяти

Система осуществляет мониторинг дискового пространства удаленных серверов и иных сетевых устройств по протоколу SNMP. Метки и данные по свободному/использованному пространству поступают по всем файловым системам, дискам и разделам; эти данные могут быть представлены в наглядной графической форме. При этом сами графики можно настраивать под конкретные задачи. Также есть возможность дополнить данные по анализу дискового пространства трендами линейной регрессии, что позволит спрогнозировать момент, когда на носителе закончится свободное место.

Использование памяти отслеживается и для процессов, запущенных на удаленных серверах и рабочих станциях.

Контроль использования пропускной способности

В системе предусмотрена возможность оповещения администратора в случаях, когда на каком-либо из портов коммутатора/маршрутизатора объем трафика приближается к пропускной способности или пределу, заданному администратором. Воспользовавшись специальными сервисами анализа (например, NetFlow), можно выявить источники повышенной сетевой нагрузки (узлы, приложения и т.д.).

Мониторинг времени отклика

Производительность сетевого приложения может снижаться из-за целого ряда причин: недостатка памяти, медленного сетевого соединения, повышенной загрузки процессора, внутренних проблем программы и т.д. Весьма точно отражает общее состояние приложения такой параметр, как время отклика – интервал времени между отправкой специально сгенерированного запроса и моментом получения ответа на него.

Например, для различных приложений временем отклика является период:

· выполнения SQL-запроса;

· загрузки веб-страницы;

· загрузки файла с удаленного FTP-сервера;

· выполнения скрипта на удаленном устройстве.

При этом система осуществляет мониторинг времени отклика контролируемых узлов с помощью ICMP-запросов echo (ping) и анализирует процент потерянных пакетов. Такой подход ускоряет и упрощает обнаружение проблем, связанных с производительностью сети.

Пользовательские показатели производительности

Система способна анализировать любые метрики производительности, информация для расчета которых доступна по протоколам SNMP, CLI, WMI, BACnet, Modbus, OPC и т.д.

Показатели, которые можно включить в мониторинг производительности:

· уровень сигнала беспроводной сети (SNMP);

· количество потоков выполнения на сервере приложения (JMX);

· размер файла подкачки Windows (WMI).

Панель «Рейтинг производительности: Топ 10»

Для упрощения работы сетевого администратора в системе существует специальная панель «Рейтинг производительности: Топ 10». Возможности этой панели помогают освободить администратора от рутинных операций проверки различных приложений и ресурсов, отслеживания данных по загруженным и проблемным компонентам.

Оповещения о снижении производительности

Подсистема тревог Naumen Network Manager позволяет оперативно выявлять падение производительности в различных ситуациях, в том числе самых сложных.

Например, активация тревоги выполняется:

· Если в течение заданного интервала времени возникли сразу несколько событий типа «перегрузка» (активируется тревога DDOS-атака).

· Если за определенный временной промежуток (к примеру, более 5 минут) загрузка процессора превышает 80%. Такая тревога может быть автоматически деактивирована, если использование процессора падает ниже 30% и сохраняется на таком уровне не менее часа.

· Если производительность части серверов (более заданного значения) в кластере не соответствует установленным для них критериям, или серверы недоступны.

Помимо назначения тревоги для каждого события можно задать автоматические корректирующие действия или потребовать подтверждение от оператора. Например, система способна самостоятельно провести перезапуск проблемного сервиса или сервера в целом.

Войти