Система мониторинга сетевых сервисов

Security pro

Система мониторинга сетевых сервисов
Клиент
Международная компания, поставляющая инженерно-технические услуги
Продолжительность
4 месяца
Индустрия
Информационная безопасность
Команда
1 Менеджер проекта
1 Аналитик
2 Front-end разработчика
2 Back-end разработчика
Технологии
Python
React

Система для автоматического мониторинга работы сетевых сервисов.

Детали
Клиент
Международная компания, поставляющая инженерно-технические услуги
Продолжительность
4 месяца
Индустрия
Информационная безопасность
Команда
1 Менеджер проекта
1 Аналитик
2 Front-end разработчика
2 Back-end разработчика
Технологии
Python
React
  1. Проблема

    Заказчик занимается консалтингом и поддержкой в сфере безопасности сетевых инфраструктур. Число клиентов компании росло, поэтому возникла потребность в создании системы для автоматического анализа работы обслуживаемых сетевых сервисов и оперативного оповещения сотрудников заказчика о возникающих проблемах. Она могла значительно облегчить труд операторов SOC-команды и повысить эффективность работы. Наша компания хорошо знакома с проблематикой оптимизации служб мониторинга и сокращения времени реагирования на неполадки в работе онлайн-сервисов, поэтому заказчик обратился за помощью именно к нам.
  2. Решение

    Мы спроектировали систему, которая собирает информацию, приводит её к единому формату и генерирует отчёты о текущем состоянии сетевых сервисов. Логи извлекаются из репозитория на основе стека технологий ELK (Elasticsearch, Logstash и Kibana). Затем данные конвертируются, фильтруются и упорядочиваются. Алгоритм находит любые отклонения от нормы и вносит обнаруженные записи в отдельную базу данных. Сотрудники SOC-команды самостоятельно задают пороговые значения и создают правила, на которые ориентируется система. Полученная информация визуализируется аналитической платформой Grafana, а оповещения об инцидентах отправляются операторам посредством мессенджера Telegram и по электронной почте. На протяжении 4 месяцев над проектом работала команда из 6 специалистов.
  3. Результат

    Созданное нами программное решение позволяет в режиме близком к реальному времени отслеживать малейшие расхождения показателей работы сервисов с установленными нормами. Вся информация отображается на экране в понятном графическом виде, а уведомления рассылаются операторам, даже когда их нет на рабочем месте. Например, система проинформирует персонал, если время ответа сервера должно составлять не более 500 мс, но внезапно превысило 1000 мс. Это позволит оперативно принять соответствующие меры и предотвратить сбои в работе сервисов. Благодаря внедрению решения заказчик не только сократил расходы на мониторинг онлайн-инфраструктур, но также смог предоставлять своим клиентам ещё более качественные услуги.

Скачайте презентацию этого кейса в формате PDF

Скачать