Организация мониторинга

·

Для того, чтобы организовать качественный мониторинг необходимо ответить на три вопроса:

  1. Что мы мониторим? Точнее за каким уровнем в компании следим?
  2. Как за этим следим?
  3. Какие инструменты используем?

Уровни мониторинга

Отслеживание метрик распространяется не только на отдел разработки. Главный уровень отслеживается на уровне финансового отдела: это данные интернет банков и эквайринга. Все последующие данные синхронизируются с уровнем ниже. Общая картинка по уровнями:

  1. Финансы: эквайринги, интернет банки и excel с финансовой моделью.
  2. Аналитика: витрины поверх внутренних и внешних сервисов.
  3. Сервисы: запросы, логи и данные в базах.
  4. Инфраструктура: сервера, базы, очереди.

Наличие нескольких уровней и разных скоростей обновления данных приводит к процессу сверки. Он происходит со скоростью более медленного звена:

  • Финансы <> аналитики: от раз в неделю до раз в месяц
  • Аналитика <> сервисы: от раз в час до раз в день
  • Сервисы <> инфраструктура: от моментального до раз в несколько минут

Рассмотрим мониторинг на основе сервисов, хотя большинство практик пришли или снизу, или сверху и могут быть переиспользованы.

Основные подходы

  • Расписать про SLA
  • Расписать про дашборды
  • Расписать про алерты

Инструменты

В рамках сервисов у разработчиков есть:

  1. ошибки
  2. логи
  3. трассировка
  4. метрики

Дополнительные заметки

  • [[202110041305 Example questions for SLOs]]
  • [[202111250849 Metrics logs and traces]]
  • [[202202061205 Making alerts actionable]]

Обратные ссылки