Skip to content

Мониторинг Agora

Мониторинг Agora состоит из двух составляющих:

  • система, которая снимает первичные показатели (метрики)
  • система, которая агрегирует и может выдать алерты.

Первичные показатели оформляются в виде метрик и доступны по протоколу HTTP(S) в виде JSON или openmetrics (Prometheus). Большинство показателей оформляются в виде накапливающихся счетчиков (единый подход, стандартный для Prometheus): байты, количество ошибок и т.п.

Предполагается, что агрегирующая система (встроенная в Agora или используемая клиентом) будет самостоятельно дифференцировать эти счетчики.

Для агрегирующей системы мы подготовили ряд шаблонов для алертов, которые должны помочь настроить первичный мониторинг и в последствии дорабатывать под свои нужды.

Встроенный мониторинг в админке

Помимо внешнего сбора метрик, в Agora есть встроенные экраны мониторинга в административном интерфейсе. Они позволяют оператору и администратору быстро оценивать текущее состояние платформы без обращения к внешней системе наблюдаемости.

Мониторинг стримеров

На странице стримеров отображаются агрегированные показатели по каждому зарегистрированному стримеру.

В списке доступны:

  • hostname стримера;
  • количество online streams и общее количество потоков;
  • количество подключенных клиентов;
  • загрузка CPU;
  • использование диска.

Страница позволяет:

  • открыть карточку конкретного стримера;
  • обновить текущие данные вручную;
  • использовать этот экран как быстрый обзор состояния инфраструктуры.

Такая страница удобна для первичной диагностики деградации узлов, перегрузки сервера или оценки общей загрузки платформы.

Мониторинг потоков

Мониторинг потоков в Agora доступен как на странице списка потоков, так и в карточке отдельного потока.

На обзорной странице потоков видны:

  • общий статус потока;
  • входной битрейт;
  • текущий выходной битрейт;
  • режим работы входа;
  • состояние исходящих публикаций.

Для списка потоков также доступно ручное обновление и автообновление с заданным интервалом.

Детальная статистика потока

В карточке потока Agora показывает подробную статистику по кластеру.

В зависимости от конфигурации потока интерфейс отображает:

  • общий статус потока в кластере;
  • состояние primary и backup в режиме Twincast;
  • эффективный источник входного сигнала;
  • входной битрейт;
  • статистику входа:

  • байты;

  • кадры;
  • retries;
  • переключения входа;
  • изменения media info;
  • ошибки;
  • время последнего DTS;
  • состояние и статистику исходящих публикаций.

Если поток работает в Twincast, статистика выводится отдельно для primary и backup, что упрощает диагностику проблем на конкретном тракте приема.

Мониторинг исходящих публикаций

Agora также показывает отдельную статистику egress и исходящих публикаций.

Для каждой исходящей публикации могут отображаться:

  • URL публикации;
  • статус push;
  • количество переданных байт;
  • количество кадров;
  • количество ошибок.

В режиме Twincast статистика исходящих публикаций может быть разнесена по двум серверам, чтобы оператор видел различия между primary и backup.

Использование внешней системы мониторинга

Встроенный мониторинг удобен для оперативной работы, но для промышленной эксплуатации рекомендуется подключать внешнюю систему мониторинга.

Это позволяет:

  • хранить длинную историю метрик;
  • строить графики и дашборды;
  • настраивать алерты;
  • интегрировать Agora в корпоративный контур наблюдаемости;
  • передавать данные в Prometheus, Zabbix или другие системы мониторинга.

Что обычно контролируют в первую очередь

Для первичного production-мониторинга обычно рекомендуется отслеживать:

  • доступность стримеров и ретрансляторов;
  • загрузку CPU, диска и пропускной способности;
  • количество активных потоков и клиентов;
  • входной битрейт и ошибки на входе;
  • состояние Twincast primary / backup;
  • ошибки исходящих публикаций;
  • состояние записи, архива и доставки контента.