Мониторинг Agora¶
Мониторинг Agora состоит из двух составляющих:
- система, которая снимает первичные показатели (метрики)
- система, которая агрегирует и может выдать алерты.
Первичные показатели оформляются в виде метрик и доступны по протоколу HTTP(S) в виде JSON или openmetrics (Prometheus). Большинство показателей оформляются в виде накапливающихся счетчиков (единый подход, стандартный для Prometheus): байты, количество ошибок и т.п.
Предполагается, что агрегирующая система (встроенная в Agora или используемая клиентом) будет самостоятельно дифференцировать эти счетчики.
Для агрегирующей системы мы подготовили ряд шаблонов для алертов, которые должны помочь настроить первичный мониторинг и в последствии дорабатывать под свои нужды.
Встроенный мониторинг в админке¶
Помимо внешнего сбора метрик, в Agora есть встроенные экраны мониторинга в административном интерфейсе. Они позволяют оператору и администратору быстро оценивать текущее состояние платформы без обращения к внешней системе наблюдаемости.
Мониторинг стримеров¶
На странице стримеров отображаются агрегированные показатели по каждому зарегистрированному стримеру.
В списке доступны:
- hostname стримера;
- количество online streams и общее количество потоков;
- количество подключенных клиентов;
- загрузка CPU;
- использование диска.
Страница позволяет:
- открыть карточку конкретного стримера;
- обновить текущие данные вручную;
- использовать этот экран как быстрый обзор состояния инфраструктуры.
Такая страница удобна для первичной диагностики деградации узлов, перегрузки сервера или оценки общей загрузки платформы.
Мониторинг потоков¶
Мониторинг потоков в Agora доступен как на странице списка потоков, так и в карточке отдельного потока.
На обзорной странице потоков видны:
- общий статус потока;
- входной битрейт;
- текущий выходной битрейт;
- режим работы входа;
- состояние исходящих публикаций.
Для списка потоков также доступно ручное обновление и автообновление с заданным интервалом.
Детальная статистика потока¶
В карточке потока Agora показывает подробную статистику по кластеру.
В зависимости от конфигурации потока интерфейс отображает:
- общий статус потока в кластере;
- состояние
primaryиbackupв режимеTwincast; - эффективный источник входного сигнала;
- входной битрейт;
-
статистику входа:
-
байты;
- кадры;
- retries;
- переключения входа;
- изменения media info;
- ошибки;
- время последнего
DTS; - состояние и статистику исходящих публикаций.
Если поток работает в Twincast, статистика выводится отдельно для primary и backup, что упрощает диагностику проблем на конкретном тракте приема.
Мониторинг исходящих публикаций¶
Agora также показывает отдельную статистику egress и исходящих публикаций.
Для каждой исходящей публикации могут отображаться:
- URL публикации;
- статус push;
- количество переданных байт;
- количество кадров;
- количество ошибок.
В режиме Twincast статистика исходящих публикаций может быть разнесена по двум серверам, чтобы оператор видел различия между primary и backup.
Использование внешней системы мониторинга¶
Встроенный мониторинг удобен для оперативной работы, но для промышленной эксплуатации рекомендуется подключать внешнюю систему мониторинга.
Это позволяет:
- хранить длинную историю метрик;
- строить графики и дашборды;
- настраивать алерты;
- интегрировать Agora в корпоративный контур наблюдаемости;
- передавать данные в
Prometheus,Zabbixили другие системы мониторинга.
Что обычно контролируют в первую очередь¶
Для первичного production-мониторинга обычно рекомендуется отслеживать:
- доступность стримеров и ретрансляторов;
- загрузку CPU, диска и пропускной способности;
- количество активных потоков и клиентов;
- входной битрейт и ошибки на входе;
- состояние
Twincastprimary / backup; - ошибки исходящих публикаций;
- состояние записи, архива и доставки контента.