Skip to content

DVB-WebVTT

Обзор

DVB-WebVTT — это модуль в составе mcaster, который принимает субтитры из DVB в графическом формате, распознает их с помощью OCR (Optical Character Recognition) и конвертирует в текстовые WebVTT субтитры. Полученные субтитры пригодны для проигрывания на современных устройствах, включая телефоны и телевизоры.

Принцип работы

Обработка DVB субтитров

  1. Прием DVB субтитров — модуль получает субтитры в графическом формате из MPEG-TS потока
  2. OCR распознавание — автоматическое распознавание текста из изображений субтитров
  3. Конвертация в WebVTT — преобразование в текстовый формат WebVTT
  4. Разделение по языкам — автоматическое разделение субтитров по языкам
  5. Вставка в манифесты — добавление субтитров в HLS и DASH манифесты

Поддерживаемые форматы

  • Входные: DVB субтитры в графическом формате
  • Выходные: WebVTT текстовые субтитры
  • Контейнеры: HLS, DASH
  • Языки: Автоматическое определение и разделение по языкам

Конфигурация

Базовая настройка

stream vtt1 { 
  input udp://239.0.0.1:1234;
  dvbocr replace;
}

Параметры конфигурации

Параметр Описание Обязательный Пример
input Входной поток с DVB субтитрами Да udp://239.0.0.1:1234
dvbocr Режим обработки субтитров Да replace

Режимы работы dvbocr

replace

  • Действие: Заменяет графические DVB субтитры на текстовые WebVTT
  • Результат: Выходной поток содержит только текстовые субтитры
  • Применение: Стандартный режим для большинства случаев

add

  • Действие: Добавляет текстовые субтитры к существующим графическим
  • Результат: Выходной поток содержит оба типа субтитров
  • Применение: Для совместимости со старыми устройствами

Расширенная конфигурация

stream vtt1 { 
  input udp://239.0.0.1:1234;
  dvbocr replace;  
}

Технология OCR

Алгоритмы распознавания

  • Нейронные сети — современные алгоритмы машинного обучения
  • Адаптивная обработка — подстройка под качество изображения
  • Многоязычное распознавание — поддержка различных языков
  • Контекстный анализ — улучшение точности распознавания

Оптимизация качества

  • Предобработка изображений — улучшение контрастности и четкости
  • Фильтрация шума — удаление артефактов сжатия
  • Валидация результатов — проверка корректности распознанного текста
  • Коррекция ошибок — исправление типичных ошибок OCR

Выходные форматы

WebVTT субтитры

WEBVTT

00:00:01.000 --> 00:00:04.000
Это пример текстовых субтитров

00:00:05.000 --> 00:00:08.000
Распознанных из DVB потока

HLS манифест

#EXTM3U
#EXT-X-VERSION:3
#EXT-X-TARGETDURATION:10
#EXTINF:10.0,
segment_001.ts
#EXTINF:10.0,
segment_002.ts

# Субтитры для разных языков
#EXT-X-MEDIA:TYPE=SUBTITLES,GROUP-ID="subs",LANGUAGE="ru",NAME="Русский",DEFAULT=YES,URI="subtitles_ru.vtt"
#EXT-X-MEDIA:TYPE=SUBTITLES,GROUP-ID="subs",LANGUAGE="en",NAME="English",DEFAULT=NO,URI="subtitles_en.vtt"

DASH манифест

<AdaptationSet mimeType="text/vtt" lang="ru">
  <SegmentTemplate media="subtitles_ru_$Number$.vtt" initialization="subtitles_ru_init.vtt"/>
</AdaptationSet>
<AdaptationSet mimeType="text/vtt" lang="en">
  <SegmentTemplate media="subtitles_en_$Number$.vtt" initialization="subtitles_en_init.vtt"/>
</AdaptationSet>

Автоматическое разделение по языкам

Определение языков

Модуль автоматически определяет язык субтитров на основе языковых кодов в DVB потоке

Устранение неполадок

Проблемы с распознаванием

Низкое качество распознавания

  1. Проверьте качество входящего DVB сигнала
  2. Проверьте поддержку языка у поддержки, возможно он не поддерживается

Отсутствие субтитров в выходе

  1. Проверьте наличие DVB субтитров во входном потоке
  2. Убедитесь в правильности конфигурации dvbocr
  3. Проверьте логи модуля на ошибки

Производительность

  • Достаточные ресурсы CPU — для обработки OCR в реальном времени
  • Оптимизация памяти — для буферизации кадров субтитров
  • Эффективная дисковая система — для записи выходных файлов

Совместимость устройств

Поддерживаемые устройства

  • Современные телевизоры — с поддержкой HLS/DASH
  • Смартфоны и планшеты — iOS, Android
  • Веб-браузеры — Chrome, Firefox, Safari, Edge
  • Стриминговые приставки — Apple TV, Chromecast, Fire TV

Форматы субтитров

  • WebVTT — стандарт для HTML5 видео
  • HLS субтитры — встроенные в m3u8 манифесты
  • DASH субтитры — отдельные адаптационные наборы

Заключение

DVB-WebVTT модуль обеспечивает современное решение для преобразования графических DVB субтитров в текстовые WebVTT субтитры. Автоматическое распознавание, многоязычная поддержка и интеграция с HLS/DASH делают его незаменимым инструментом для обеспечения доступности контента на современных устройствах.