DVB-WebVTT¶
Обзор¶
DVB-WebVTT — это модуль в составе mcaster, который принимает субтитры из DVB в графическом формате, распознает их с помощью OCR (Optical Character Recognition) и конвертирует в текстовые WebVTT субтитры. Полученные субтитры пригодны для проигрывания на современных устройствах, включая телефоны и телевизоры.
Принцип работы¶
Обработка DVB субтитров¶
- Прием DVB субтитров — модуль получает субтитры в графическом формате из MPEG-TS потока
- OCR распознавание — автоматическое распознавание текста из изображений субтитров
- Конвертация в WebVTT — преобразование в текстовый формат WebVTT
- Разделение по языкам — автоматическое разделение субтитров по языкам
- Вставка в манифесты — добавление субтитров в HLS и DASH манифесты
Поддерживаемые форматы¶
- Входные: DVB субтитры в графическом формате
- Выходные: WebVTT текстовые субтитры
- Контейнеры: HLS, DASH
- Языки: Автоматическое определение и разделение по языкам
Конфигурация¶
Базовая настройка¶
stream vtt1 {
input udp://239.0.0.1:1234;
dvbocr replace;
}
Параметры конфигурации¶
Параметр | Описание | Обязательный | Пример |
---|---|---|---|
input |
Входной поток с DVB субтитрами | Да | udp://239.0.0.1:1234 |
dvbocr |
Режим обработки субтитров | Да | replace |
Режимы работы dvbocr¶
replace
¶
- Действие: Заменяет графические DVB субтитры на текстовые WebVTT
- Результат: Выходной поток содержит только текстовые субтитры
- Применение: Стандартный режим для большинства случаев
add
¶
- Действие: Добавляет текстовые субтитры к существующим графическим
- Результат: Выходной поток содержит оба типа субтитров
- Применение: Для совместимости со старыми устройствами
Расширенная конфигурация¶
stream vtt1 {
input udp://239.0.0.1:1234;
dvbocr replace;
}
Технология OCR¶
Алгоритмы распознавания¶
- Нейронные сети — современные алгоритмы машинного обучения
- Адаптивная обработка — подстройка под качество изображения
- Многоязычное распознавание — поддержка различных языков
- Контекстный анализ — улучшение точности распознавания
Оптимизация качества¶
- Предобработка изображений — улучшение контрастности и четкости
- Фильтрация шума — удаление артефактов сжатия
- Валидация результатов — проверка корректности распознанного текста
- Коррекция ошибок — исправление типичных ошибок OCR
Выходные форматы¶
WebVTT субтитры¶
WEBVTT
00:00:01.000 --> 00:00:04.000
Это пример текстовых субтитров
00:00:05.000 --> 00:00:08.000
Распознанных из DVB потока
HLS манифест¶
#EXTM3U
#EXT-X-VERSION:3
#EXT-X-TARGETDURATION:10
#EXTINF:10.0,
segment_001.ts
#EXTINF:10.0,
segment_002.ts
# Субтитры для разных языков
#EXT-X-MEDIA:TYPE=SUBTITLES,GROUP-ID="subs",LANGUAGE="ru",NAME="Русский",DEFAULT=YES,URI="subtitles_ru.vtt"
#EXT-X-MEDIA:TYPE=SUBTITLES,GROUP-ID="subs",LANGUAGE="en",NAME="English",DEFAULT=NO,URI="subtitles_en.vtt"
DASH манифест¶
<AdaptationSet mimeType="text/vtt" lang="ru">
<SegmentTemplate media="subtitles_ru_$Number$.vtt" initialization="subtitles_ru_init.vtt"/>
</AdaptationSet>
<AdaptationSet mimeType="text/vtt" lang="en">
<SegmentTemplate media="subtitles_en_$Number$.vtt" initialization="subtitles_en_init.vtt"/>
</AdaptationSet>
Автоматическое разделение по языкам¶
Определение языков¶
Модуль автоматически определяет язык субтитров на основе языковых кодов в DVB потоке
Устранение неполадок¶
Проблемы с распознаванием¶
Низкое качество распознавания¶
- Проверьте качество входящего DVB сигнала
- Проверьте поддержку языка у поддержки, возможно он не поддерживается
Отсутствие субтитров в выходе¶
- Проверьте наличие DVB субтитров во входном потоке
- Убедитесь в правильности конфигурации dvbocr
- Проверьте логи модуля на ошибки
Производительность¶
- Достаточные ресурсы CPU — для обработки OCR в реальном времени
- Оптимизация памяти — для буферизации кадров субтитров
- Эффективная дисковая система — для записи выходных файлов
Совместимость устройств¶
Поддерживаемые устройства¶
- Современные телевизоры — с поддержкой HLS/DASH
- Смартфоны и планшеты — iOS, Android
- Веб-браузеры — Chrome, Firefox, Safari, Edge
- Стриминговые приставки — Apple TV, Chromecast, Fire TV
Форматы субтитров¶
- WebVTT — стандарт для HTML5 видео
- HLS субтитры — встроенные в m3u8 манифесты
- DASH субтитры — отдельные адаптационные наборы
Заключение¶
DVB-WebVTT модуль обеспечивает современное решение для преобразования графических DVB субтитров в текстовые WebVTT субтитры. Автоматическое распознавание, многоязычная поддержка и интеграция с HLS/DASH делают его незаменимым инструментом для обеспечения доступности контента на современных устройствах.