ФЕДЕРАЛЬНОЕ
АГЕНТСТВО |
||
НАЦИОНАЛЬНЫЙ |
ГОСТ Р |
СИСТЕМЫ ОХРАННЫЕ
ТЕЛЕВИЗИОННЫЕ.
КОМПРЕССИЯ ОЦИФРОВАННЫХ
ВИДЕОДАННЫХ
Общие технические требования и
методы оценки
алгоритмов
|
Москва |
Цели и принципы стандартизации в Российской Федерации установлены Федеральным законом от 27 декабря 2002 г. № 184-ФЗ «О техническом регулировании», а правила применения национальных стандартов Российской Федерации - ГОСТ Р 1.0-2004 «Стандартизация в Российской Федерации. Основные положения»
1 РАЗРАБОТАН Закрытым акционерным обществом «Нордавинд» и рабочей группой экспертов организаций - членов ТК 234 «Системы тревожной сигнализации и противокриминальной защиты»: консорциумом «Интегра-С», Закрытым акционерным обществом «Компания БЕЗОПАСНОСТЬ», Закрытым акционерным обществом «Кодос-Б», Научно-внедренческим производством «Болид» по инициативе научно-производственной фирмы «Общество с ограниченной ответственностью «Сигма-ИС» при согласовании с Федеральным казенным учреждением «Научно-исследовательский центр «Охрана» МВД России и Федеральным казенным учреждением «Научно-производственное объединение «СТиС» МВД России
2 ВНЕСЕН Техническим комитетом по стандартизации ТК 234 «Системы тревожной сигнализации и противокриминальной защиты»
3 УТВЕРЖДЕН И ВВЕДЕН В ДЕЙСТВИЕ Приказом Федерального агентства по техническому регулированию и метрологии от 13 декабря 2011 г. № 1222-ст
4 ВВЕДЕН ВПЕРВЫЕ
Информация об изменениях к настоящему стандарту публикуется в ежегодно издаваемом информационном указателе «Национальные стандарты», а текст изменений и поправок - в ежемесячно издаваемых информационных указателях «Национальные стандарты». В случае пересмотра (замены) или отмены настоящего стандарта соответствующее уведомление будет опубликовано в ежемесячно издаваемом информационном указателе «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет
Введение
Активное применение в системах охранных телевизионных (СОТ) методов компрессии оцифрованных видеоданных, заимствованных из мультимедийных применений телевидения, привело к невозможности осуществления с использованием большинства существующих СОТ следственных мероприятий, а также и оперативных функций.
Важной отличительной особенностью методов компрессии оцифрованных видеоданных для СОТ является необходимость обеспечения высокого качества каждого отдельного кадра восстановленных видеоданных. Настоящий стандарт позволяет упорядочить существующие и разрабатываемые методы компрессии оцифрованных видеоданных, предназначенных для применения в составе систем противокриминальной защиты.
В качестве критерия для классификации алгоритмов компрессии оцифрованных видеоданных настоящий стандарт устанавливает значения метрик качества, характеризующих степень отклонения исходного и соответствующего ему восстановленного кадра оцифрованных видеоданных.
Настоящий стандарт следует применять совместно с ГОСТ Р 51558-2008 «Средства и системы охранные телевизионные. Классификация. Общие технические требования. Методы испытаний».
СИСТЕМЫ ОХРАННЫЕ ТЕЛЕВИЗИОННЫЕ.
КОМПРЕССИЯ ОЦИФРОВАННЫХ ВИДЕОДАННЫХ
Общие технические требования и методы оценки алгоритмов
Video surveillance systems. Digitized
video data compression.
General technical requirements and methods of algorithm evaluation
Дата введения - 2012-09-01
Настоящий стандарт распространяется на цифровые системы охранные телевизионные (далее - ЦСОТ) и устанавливает общие технические требования и методы оценки алгоритмов компрессии оцифрованных видеоданных в ЦСОТ.
Настоящий стандарт применяют к алгоритмам компрессии (декомпрессии), независимо от их реализации на аппаратном уровне.
Настоящий стандарт устанавливает классификацию алгоритмов компрессии (декомпрессии) оцифрованных видеоданных.
Настоящий стандарт устанавливает методику сравнения различных алгоритмов компрессии и декомпрессии оцифрованных видеоданных.
Настоящий стандарт применяют совместно со стандартами ГОСТ Р МЭК 60065, ГОСТ Р 51558, ГОСТ 13699, ГОСТ 15971.
В настоящем стандарте использованы нормативные ссылки на следующие стандарты:
ГОСТ Р 51558-2008 Средства и системы охранные телевизионные. Классификация. Общие технические требования. Методы испытаний
ГОСТ Р МЭК 60065-2009 Аудио-, видео- и аналогичная электронная аппаратура. Требования безопасности
ГОСТ 13699-91 Запись и воспроизведение информации. Термины и определения
ГОСТ 15971-90 Системы обработки информации. Термины и определения
Примечание - При пользовании настоящим стандартом целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования - на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодно издаваемому информационному указателю «Национальные стандарты», который опубликован по состоянию на 1 января текущего года, и по соответствующим ежемесячно издаваемым информационным указателям, опубликованным в текущем году. Если ссылочный стандарт заменен (изменен), то при пользовании настоящим стандартом следует руководствоваться заменяющим (измененным) стандартом. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, применяется в части, не затрагивающей эту ссылку.
В настоящем стандарте применены термины по ГОСТ 15971, ГОСТ 13699, ГОСТ Р 51558, а также следующие термины с соответствующими определениями:
3.1 видеоданные (video data), видеопоток (video stream): Аналоговый сигнал, несущий информацию о пространственно-временных параметрах изображений.
3.2 оцифрованные видеоданные (digitized video data): Данные, полученные путем аналого-цифрового преобразования видеоданных, представляющие собой последовательность байтов в некотором формате (RGB, YUV или др.).
3.3 формат оцифрованных видеоданных (digitized video data format): Представление оцифрованных видеоданных, обеспечивающее их обработку цифровыми вычислительными средствами.
Примечание - Формат оцифрованных видеоданных включает в себя используемую цветовую модель и размерность (количество бит) представления каждого канала для используемой цветовой модели.
3.4 компрессия оцифрованных видеоданных (video compression): Обработка оцифрованных видеоданных, предназначенная для уменьшения их объема.
3.5 сжатые видеоданные (compressed video data): Данные, полученные путем компрессии оцифрованных видеоданных.
3.6 компрессия оцифрованных видеоданных с потерями (lossy compression): Компрессия оцифрованных видеоданных, при которой происходит потеря информации, и вследствие этого восстановленные из сжатого видеопотока оцифрованные видеоданные отличаются от исходных оцифрованных видеоданных.
3.7 компрессия оцифрованных видеоданных без потерь (lossless compression): Компрессия оцифрованных видеоданных, при которой не происходит потери информации, и вследствие этого восстановленные из сжатого видеопотока оцифрованные видеоданные соответствуют исходным оцифрованным видеоданным.
3.8 декомпрессия сжатых видеоданных (decompression): Восстановление оцифрованных данных из сжатых видеоданных.
3.9 восстановленные видеоданные (decoded video data): Данные, полученные из сжатых видеоданных после их декомпрессии.
3.10 видеокодер (video encoder): Программные, аппаратные или аппаратно-программные средства, с помощью которых осуществляется компрессия оцифрованных видеоданных.
3.11 видеодекодер (video decoder): Программные, аппаратные или аппаратно-программные средства, с помощью которых осуществляется декомпрессия сжатых видеоданных.
3.12 кодек видеоданных (video codec): Программный, аппаратный или аппаратно-программный модуль, способный выполнять как компрессию, так и декомпрессию видеоданных.
3.13 степень сжатия (compression ratio): Коэффициент сокращения объема оцифрованных видеоданных в результате компрессии.
3.14 качество восстановленных видеоданных (decoded video data quality): Объективная оценка соответствия восстановленных видеоданных исходным оцифрованным видеоданным на основе рассчитанных метрик качества.
3.15 метрика качества (quality metric): Аналитически определяемые параметры, характеризующие степень отклонения восстановленных видеоданных от исходных оцифрованных видеоданных.
3.16 битрейт (bit rate): Выраженная в битах оценка количества сжатых видеоданных, определенная для некоторого временного интервала и отнесенная к длительности выбранного временного интервала в секундах.
3.17 разрешение (resolution): Свойство оцифрованных видеоданных, выражающее возможность различать на отдельных кадрах детали исходного изображения, которое определяется как количество пикселей (элементов изображения) по горизонтали и по вертикали, содержащихся в кадре.
3.18 цветовая модель (color space): Способ описания и представления цвета в виде кортежей чисел, называемых цветовыми компонентами или каналами, который является составной частью формата оцифрованных видеоданных.
3.19 цветовая модель Red-Green-Blue (RGB color model): Цветовая модель, представляющая цветовую информацию в виде трехкомпонентного кортежа чисел - красного (R), зеленого (G) и синего (В).
Примечание - Красная (R), зеленая (G) и синяя (В) цветовые компоненты соответствуют длинам электромагнитных волн 700 нм; 546,1 нм и 435,8 нм соответственно.
3.20 цветовая модель Grayscale (Grayscale color model): Цветовая модель, содержащая только один канал яркости изображения.
Примечание - Приведение изображения к модели Grayscale из модели RGB осуществляется по формуле: Grayscale = 0,299R + 0,587G + 0,114В.
3.21 глубина цвета (color depth): Объем памяти (в битах), необходимый для хранения и представления цветовой компоненты одного пикселя.
3.22 исходные данные: Цифровое изображение (оцифрованные видеоданные) в виде последовательности байтов в произвольном формате (RGB, YUV или др.) или последовательность цифровых изображений до обработки алгоритмом компрессии.
3.23 выходные данные: Цифровое изображение в виде последовательности байтов или последовательность цифровых изображений, полученных после обработки исходных данных алгоритмами компрессии и декомпрессии.
3.24 метод оценки алгоритма компрессии: Метод аналитического определения значений метрик качества на соответствие требованиям, предъявляемым к алгоритмам компрессии видеоданных.
3.25 алгоритм компрессии: Точный набор инструкций и правил, описывающий последовательность действий, согласно которым исходные видеоданные преобразуются в сжатые, а сжатые видеоданные преобразуются в восстановленные, реализуемый при помощи кодека видеоданных.
Требования, предъявляемые к компрессии оцифрованных видеоданных, направлены на обеспечение качества восстановленных видеоданных, которое определяется качеством видеоизображения каждого отдельного стоп-кадра восстановленных видеоданных.
Качество видеоизображения стоп-кадра восстановленных видеоданных определяется значениями метрик качества, характеризующих степень искажения восстановленных после сжатия видеоданных по сравнению с исходными оцифрованными видеоданными. Значения метрик качества для любого кадра восстановленных видеоданных должны соответствовать значениям, указанным в таблице 1.
5.1 Для оценки качества восстановленных видеоданных и классификации алгоритмов компрессии используют следующие метрики качества: пиковое отношение сигнал/шум (peak signal-to-noise ratio, PSNR); степень структурного подобия (structural similarity, SSIM); обобщенный коэффициент качества (video quality metric, VQM).
5.2 Классификация алгоритмов компрессии оцифрованных видеоданных осуществляется на основе значений метрик качества, которые отражают те аспекты изменения оцифрованных видеоданных после их обработки алгоритмами компрессии и декомпрессии, которые могут оказать критическое влияние на возможность использования восстановленных видеоданных для идентификации отличительных черт наблюдаемых объектов.
5.3 В зависимости от значений метрик качества, вычисленных в ходе проведения оценки алгоритма компрессии оцифрованных видеоданных, могут быть отнесены к одному из следующих классов:
- класс I - полнофункциональные алгоритмы компрессии, обеспечивающие качество восстановленных видеоданных, достаточное для идентификации отличительных черт наблюдаемых объектов;
- класс II - алгоритмы компрессии, обеспечивающие качество восстановленных видеоданных, достаточное для распознавания типов наблюдаемых объектов, но недостаточное для идентификации отличительных черт наблюдаемых объектов;
- класс III - алгоритмы компрессии, обеспечивающие качество восстановленных видеоданных, достаточное для наблюдения объектов, но недостаточное для распознавания типов.
Таблица 1 - Классификация алгоритмов компрессии
Метрика качества |
Диапазон значений метрик качества по классам
алгоритмов |
||
Класс III |
Класс II |
Класс I |
|
Пиковое отношение сигнал/шум |
От 25 до 30 включ. |
От 30 до 35 включ. |
Св. 35 |
Степень структурного подобия |
От 80 до 90 включ. |
От 90 до 95 включ. |
Св. 95 |
Обобщенный коэффициент качества видео |
Св. 30 |
От 30 до 20 включ. |
До 20 |
5.4 Значения метрик качества определяются для каждого кадра оцифрованных видеоданных, а в качестве результирующей оценки выбирается наименьшее значение. Если по какой-либо метрике качества алгоритм компрессии не попадает ни в один диапазон, то такой алгоритм считается не соответствующим настоящему стандарту.
5.5 Для цветного сигнала выполняется раздельная оценка яркостной и цветовой составляющих. В качестве результирующей оценки выбирается наименьшее значение.
5.6 Оценка на соответствие настоящему стандарту выполняется для фиксированного (заявленного) разрешения и частоты следования кадров оцифрованных видеоданных. Данные параметры оцифрованных видеоданных должны быть обязательно указаны при классификации (см. пример). Если соответствие стандарту достигается только при определенных настройках алгоритма компрессии, эти ограничения должны быть обязательно отражены в эксплуатационной документации.
Пример - Алгоритм соответствует классу I при разрешении R (пикс.), частоте кадров F (кадр/с). Максимальный измеренный битрейт составляет В (бит/с).
Общая схема работы ЦСОТ с точки зрения использования алгоритмов компрессии и декомпрессии представлена на рисунке 1.
Рисунок 1 - Общая схема работы ЦСОТ
Аналоговые видеоданные подвергаются аналогово-цифровому преобразованию, в результате которого получаются оцифрованные видеоданные, представляющие собой последовательность байтов в некотором формате (RGB, YUV или др.).
Оцифрованные видеоданные подвергают компрессии, в результате которой формируют сжатые видеоданные.
Сжатые видеоданные, как правило, используют для хранения архива или для передачи по сети, после чего они подвергаются декомпрессии. В результате декомпрессии сжатых видеоданных образуют восстановленные видеоданные, которые используют для визуализации оператору или подают на вход программным модулям видеоанализа.
В соответствии с представленной общей схемой работы ЦСОТ классификацию алгоритмов компрессии оцифрованных видеоданных выполняют путем оценки метрик качества восстановленных видеоданных от исходных оцифрованных видеоданных. В зависимости от особенностей технической реализации конкретной ЦСОТ могут применяться два метода оценки:
- на основе разделения оцифрованных видеоданных;
- на основе разделения видеоданных.
Перед оценкой значений метрик качества исходные и восстановленные видеоданные должны быть приведены к базовому формату RGB (для цветных видеоданных) с 8-битной глубиной цвета каждого канала или к базовому формату Grayscale (для черно-белых видеоданных) с 8-битной глубиной цвета канала.
6.1.1 Метод оценки алгоритма на основе разделения оцифрованных видеоданных
Предпочтение отдают методу оценки на основе разделения оцифрованных видеоданных. Для применения данного метода техническая реализация ЦСОТ должна позволять получить оцифрованные видеоданные до их обработки алгоритмами компрессии и декомпрессии.
Общая схема реализации метода оценки на основе разделения оцифрованных видеоданных представлена на рисунке 2.
Рисунок 2 - Общая схема реализации метода оценки на основе разделения оцифрованных видеоданных
Алгоритм осуществления оценки предполагает выполнение следующих действий:
- на вход испытуемой ЦСОТ подают последовательные видеоданные;
- с использованием возможностей ЦСОТ оцифрованные и восстановленные видеоданные сохраняют на устройствах хранения;
- выполняют расчет значений метрик качества и осуществляют классификацию алгоритма компрессии по таблице 1.
6.1.2 Метод оценки алгоритма на основе разделения видеоданных
Метод оценки на основе разделения видеоданных следует применять только в случае, если техническая реализация ЦСОТ не позволяет применять метод оценки на основе разделения оцифрованных видеоданных. Применение данного метода требует наличия дополнительной ЦСОТ в составе испытательного стенда, которая предназначена для сохранения оцифрованных видеоданных.
Общая схема реализации метода оценки на основе разделения видеоданных представлена на рисунке 3.
Алгоритм осуществления оценки по данному методу предполагает выполнение следующих действий:
- на вход испытуемой ЦСОТ подают последовательные видеоданные, которые дублируются на другую ЦСОТ посредством делителя видеосигнала (из состава испытательного стенда);
- с использованием возможностей ЦСОТ восстановленные видеоданные сохраняют на устройствах хранения;
Рисунок 3 - Общая схема реализации метода оценки на основе разделения видеоданных
- с использованием возможностей ЦСОТ из состава испытательного стенда оцифрованные видеоданные сохраняют на устройствах хранения;
- выполняют расчет значений метрик качества и осуществляют классификацию алгоритма компрессии по таблице 1.
Пиковое отношение сигнал/шум рассчитывают по формулам:
|
(1) |
|
(2) |
max Err = 2B - 1,
где w, h - ширина и высота оцифрованных видеоданных;
с - индекс цветового канала;
В - число бит, необходимое для представления одного пикселя оцифрованных видеоданных;
I - исходные оцифрованные видеоданные;
J - восстановленные видеоданные в цветовой модели RGB.
Перекодировать исходные и восстановленные оцифрованные видеоданные в цветовую модель Grayscale (для формул (3), (4), (6), (7), (8), (9): I - исходные оцифрованные видеоданные, J - восстановленные видеоданные в цветовой модели Grayscale).
Выполнить низкочастотную фильтрацию изображений путем их дискретной свертки с симметричным гауссовым ядром W.
W=1/100* |
0,000 |
0,001 |
0,004 |
0,011 |
0,022 |
0,027 |
0,022 |
0,011 |
0,004 |
0,001 |
0,000 |
, |
0,001 |
0,006 |
0,027 |
0,083 |
0,162 |
0,202 |
0,162 |
0,083 |
0,027 |
0,006 |
0,001 |
||
0,004 |
0,027 |
0,130 |
0,394 |
0,767 |
0,958 |
0,767 |
0,394 |
0,130 |
0,027 |
0,004 |
||
0,011 |
0,083 |
0,394 |
1,196 |
2,329 |
2,909 |
2,329 |
1,196 |
0,394 |
0,083 |
0,011 |
||
0,022 |
0,162 |
0,767 |
2,329 |
4,537 |
5,666 |
4,537 |
2,329 |
0,767 |
0,162 |
0,022 |
||
0,027 |
0,202 |
0,958 |
2,909 |
5,666 |
7,076 |
5,666 |
2,909 |
0,958 |
0,202 |
0,027 |
||
0,022 |
0,162 |
0,767 |
2,329 |
4,537 |
5,666 |
4,537 |
2,329 |
0,767 |
0,162 |
0,022 |
||
0,011 |
0,083 |
0,394 |
1,196 |
2,329 |
2,909 |
2,329 |
1,196 |
0,394 |
0,083 |
0,011 |
||
0,004 |
0,027 |
0,130 |
0,394 |
0,767 |
0,958 |
0,767 |
0,394 |
0,130 |
0,027 |
0,004 |
||
0,001 |
0,006 |
0,027 |
0,083 |
0,162 |
0,202 |
0,162 |
0,083 |
0,027 |
0,006 |
0,001 |
||
0,000 |
0,001 |
0,004 |
0,011 |
0,022 |
0,027 |
0,022 |
0,011 |
0,004 |
0,001 |
0,000 |
(3) |
|
(4) |
|
|
(5) |
Для граничных пикселей, отстоящих от границ изображения менее чем на 5 пикселей, выполнить фильтрацию по неполному ядру, которое должно быть предварительно нормализовано.
Вычислить среднеквадратичные отклонения между входными и отфильтрованными изображениями:
(6) |
|
(7) |
|
(8) |
|
(9) |
Определить значение структурного подобия в каждом пикселе по формуле
|
(10) |
C1 и С2 вычисляют по формулам:
|
где L - максимальное значение яркости (в случае глубины цвета 8 бит L = 255);
К1 = 0,01, К2 = 0,03 - поправочные константы.
Определить максимальное (maxSSIM) и среднее (meanSSIM) значения. Определить значение метрики SSIM по формуле
|
(11) |
Перекодировать исходные и восстановленные оцифрованные видеоданные в цветовую модель YʹCbCr. Перекодирование из цветовой модели RGB осуществляется по формулам:
|
(12) |
|
(13) |
|
(14) |
Нормировать оцифрованные видеоданные путем вычитания из каждого пикселя каждого канала числа А = 0,5 × 2B, где В - число бит, необходимое для представления пикселя в данном канале.
Разбить каждый канал исходных и восстановленных видеоданных на блоки 8 × 8 пикселей и выполнить двумерное дискретное косинусное преобразование по формуле
|
(15) |
|
|
f(x, у) - блок изображения, х, у = 0 ... 7,
F(u, v) - блок коэффициента, u, v = 0 ... 7.
Преобразовать все коэффициенты во всех блоках по формуле
|
(16) |
DC = F (0,0), М = 2 × 64В.
Выделить значимые коэффициенты по формуле
|
(17) |
где QM = |
8 |
16 |
19 |
22 |
26 |
27 |
29 |
34 |
, |
16 |
16 |
22 |
24 |
27 |
29 |
34 |
37 |
||
19 |
22 |
26 |
27 |
29 |
34 |
34 |
38 |
||
22 |
22 |
26 |
27 |
29 |
34 |
37 |
40 |
||
22 |
26 |
27 |
29 |
32 |
35 |
40 |
48 |
||
26 |
27 |
29 |
32 |
35 |
40 |
48 |
58 |
||
26 |
27 |
29 |
34 |
38 |
46 |
56 |
69 |
||
27 |
29 |
35 |
38 |
46 |
56 |
69 |
83 |
round() - операция округления до ближайшего наименьшего числа.
Преобразованные исходные и восстановленные оцифрованные видеоданные поканально вычесть друг из друга, взяв разности по модулю.
Определить максимальное (maxD) и среднее (meanD) значения абсолютных разностей по всем каналам.
Определить значение метрики VQM по формуле
|
(18) |
7.1 Два и более алгоритмов компрессии сравнимы друг с другом, если они принадлежат одному и тому же классу в соответствии с таблицей 1 и их оценка выполнена для одного и того же разрешения и одной и той же частоты следования кадров в оцифрованных видеоданных.
7.2 Из двух и более сравнимых алгоритмов компрессии лучшим признается алгоритм, обеспечивающий минимальное значение битрейта.
7.3 Значение битрейта измеряют в ходе проведения испытаний на различных входных наборах оцифрованных видеоданных. В качестве результирующей оценки битрейта выбирают максимальное значение из всех проведенных экспериментов.
Ключевые слова: охранные телевизионные системы, видеоданные, видеокомпрессия, видеопоток, видеокодер, видеодекодер