Каталог охранных устройств
Контакты
СТАТЬИ

Алгоритмы сжатия

 

Один из наиболее эффективных и употребительных на практике методов сжатия неподвижных изображений был предложен международной организацией стандартизации ISO в стандарте JPEG (Joint Photographic Experts Group). Данный стандарт определяет последовательности и параметры операций при кодировании и декодировании неподвижных изображений. JPEG относится к методам сжатия изображений с потерями и используется в основном при записи неподвижных изображений с целью экономии объемов видео - регистраторов систем охранного теленаблюдения. Для большинства реальных полутоновых и цветных изображений этот метод позволяет уменьшить объем информации от пяти до десяти раз без критического ухудшения визуального восприятия качества. JPEG не предназначен для сжатия рисунков, чертежей и других изображений, имеющих два уровня яркости. Последовательность операций при кодировании включает:

  • разбиение изображения на блоки восемь на восемь пикселей;
  • выполнение быстрого преобразования ДКП или БДКП в каждом блоке;
  • квантование полученных коэффициентов ДКП с использованием коэффициентов квантования;
  • энтропийное кодирование квантованных коэффициентов ДКП каждого блока изображения.

Последняя операция выполняется кодером Хаффмена с использованием таблицы кодирования (таблицы кодов). Вместо кодера Хаффмена может использоваться арифметический кодер. Рассмотрим подробнее операции, выполняемые при кодировании, и соответствующие им обратные операции, выполняемые при декодировании. Полутоновое монохромное (черно-белое) изображение разбивается на блоки "восемь на восемь пикселей". Эти блоки далее кодируются один за другим. Порядок кодирования блоков слева направо, один горизонтальный ряд блоков за другим. Цветное изображение может быть представлено в формате RGB, когда для каждого пикселя задаются значения трех основных цветов. В этом случае каждый блок "восемь на восемь пикселей" представляется тремя блоками "восемь на восемь чисел". Кодирование данных каждого из трех  цветов выполняется так же, как для полутонового монохромного изображения.

Предпочтительнее представление цветного изображения в формате YCBCR, где для каждого пикселя задаются значения яркости и цветоразностных сигналов. В этом случае возможно уменьшение числа блоков для информации о цвете. Например, если уменьшить число отсчетов цветоразностных сигналов по вертикали и по горизонтали в два раза, что соответствует формату 4:2:0, то на каждые четыре блока элементов сигнала яркости – Y – будет приходиться один блок элементов сигнала CB и один блок элементов сигнала CR. По сравнению с форматом RGB полное число кодируемых блоков уменьшится в два раза, но заметного ухудшения качества изображения при этом не произойдет, так как зрительный аппарат человека не воспринимает искажение цвета мелких деталей изображения.

Возможны два варианта последовательности кодирования блоков цветного изображения. Согласно первому варианту, называемому последовательным (sequental), сначала кодируются все блоки элементов сигнала Y, затем – все блоки элементов сигнала CB, затем – все блоки сигнала CR. Второй вариант предусматривает перемежение (interleaved) блоков разных составляющих. Например, в случае формата дискретизации 4:2:0, сначала кодируются четыре блока Y, образующие матрицу "два на два", затем соответствующий им один блок CB, затем – один блок CR, затем следующие четыре блока Y и так далее.

При объединении блоков в декодированное изображение количество элементов CB и CR восстанавливается с помощью интерполяции.

Исходные данные для ДКП имеют вид блоков или матриц "восемь на восемь" элементов сигнала Y, CB или CR, выражаемых восьми - разрядными целыми положительными двоичными числами. Перед выполнением ДКП значение каждого элемента блока сдвигается путем вычитания числа 128, в результате чего элементы блоков выражаются целыми числами со знаком.

После этого в кодере JPEG выполняется ДКП в соответствии с формулами кодирования при квантовых коэффициентах M=N=8. Обратное ДКП в декодере JPEG выполняется в соответствии с обратной формулой при тех же квантовых числах M и N. После чего выполняется обратный сдвиг уровня каждого элемента путем прибавления числа 128. Как правило, при вычислениях используются алгоритмы быстрого ДКП.

В результате выполнения ДКП квадратной матрицы чисел "восемь на восемь" получается квадратная же матрица ДКП - коэффициентов "восемь на восемь", которые могут быть как положительными, так и отрицательными целыми числами из диапазона {-2047 ... +2047}. Эта операция сама по себе не изменяет количества передаваемой информации и является обратимой, так как после выполнения обратного ДКП в каждом блоке и объединения блоков получается изображение, идентичное исходному. Единственным источником необратимых потерь информации могут быть ошибки округления при вычислениях, однако эти ошибки могут быть сделаны достаточно малыми за счет выбора разрядности вычислительных средств.

Тем не менее, именно ДКП создает основу для последующего значительного уменьшения объема передаваемой информации. Рассмотрим, как это получается. В первую очередь необходимо отметить, что каждый коэффициент ДКП содержит информацию не об одном каком-то элементе из матрицы элементов изображения, а обо всех шестидесяти четырех элементах. Поэтому, при выполнении обратного ДКП, изображение формируется в виде суперпозиции составляющих, каждая из которых имеет определенную пространственную частоту. Как известно из теории информации, наибольший вклад при формировании большинства реальных изображений вносят низкочастотные составляющие, которые и определяют формы и яркости основных объектов и фона изображения. Высокочастотные составляющие создают резкие границы и контуры, а также мелкую текстуру изображения.

Возможность уменьшения скорости передачи двоичных символов при ДКП основана на указанных свойствах пространственно-частотного спектра реальных изображений и на ограниченной способности человеческого зрения, воспринимать изменения и искажения мелкой структуры изображения. Количество передаваемой информации уменьшается путем более грубого квантования части или всех передаваемых коэффициентов матрицы квантования, в результате которого уменьшается число двоичных разрядов, используемых для представления коэффициентов, а многие из коэффициентов вообще превращаются в ноль.

 Уменьшение необходимой скорости передачи двоичной информации по сетям цифрового охранного телевидения достигается за счет отбрасывания несущественной части видеоинформации. Поэтому изображение, получаемое с помощью обратного ДКП в системах цифрового видеонаблюдения, не будет абсолютно идентично исходному переданному изображению охраняемого объекта. Следовательно, данный метод кодирования относится к методам кодирования с частичной потерей видеоинформации. Однако отбрасываемая информация оказывается несущественной для оператора видеонаблюдения, а возникающие изменения и искажения изображения не снижают ли почти не снижают его достоинств для охранного видеонаблюдения. Поэтому рассмотренный метод кодирования можно еще назвать методом сокращения психофизиологической избыточности изображения охраняемого объекта. Для реальных изображений, отражающих в адекватной для восприятия форме состояние охраняемого объекта, наибольшее значение имеют низкочастотные составляющие сигнала, которые, естественно, должны передаваться с максимально высокой точностью. Высокочастотные составляющие изображения охраняемого объекта, имеющие относительно большой уровень, создают резкие границы и контуры, а так же высококонтрастные малозначительные детали на фоне силуэта объекта наблюдения. Конечно, эта видеоинформация тоже важна для оператора охранного видеонаблюдения, хотя, может быть, и с меньшей точностью, чем низкочастотные составляющие. Остальные высокочастотные составляющие, величины которых малы и в результате квантования оказываются сведенными к нулю, создают малоинформативную мелкую текстуру отдельных участков изображения и незначительные особенности контуров объектов. Потеря этой информации никак не меняет сути происходящего на мониторе охраны, так как смысл происходящего понятен сотруднику охраны и без чрезмерной детализации. Но совершенно иная ситуация возникает, если изображение передается для обработки в автоматическую систему, которая без вмешательства оператора видеонаблюдения должна принять самостоятельное решение и сделать вывод о характере происходящего на охраняемом объекте с целью подачи сигнала оператору, который уже затем самостоятельно будет обрабатывать ситуацию. Для автоматического распознавания могут быть важны детали изображения, которые в силу интегральной связи органа зрения и органа принятия решения и обработки у человека могут быть дополнены на основе экстраполяции и опыта.

По мере увеличения степени сжатия видеоинформации по стандарту JPEG возрастает заметность блочной структуры, увеличиваются искажения яркости и цветности. Некоторые аппаратные кодеки при декодировании и воспроизведении сжатых по стандарту JPEG изображений выполняют дополнительную фильтрацию (сглаживание) на границах блоков, чтобы уменьшить заметность блочной структуры изображения на мониторе системы охранного видеонаблюдения.

JPEG может использоваться и для сжатия движущихся изображений, а не только для покадровой архивации с целью уменьшить место, занимаемое видеоархивом на регистраторе. Но все равно, каждый кадр рассматривается, кодером, как отдельное неподвижное изображение и кодируется независимо от других кадров. Такой метод сжатия видеоинформации, называемый Motion JPEG, может быть полезен для ускоренного воспроизведения сохраненной на видеорегистраторе информации.

Основной же метод кодирования движущегося изображения, применяемый при передаче видеоинформации в режиме реального времени, что как раз и важно для применений охранного телевидения, называется MPEG, по названию разрабатывающей его комиссии при ISO – Motion Picture Experts Group.

Метод MPEG  относится к классу гибридных методов кодирования видеоинформации в телевизионных системах видеонаблюдения, так как в нем сочетаются внутрикадровое (intraframe) кодирование, направленное на уменьшение в основном психофизиологической избыточности в отдельных кадрах, и межкадровое (interframe) кодирование, с помощью которого уменьшается избыточность, обусловленная межкадровой корреляцией. Использование межкадрового кодирования позволяет получить существенно большую степень сжатия движущегося изображения, чем при раздельном сжатии кадров по методу JPEG.

Внутрикадровое кодирование содержит операции, аналогичные используемым в методе JPEG, то есть поблочное дискретное косинусное преобразование, квантование и кодирование с переменной длиной кодовых слов. Межкадровое кодирование содержит операции оценки и компенсации движения и кодирования с предсказанием.

При кодировании видеоинформации в системах передачи охранного видео, полные кадры и неполные их куски допустимо кодировать при помощи совместного межкадрового и внутрикадрового кодирования. Мы в дальнейшем изложении будем называть – для краткости – этот метод просто межкадровым кодированием в отличие от внутрикадрового кодирования.

Изображением или "картинкой" (picture) в стандарте MPEG может быть как целый кадр, так и одно из полей кадра. Далее термин "кадр" мы будем использовать вместо термина "изображение" везде за исключением моментов, где обсуждаются различия между кадровым и полевым режимом кодирования.

Последовательность кадров делится на группы, называемые GOP (group of picture). В группе есть кадры трех типов:

  • I-кадры (Intraframe – внутрикадровые), которые передаются только с внутрикадровым кодированием и являются опорными для декодирования остальных кадров группы, обеспечивая возможность начала декодирования остальных кадров группы и воспроизведения принятого видеосигнала практически в любой момент времени;
  • P-кадры (Predictive – предсказанные), при передаче которых используется межкадровое кодирование путем предсказания с компенсацией движения по ближайшему предшествующему I-кадру или, хотя некоторые фрагменты P-кадра могут кодироваться без предсказания, а только с помощью внутрикадрового кодирования.
  • B-кадры (Bidirectional – двунаправленные), которые передаются с межкадровым кодированием путем предсказания с компенсацией движения по ближайшим к ним как спереди, так и сзади I-кадрам и P-кадрам, а сами не могут использоваться для предсказания других кадров, хотя некоторые фрагменты B-кадра могут кодироваться внутрикадровым методом. Перед кодированием порядок следования кадров изменяется, так как каждый B-кадр должен идти после обоих кадров, по которым он предсказывается. В таком порядке кадры предсказываются и передаются, а в процессе декодирования восстанавливается исходный порядок кадров. При кодировании видеоизображения для передачи по сетям с прогрессивной разверткой, каждый кадр состоит из одного поля и разбивается на макроблоки.

В стандарте сжатия движущегося изображения MPEG, применяемом в системах охранного видеонаблюдения, макроблоком называется квадратный фрагмент изображения размером шестнадцать на шестнадцать пикселей. Макроблок содержит информацию как о яркости (Y) ,  так и о цветности (CB, CR). В случае применения формата дискретизации видео 4:2:0 каждый макроблок содержит четыре блока восемь на восемь пикселей сигнала яркости (Y) и по одному блоку восемь на восемь элементов цветоразностных сигналов CB и CR. При использовании формата 4:2:2 каждый макроблок содержит притом же количестве блоков (Y) по два блока CB и CR, а при использовании формата 4:4:4 – по четыре блока CB и CR.

Некоторое определенное количество макроблоков последовательно идущих в потоке макроблоков  в стандарте сжатия MPEG называется слайсом (slice – доля, часть, квант). Количество макроблоков одного слайса может быть произвольным. Слайсы в изображении не могут перекрываться, но их положение может изменяться от одного изображения к другому.

При кодировании телевизионного изображения в системах видеонаблюдения с прогрессивной разверткой, каждый кадр состоит из одного поля и разбивается на макроблоки.

В случае чересстрочной развертки каждый кадр состоит из двух полей. Первое поле содержит нечетные строки кадра, а второе поле – четные строки. При этом возможны два варианта кодирования кадра, выбор одного из которых для данного кадра осуществляется на основе оценки движения в нем.

Полный кадр, целиком хранящийся в памяти кодера при кадровом кодировании (frame), является самим кодируемым изображением, поэтому для кодирования доступны единовременно и совместно как четные, так и нечетные строки. Блоки элементов сигнала яркости и блоки элементов цветоразностных сигналов для форматов 4:2:2 и 4:4:4 выделяются из макроблока интеркадровым способом (interframe).

В случае формата 4:2:0 в блоки цветоразностных сигналов берутся элементы из каждой второй строки. Кадровое кодирование применяют в видеонаблюдении, когда изменения во втором поле кадра незначительны относительно первого поля того же кадра.

Изображением, которое подвергается кодированию при осуществлении метода полевого кодирования (field), является каждое поле. Первое поле кадра может использоваться для предсказания макроблоков второго поля того же кадра. При этом в каждый блок элементов сигнала яркости или элементов цветоразностных сигналов для форматов 4:2:2 и 4:4:4 входят элементы из одного поля.

Блоки элементов цветоразностных сигналов для формата 4:2:0 образуются так же, как при кадровом кодировании. Мы уже обсуждали тот факт, что при описании логики функционирования кодера и декодера следует помнить о полевом кодировании, хотя речь обычно идет о кадровом кодировании.

В стандарте MPEG не описано построение кодера для систем охранного телевидения, а лишь определен синтаксис потока данных на его выходе. Кодирование с переменной длиной кодовых слов осуществляется с помощью таблицы кодов, имеющихся в стандарте. Как и в JPEG, коэффициенты ДКП (дискретного косинусного преобразования), соответствующие постоянным составляющим, кодируются с использованием предсказания по таким же коэффициентам предыдущих блоков, и для них предназначены отдельные таблицы кодов с переменной длиной кодовых слов. Отметить стоит, что в тексте стандартов JPEG нет термина "кодирование по Хаффмену". Видимо, это связано с тем, что таблицы кодов заданы в стандарте, а не вычисляются под конкретные данные, как это требуется при кодировании по Хаффмену. Макроблоки P-кадров могут кодироваться как внутрикадровым методом, так и межкадровым в зависимости от наличия и интенсивности изменений в этом макроблоке по сравнению с соответствующей областью изображения, по которому выполняется предсказание данного P-кадра, то есть в зависимости от результатов оценки изображения.

Изображение, по которому выполняется предсказание, формируется из кодированных данных предыдущего I- или P-кадра.

Оценка движения на охраняемом объекте осуществляется путем сравнения текущего изображения, поступающего на вход кодера, с изображением, находящимся в памяти системы и используемым для предсказания (то есть опорным изображением).

 Источник: портал о видеонаблюдении panasonicvideo.ru


Принципы обнаружения пожара
Жидкокристаллические мониторы систем видеонаблюдения
Антенны мобильных комплексов CCTV
Охрана периметра. Датчики положения
Охрана периметра. Радиолучевые двухпозиционные средства обнаружения
Охрана периметра. Радиолучевые однопозиционные средства обнаружения
Охрана периметра. Сейсмические средства обнаружения
Охрана периметра. Пассивные инфракрасные облучатели
Комбинированные извещатели (СВЧ+ИК)
Алгоритмы сжатия
Передача по оптоволокну
Кодеки, кодеры, декодеры
Мультиплексирование и демультиплексирование в сетях CCTV
Помехоустойчивость видеонаблюдения
Охрана периметра. Инфракрасные активные двухпозиционные камеры
Вариообъективы
Объективы
Мегапиксельные объективы
Вариообъективы "день/ночь"
Охрана периметра
Антивандальные видеокамеры
Web – видеокамеры
Сетевые видеокамеры
Скоростные купольные видеокамеры
Охрана периметра. Мобильные беспроводные комплексы
Видеокамеры
Миниатюрные видеокамеры
Черно-белые видеокамеры
Цветные видеокамеры
Тепловизионные видеокамеры

Страницы: 1 2 3 4

Все документы предоставлены для ознакомления!
Перепечатка материалов сайта возможна только с письменного разрешения администрации сайта!

Тел./Факс:
Рейтинг@Mail.ru  Яндекс цитирования 
Продвижение сайта - Synergy Alliance