H 264 отвечает отдельное графическое. Алгоритмы сжатия в системах видеонаблюдения. Что такое H.264

Сегодня камеры наблюдения можно увидеть практически на каждом шагу. Возможно, вы также планируете установить одну или несколько камер у себя дома. Такие устройства работают с видеофайлами форматов.264 или H.264. Но как посмотреть видео и чем открыть файл рассмотрим в статье.

Различия и сходства форматов 264 и H.264

Формат.264 – это необработанные элементарные потоки видеофайлов H.264-ES (еще называют временным видео-файлом MPEG-4). В свою очередь H.264-ES является частью спецификации формата H.264. Старые модели видеорегистраторов записывают видео в формате.264. Такие видеофайлы не могут использоваться для прямого просмотра обычными проигрывателями и требуют обработки специальными программами.

Позволяет уменьшить видеозапись до минимального размера. После того, как видеозаписи проходят полное сжатие, качество видео и аудио по-прежнему остается на высоком уровне. С этим форматом работают камеры видеонаблюдения и видеорегистраторы нового образца. Файлы H.264 еще называются MPEG-4 Part 10 AVC/H.264. Несмотря на длинное и страшное название в сети очень легко найти проигрыватель файлов H.264.

Для открытия таких файлов необходимо воспользоваться одним из нижеперечисленных способов:

  • использовать специальные программы и утилиты;
  • выполнить конвертацию видеофайлов.

Открытие видео H.264

Практически все популярные программы и конвертеры работают с форматом H.264, Популярными являются:

Работа с форматом.264

Давайте рассмотрим более подробно, чем открыть файл.264 с видеорегистратора или камеры наблюдения.

Специальные программы

Для открытия видео.264 станут полезными следующие программы:

Видеофайлы.264 можно объединить или разъединить. Как это сделать мы рассмотрим дальше.

Утилиты

Чтобы воспроизвести файл.264, необходимо поместить его в контейнерный формат, который сможет распознать любой медиа-проигрыватель. Для этой цели рекомендуем воспользоваться одной из следующих утилит:

  1. Demuxer – умеет создавать записи dsm или mpc. Стоит отметить, что файлы dsm можно воспроизвести только в этой утилите.
  2. MKVcleaver – с ее помощью вы сможете вырезать видео в.MKV.
  3. Mkvmerge – способна изменить, вырезать, объединить или разъединить видеофайлы. После обработки видео качество видео не ухудшается, а формат меняется на.MKV.
  4. Haali Muxer – может помочь в преобразовании, объединении или разъединить видеофайлов. После обработки видео ему присваивается формат.MKV.

Как ожидается, новейший стандарт сжатия видеоизображения H.264 (известный также под названием MPEG-4 Part 10/AVC, последние буквы которого означают "передовое кодирование видеосигналов") станет в ближайшие годы самым востребованным видеостандартом.

H.264 - это открытый лицензированный стандарт с поддержкой самых эффективных на сегодняшний день технологий сжатия видеоизображения. Кодер H.264 без ущерба для качества изображения может снижать размер файла цифрового видео более чем на 80% по сравнению с форматом Motion JPEG и на 50% - по сравнению со стандартом MPEG-4 Part 2. Что означает гораздо меньшие требования к полосе пропускания для передачи и объему памяти для хранения видеофайла. Или же, с другой стороны, возможность получения гораздо лучшего качества видеоизображения при той же скорости передачи данных.

Прошедший коллективное утверждение со стороны организаций по стандартизации в области телекоммуникационных и информационных технологий, H.264, как ожидается, получит более широкое распространение по сравнению с предшествующими стандартами.

H.264 уже появился в таких новых электронных устройствах, как мобильные телефоны и цифровые видеоплееры, и сразу завоевал признание со стороны конечных пользователей. Провайдеры различных услуг, такие как онлайн-хранилища видеоматериалов и телекоммуникационные компании также начали использование H.264.

В отрасли охранного видеонаблюдения H.264, по всей вероятности, быстрее всего найдет свое применение в таких областях, которые требуют использования высокой частоты кадров и , например, для охранного наблюдения за автомагистралями, аэропортами и казино, где нормой является использование частоты 30/25 (NTSC/PAL) кадров в секунду. Наибольшая экономия будет достигнута за счет снижения требований к ширине полосы пропускания и объему свободного пространства для хранения данных.

Кроме того, ожидается, что H.264 ускорит переход на мегапиксельные камеры, поскольку высокоэффективная технология сжатия может снизить огромные размеры файлов и скорость их передачи без ущерба для качества изображения. Есть, впрочем, и сопутствующие требования. Хотя H.264 предлагает экономию расходов на ширину пропускного канала сети и объемы свободного пространства для хранения данных, этот стандарт требует наличия сетевых камер и станций наблюдения с более высокими техническими характеристиками.

Разработка стандарта H.264

H.264 является результатом совместного проекта группы экспертов по кодированию видео ITU-T и группы экспертов по вопросам кинотехники ISO/IEC (MPEG). ITU-T проводит координацию телекоммуникационных стандартов от имени Международного телекоммуникационного союза. ISO расшифровывается как Международная организация по стандартизации, а IEC - Международная электротехническая комиссия, которая осуществляет надзор за всеми электротехническими, электронными и сопутствующими им технологиями. Название H.264 используется со стороны ITU-T, в то время как ISO/IEC дали стандарту название MPEG-4 Part 10/AVC, поскольку он представляет собой новый элемент в их пакете MPEG-4. В пакет MPEG-4, к примеру, входит и MPEG-4 Part 2 - стандарт, применяемый в и сетевых камерах на базе IP-систем.

H.264, разработанный для исправления некоторых недостатков в предыдущих стандартах сжатия видеоизображений, достигает своих целей благодаря:

  • Улучшениям, позволяющим снизить скорость передачи данных в среднем на 50%, и предлагающими такое качество неподвижного видеоизображения, которое сравнимо с любым другим видеостандартом;
  • устойчивости к ошибкам, которая позволяет воспроизводить изображение несмотря на ошибки при передаче данных по различным сетям;
  • низкому уровню задержки и получению лучшего качества при более высоком уровне задержки;
  • простой структуре синтаксиса, которая упрощает внедрение стандарта;
  • декодированию на основе точного совпадения, при котором определяется точное количество числовых расчетов, производимых кодером и декодером, что позволяет избежать появления накапливающихся ошибок.

H.264 также обладает гибкостью, которая позволяет применять его для решения различных задач с самыми разными требованиями к скорости передачи данных. К примеру, в области развлекательного видео (телетрансляции, DVD, спутниковое и кабельное телевидение) H.264 способен обеспечить скорость от 1 до 10 мегабит в секунду с высоким уровнем задержки, в то время как для телекоммуникационных услуг H.264 может предложить скорость передачи данных менее 1 мегабита в секунду с низким уровнем задержки.

Как происходит сжатие видеоизображения:

Сжатие видеоизображения - это сокращение и удаление избыточных видеоданных с целью оптимизации хранения и передачи файлов цифрового видео.

В ходе этого процесса исходный видеосигнал обрабатывается с помощью алгоритма для создания сжатого файла, готового к передаче и хранению. Для воспроизведения сжатого файла применяется инверсный алгоритм, который фактически дает то же самое видеоизображение, что и оригинальный источник видеосигнала. Время, требуемое для сжатия, отправки, распаковки и отображения файла, называется задержкой. При одинаковой вычислительной мощности - чем более сложен алгоритм сжатия, тем выше задержка.

Совместная работа пары алгоритмов называется видеокодеком (кодер/декодер). Видеокодеки, применяющие разные стандарты, как правило, несовместимы друг с другом, поэтому видеоданные, сжатые с использованием одного стандарта, нельзя распаковать с применением другого стандарта. К примеру, декодер MPEG-4 Part 2 не будет работать с кодером H.264. Причиной тому является тот факт, что один алгоритм не может корректно декодировать результат, полученный с помощью работы другого алгоритма, однако есть возможность оснастить множеством разных алгоритмов программное или аппаратное обеспечение, чтобы оно могло производить сжатие разных форматов.

В различных стандартах сжатия видеоизображения применяются различные методы сокращения размера данных, и, таким образом, результаты отличаются по скорости передачи данных, качеству и уровню задержки.

Результаты сжатия могут различаться и у кодеров, использующих один и тот же стандарт, поскольку разработчик кодера волен выбирать, какие именно наборы средств, определенных стандартом, в нем задействовать. До тех пор пока результат на выходе кодера соответствует формату и декодеру стандарта, возможны различные методы его реализации. Это выгодно, поскольку различные методы реализации имеют разные цели и разный бюджет. Профессиональные программные кодеры для работы с оптическими носителями не в режиме реального времени должны иметь возможность обеспечивать лучшее кодированное видеоизображение по сравнению с аппаратными кодерами для проведения видеоконференций в режиме реального времени, встроенными в портативные устройства. Таким образом, определенный стандарт не может гарантировать определенную скорость передачи данных или ее качество. Более того, функционирование одного стандарта нельзя корректно сравнивать с другими стандартами или даже с различными методами реализации этого же стандарта без предварительного определения конкретного метода реализации.

Декодер же, в отличие от кодера, должен реализовывать в себе все необходимые элементы стандарта с тем, чтобы декодировать соответствующий поток битов. Поэтому стандарт четко указывает, как именно алгоритм распаковки должен восстанавливать каждый бит сжатого видеоизображения.

Приведенный ниже график сравнивает скорость передачи данных при одинаковом уровне качества изображения следующих видеостандартов: Motion JPEG, MPEG-4 Part 2 (без компенсации движения), MPEG-4 Part 2 (с компенсацией движения) и H.264 (базовый профиль).

Рис.1. Для выбранной последовательности видеокадров кодер H.264 генерирует до 50% меньше бит в секунду по сравнению с кодером MPEG-4 с компенсацией движения. Кодер H.264, по меньшей мере, в три раза эффективнее, чем кодер MPEG-4 без компенсации движения, и по меньшей мере в шесть раз эффективнее, чем Motion JPEG.

Профили и уровни H.264

Объединенная группа, участвующая в определении стандарта H.264, сосредоточила свое основное внимание на создании простого и ясного решения, сводящего к минимуму количество опций и параметров. Важнейшим аспектом данного стандарта, как и в случае с другими видеостандартами, является предоставление различных возможностей в рамках профилей (наборов алгоритмических параметров) и уровней (классов функционирования) для оптимальной поддержки популярных продуктов и распространенных форматов.

В H.264 заложено семь профилей, каждый из которых рассчитан на конкретную область применения. Каждый профиль определяет, какой именно набор параметров может использовать кодер, и ограничивает сложность реализации декодера.

Сетевые камеры и видеокодеры, скорее всего, будут использовать так называемый базовый профиль, рассчитанный преимущественно на применение в областях с ограниченными вычислительными мощностями. Базовый профиль наиболее подходит для применения в современных кодерах режима реального времени, встроенных в сетевое видеооборудование. Этот профиль также обеспечивает низкий уровень задержки, что является важным требованием для охранного видеонаблюдения, и также имеет особую важность для управления в режиме реального времени функциями панорамирования, наклона и масштабирования сетевых PTZ-камер.

H.264 имеет 11 уровней или степеней ограничения требований к функциональности, пропускному каналу и памяти. Каждый уровень определяет скорость передачи данных и скорость кодирования в макроблоках в секунду для разрешений в диапазоне от QCIF до HDTV и выше. Чем выше разрешение, тем выше требуемый уровень.

Использование кадров

В зависимости от профиля H.264, кодером могу использоваться различные типы кадров, а именно I-кадры, P-кадры и B-кадры.

I-кадр (или вводный кадр) - это изолированный кадр, который может декодироваться независимым образом без привязки к любым другим изображениям. Первое изображение в видеопоследовательности всегда является I-кадром. I-кадры необходимы в качестве начальных точек для новых просмотров или точек повторной синхронизации в случае нарушения переданного потока битов. I-кадры можно использовать для реализации функций перемотки вперед, назад и иных функций произвольного доступа. Кодер автоматически вставляет I-кадры через равные промежутки времени или по требованию в случае, когда ожидается присоединение новых клиентов к просмотру потока. Недостатком I-кадров является чрезмерное количество составляющих их бит, но, с другой стороны, они и не создают большого количества искажений.

P-кадр, который расшифровывается как промежуточный кадр предсказуемого характера, содержит ссылки для своего кодирования на части предшествующих I-кадров и/или P-кадров. P-кадры, как правило, требуют меньшее количество бит, чем I-кадры, но имеют недостаток в том плане, что они очень уязвимы по отношению к ошибкам передачи из-за своей сложной зависимости от предшествующих ссылочных P- и I-кадров.

B-кадр (или промежуточный кадр двунаправленного предсказания) - это кадр, содержащий в себе ссылки и на предыдущий, и на последующий ссылочные кадры.

Рис. 2. Типовая последовательность I-, B- и P-кадров. P-кадр может ссылаться только на предшествующий I- или P-кадр, в то время как B-кадр может ссылаться как на предшествующий, и на последующий I- или P-кадры.

Когда видеодекодер восстанавливает видеоизображение посредством покадрового декодирования потока бит, процесс декодирования всегда должен начинаться с I-кадра. При использовании P-кадров и B-кадров они должны декодироваться вместе с ссылочными кадрами.

В базовом профиле H.264 используются только I- и P-кадры. Этот профиль идеально подходит для сетевых камер и видеокодеров из-за своего низкого уровня задержки, достигаемого за счет отсутствия B-кадров.

Основные методы сокращения данных

Для сокращения количества видеоданных, как в рамках кадра с изображением, так и в рамках последовательности видеокадров, можно использовать самые разнообразные методы.
В рамках кадра изображения сокращение данных можно произвести простым удалением избыточной информации, что окажет свое влияние на разрешение изображения.


В рамках последовательности кадров сокращение видеоданных можно произвести с помощью таких методов, как кодирование по отличиям, которое используется в большинстве стандартов сжатия видеоизображения, в том числе и H.264. При кодировании по отличиям кадр сравнивается с ссылочным кадром (т.е. предыдущим I- или P-кадром) и кодируются только изменившиеся по отношению к ссылочному кадру пиксели. Таким образом сокращается количество пиксельных значений для кодирования и отправки.

Рис.3. В формате Motion JPEG три изображения в показанной выше последовательности кодируются и отправляются как отдельные уникальные изображения (I-кадры) без какой-либо зависимости друг от друга.


Рис.4. При кодировании по отличиям (применяемом в большинстве стандартов сжатия видеоизображения, в том числе и в H.264) полностью кодируется только первое изображение (I-кадр). В двух последующих изображениях (P-кадрах) ставятся ссылки на первое изображение в отношении статичных элементов (в данном случае в отношении дома) и кодируются только движущиеся элементы (в данном случае бегущий человек) с использованием вектора движения, что, таким образом, снижает объем информации для отправки и хранения.

Объем кодирования можно дополнительно снизить, если обнаружение и кодирование по отличиям базируется на блоках пикселей (макроблоках), а не на отдельных пикселях - следовательно, сравниваются более крупные участки и кодируются только блоки со значительными отличиями. Снижаются также и затраты, сопутствующие указанию меняющегося места действия.

Впрочем, кодирование по отличиям существенно не снизит объем данных, если видеоряд содержит много движущихся объектов. И здесь можно использовать такие технологии, как поблочная компенсация движения. Поблочная компенсация движения учитывает то, что многое из того, что создает новый кадр в видеопоследовательности, можно найти на предыдущих кадрах, но, возможно, в другом месте действия. Данная техника разделяет кадр на ряды макроблоков. Новый кадр (например, P-кадр) можно составить или "предсказать" поблочно посредством поиска совпадающего блока в ссылочном кадре. При обнаружении совпадения кодер просто кодирует положение найденного совпадающего блока в ссылочном кадре. Кодирование так называемого вектора движения требует меньше бит, чем кодирование фактического содержания всего блока.

Эффективность H.264 выводит технологию сжатия видеоизображения на новый уровень.

Стандарт H.264 вводит новую передовую схему внутреннего предсказания при кодировании I-кадров. Данная схема может значительно сократить размер (в битах) I-кадра при сохранении высокого качества при помощи успешного предсказания маленьких блоков пикселей в рамках макроблока внутри кадра. Это происходит посредством попытки найти совпадающие пиксели среди ранее закодированных пикселей, которые ограничивают новый пиксельный блок 4x4 для внутреннего кодирования. Путем повторного использования уже закодированных пиксельных значений можно значительно сократить размер данных в битах. Новое внутреннее предсказание - это ключевой элемент технологии H.264, уже доказавший свою высокую эффективность. Для сравнения: даже если в потоке H.264 использовать только I-кадры, размер получившегося файла будет гораздо меньшим, чем для потока Motion JPEG, в котором используются только I-кадры.

Рис.6. Иллюстрации того, как можно использовать некоторые режимы внутреннего предсказания при кодировании пикселей 4x4 в рамках одного из 16 блоков, образующих макроблок. Каждый из 16 блоков внутри макроблока может кодироваться с помощью разных режимов.

Рис.7. Помещенные выше изображения иллюстрируют эффективность схемы внутреннего предсказания H.264, при которой внутренне предсказанное изображение отправляется "бесплатно". Для создания изображения на выходе необходимо закодировать только содержимое остаточного изображения и режимы внутреннего предсказания.

В H.264 также улучшена поблочная компенсация движения, применяемая при кодировании P- и B-кадров. Кодер H.264 может выбирать для поиска совпадающих блоков (вплоть до субпиксельной точности) некоторых или многих участков внутри одного или внутри нескольких ссылочных кадров. Для улучшения поиска совпадений можно также настраивать размер и форму блоков. На участках, где внутри ссылочного кадра нельзя найти никаких совпадающих блоков, используются внутренне закодированные макроблоки. Высокая степень гибкости поблочной компенсации движения в H.264 эффективна в местах видеонаблюдения за большим количеством людей, где следует сохранять требуемое для этой области применения качество изображения. Компенсация движения является наиболее востребованным аспектом видеокодера, а различные способы и уровни, при которых возможна ее реализация посредством кодера H.264, помогают повысить эффективность сжатия видеоизображения.

Со стандартом H.264 типичные блочные объекты, заметные на видеоизображениях с высокой степенью сжатия по стандартам Motion JPEG и MPEG (в отличие от H.264), можно уменьшить благодаря встроенному деблокирующему фильтру. Этот фильтр автоматически сглаживает края блоков, создавая почти идеальное развернутое видеоизображение.

Рис.8. Блочные объекты на изображении с высокой степенью сжатия слева уменьшились при применении деблокирующего фильтра, как это видно на изображении справа.

Заключение

H.264 представляет собой огромный шаг вперед в технологии сжатия видеоизображения. Этот стандарт предлагает различные технологии, позволяющие добиться лучшей эффективности сжатия благодаря применению более точных схем внутреннего предсказания, а также большей устойчивости к ошибкам. Он открывает новые возможности для создания передовых видеокодеров, способных значительно повысить качества изображения, увеличить частоту кадров и разрешение при сохранении той же скорости передачи данных (по сравнению с предшествующими стандартами) или же, напротив, обеспечить видеоизображение того же качества при меньшей скорости передачи данных.

H.264 представляет собой первый образец совместной работы Международного телекоммуникационного союза, Международной организации по стандартизации и Международной электротехнической комиссии по типовым международным стандартам сжатия видеоизображения. Из-за своей гибкости H.264 нашел применение в таких разнообразных областях, как DVD высокой четкости (например, Blu-ray), видеотрансляция, в том числе трансляция телевидения высокой четкости, онлайн-хранилища видеоматериалов (например, YouTube), мобильная телефонная связь третьего поколения, в таких программах, как QuickTime, Flash и в операционной системе MacOS X на компьютерах Apple, а также в игровых видеоприставках, например, PlayStation 3. Благодаря поддержке во многих отраслях промышленности и разработки программных приложений, рассчитанных на удовлетворение потребительских и профессиональных потребностей, H.264, как ожидается, заменит другие, используемые на сегодняшний день, стандарты и методы сжатия.

С более широким распространением формата H.264 в сетевых камерах, видеокодерах и программном обеспечении для управления , разработчикам и интеграторам систем требуется уверенность в том, что выбранные ими продукты и поставщики поддерживают этот новый открытый стандарт. На данный момент сетевое видеооборудование, поддерживающее как H.264, так и Motion JPEG - это идеальный выбор, обеспечивающий наивысшую степень универсальности и интеграции.

Сегодня у телекомпаний есть свобода выбора в вопросах касательно сжатия телесигнала. Форматы MPEG‑2, H.264 и JPEG 2000 являются наиболее конкурентными вариантами для выполнения сжатия видеопотока на профессиональном уровне. В конечном итоге, инфраструктура сети, полоса пропускания и бюджет являются решающими факторами для телекомпании, которые помогают определиться с «правильным» выбором. Форматы MPEG‑2 и H.264 являются эффективными решениями сжатия мультимедийных приложений с целью их последующего воспроизведения.

Веские аргументы можно привести в пользу формата JPEG 2000, который основан на передовых внутрикадровых методах кодирования и обеспечивает высокую степень гибкости и управляемости, не сравнимую с гибкостью и управляемостью других форматов сжатия. Более того, факт появления все больших и больших разновидностей передаваемых видеоприложений, которые требуют более низкого времени задержки и более высокого качества изображения, делает формат JPEG 2000 оптимальным решением в удовлетворении требований передачи видео в HD-качестве.
Главной задачей всех телекомпаний - независимо от инфраструктуры сети, выбранного метода сжатия и особенностей транслируемых приложений - является передача сигнала максимального качества при заданной полосе пропускания, ограничив при этом расходы с целью получения максимальной прибыли. Имейте в виду, что передача видеопотока представляет собой комплексную цепь процессов. Какой-либо процесс, происходящий внутри цепи, влияет на процесс передачи видео в целом, в результате серьезная недоработка внутри цепи затрагивает все последующие звенья и приводит к ухудшению качества передачи видео в целом. Конечно, то, как выбранный формат сжатия реализовывается, и как осуществляется управление им, также играет крайне важную роль в достижении наилучшей производительности независимо от выбранной схемы сжатия.

MPEG‑2: «устаревший» кодек

Алгоритмы сжатия видео, такие как MPEG‑2 и H.264 являются кодеками, которые основаны на дискретном косинусном преобразовании (ДКП). С целью сокращения объема данных видеосигнала между сериями кадров эти кодеки используют алгоритм межкадрового предсказания. Суть данного алгоритма заключается в методе дифференцированного кодирования, когда последующий кадр сравнивается с исходным, после чего выполняется кодирование только тех пикселей, которые изменились.
В результате количество пикселей, которые необходимо кодировать и передавать, уменьшается. Когда такая кодированная последовательность передается на экран ТВ, полученное видео ничем не отличается от исходной последовательности кадров.
Появление MPEG‑2 было обусловлено необходимостью трансляции сигналов с более высокой скоростью передачи данных - сигналов SD-формата (величина битрейта от 3 Мб/с до 15 Мб/с) и HD-формата (величина битрейта от 15 Мб/с до 30 Мб/с). При передаче видеоизображения с использованием метода предикативного сжатия MPEG‑2 каждый закодированный кадр в последовательности изображений может передаваться как независимо сжатый кадр («I-кадр»), сжатый кадр с использованием предсказания движения в одном направлении («P-кадр») и сжатый кадр с использованием предсказания движения в двух направлениях («B-кадр»). Благодаря сокращению пространственной и временной избыточности MPEG‑2 обеспечивает повышенное сжатие. Тем не менее использование «B-кадров» приводит к появлению задержки предупорядочивания, которая зависит от количества передаваемых «B-кадров». При большом количестве передаваемых «B-кадров» эта задержка может быть очень значительной.
MPEG‑2 до сих пор является широко распространенным кодеком и рассматривается как конкурентоспособный выбор благодаря его низкой стоимости внедрения и поддержке широкого диапазона цветопередачи – 4:2:2. Тем не менее существует ряд ограничений, которые обусловлены как самим кодеком, так и стандартами, которые регулируют его реализацию.
Например, MPEG‑2 по сравнению с конкурирующими кодеками требует, как правило, более высокой пропускной способности для обеспечения достаточно высокого качества видео. Вследствие потоковой битовой структуры сигнала и его формы передачи в виде отдельных пакетов закодированный сигнал в MPEG‑2 крайне чувствителен к ошибкам и любым потерям информации. Потеря или повреждение одного из пакетов оказывает существенное влияние на процесс декодирования, что приводит к «битым» кадрам или выраженным искажениям изображения, а это в конечном итоге приведет к прекращению использования MPEG‑2 в среде профессионального телевещания.

H.264: кодек следующего поколения

H.264 или MPEG-4 Part 10 (Advanced Video Coding) кодек был разработан в качестве альтернативы кодеку MPEG‑2 и характеризуется повышенной производительностью и более широким набором инструментов, что обеспечивает высокую гибкость в отношении передачи информации. В результате H.264, по сравнению с MPEG‑2, обеспечивает эквивалентное качество видео при более низкой скорости передачи данных. При переходе на кодирование H.264, по сравнению с MPEG‑2, пропускная способность, достаточная для передачи изображения аналогичного качества, может быть снижена на величину до 50 процентов. В этом кодеке используется ассиметричная архитектура. Сложность вычислений в нем минимизирована, что обуславливает его высокую гибкость, достаточную для применения этого кодека для широкого спектра приложений, включая трансляцию, хранение и передачу данных по беспроводной мультимедийной связи.
Алгоритм сжатия H.264 схож с алгоритмом MPEG‑2 и основан на тех же основных принципах, включая компенсацию движения с переменным размером блоков и дискретное косинусное преобразование. Более того, H.264 характеризуется высокой производительностью и надежностью. Он выполняет как пространственное предсказание при внутрикадровом кодировании, так и оценку движения при межкадровом кодировании, что улучшает эффективность сжатия. При внутрикадровом кодировании каждый кадр кодируется сам по себе, без использования информации соседних кадров. Кроме того, H.264 использует предварительную обработку этапов, используя для этого соседние пиксели из ранее закодированных блоков, что является преимуществом по сравнению с внутрикадровой пространственной корреляцией.
Ключевые особенности данного стандарта – это эффективность сжатия и передачи данных, а также направленность на сжатие видео широкого спектра приложений. Благодаря тому, что на сегодняшний день кодек поддерживает 17 профилей и 16 уровней, каждый из которых нацелен на конкретный класс популярных передаваемых видеоприложений, достигается высокий уровень гибкости и масштабируемости.
Формату H.264 свойственны такие же ограничения, как и для формата MPEG‑2. В конечном итоге, эти ограничения связаны с возможностью существующей технологии, что препятствует применению формата H.264 в профессиональной среде вещания. На сегодняшний день наиболее технологически продвинутым кодеком, совместимым со стандартами вещания, является H.264, выполняющий сжатие видео со скоростью 80 Мб/с, ограниченный разрешением в 8 бит. Реализация сети на основе H.264 может быть дорогостоящей. Стоимость по сравнению с конкурирующими стандартами может быть в четыре раза выше за счет себестоимости и потребления мощности. Благодаря архитектурной асимметрии кодеков может сложиться впечатление, что высококачественные декодеры обладают низкой стоимостью, в результате чего пользователи очень часто удивляются высокой цене на профессиональные видеодекодеры.

JPEG 2000: выбор прогрессивного метода сжатия

Метод JPEG 2000, предлагаемый современным рынком, является его ключевым достоинством. Стандарт и система кодирования JPEG 2000 основаны на «вейвлет-технологии» сжатия изображения. Изначально он был задуман не как кодек для сжатия видео, а как кодек сжатия графических изображений. Примененная в нем внутрикадровая схема кодирования имеет ряд преимуществ, характерных для всего цикла вещания - доставка, формирование, а также первичное и вторичное распределение.
JPEG 2000, по сравнению с форматами H.264 и MPEG‑2, хорошо известен своим отличным визуальным качеством (см. рисунок 1). JPEG 2000 выполняет кодирование в пределах полного кадра, в то время как другие схемы сжатия требуют, чтобы изображение было разбито на более мелкие блоки, в результате чего ухудшение качества происходит неравномерно и может различаться в пределах кадра. Это приводит к появлению визуально раздражающего искажения, известного как «блокинг-эффект». В случае с JPEG 2000 потеря качества происходит равномерно по всей области кадра и зрительно воспринимается как сглаживание краев, иначе говоря, происходит размытость. Такое искажение визуально является менее раздражающим, чем «блокинг-эффект», так как размытость в большей степени соответствует естественному восприятию человеческого глаза. JPEG 2000 обладает уникальной возможностью доставки информации в первоначальном виде для последующей обработки. За счет обеспечения высокого качества на более низком уровне возможна передача высокого качества на более высокий уровень. Видео JPEG 2000 остается практически нетронутым при осуществлении многократных циклов кодирования/декодирования. Это позволяет сохранить высокое качество видео, передав его по этой цепочке.

JPEG 2000 характеризуется низким временем задержки - порядка 1.5 кадра или меньше на весь цикл кодирования-декодирования. Этот параметр является критичным для интерактивных приложений и может привести к отсутствию связи при переходе от одного кадра к следующему кадру. Низкое время задержки порядка 45 мс при сжатии HD-потока является преимуществом по сравнению с форматами H.264 и MPEG‑2, время задержки в которых достигает от одной до двух секунд.
Высокая скорость передачи, которая достигается за счет сжатия JPEG 2000, также критически важна. При сравнении реализованных проектов замечено, что, как правило, JPEG 2000 может работать при очень высоких скоростях - намного более высоких, чем H.264. Для передачи изображения высокого качества это является ключевым моментом, так как пропускная способность может быть ограничена конкретным типом инфраструктуры, однако ширина полосы пропускания не обязательно является критической. Например, HD-видео при 1.5 Гб/с невозможно передать по сети Ethernet в 1 Гбит, но для этой цели может быть выделен весь канал. Следовательно, передача HD-видео может быть осуществлена, если задействовать всю ширину полосы пропускания и применить «легкое» JPEG 2000 сжатие для достижения как наивысшего качества, так и вписывания в ширину канала или, когда уместно, закодировать с использованием математического сжатия без потерь с целью исключения потерь видеоинформации.
Одним из наиболее значительных преимуществ формата JPEG 2000 является его гибкость. Возможна передача данных по множеству типов сетевых инфраструктур - Ethernet/IP, SONET/SDH/PDH и по оптоволокну. Когда данные упакованы с помощью JPEG 2000 в ASI-поток, то видео может передаваться везде, в любое время и на любое расстояние. JPEG 2000 выполняет независимое кодирование каждого поля и каждого кадра, яркости и цветности компонента. Качество, которое достигается за счет математического сжатия без потерь, сравнимо с качеством математического сжатия с потерями. Видео может быть закодировано путем математического сжатия без потерь, но по причине недостаточной пропускной способности канала может обрезаться и преобразовываться в сжатие с потерями.
Конструктивно для JPEG 2000 характерным является одинаковый уровень сложности как для процесса кодирования, так и для процесса декодирования. Так как JPEG 2000 является симметричным кодеком, одно и то же аппаратное средство может быть предоставлено как в качестве кодера, так и в качестве декодера, в то время как асимметричные кодеки требуют совершенно разных аппаратных средств, особенно при высокой скорости передачи данных. Относительно низкая сложность JPEG 2000 имеет преимущества в стоимости, капитальных и эксплуатационных затратах, а также снижает расходы на электропитание сети.

Подводим итоги

Каждый из рассмотренных в статье кодеков играет свою индивидуальную роль в сфере качественной передачи данных. Кодеки H.264/MPEG-4 и MPEG‑2 по-прежнему актуальны в сфере профессионального телевещания. Они обеспечивают высокое качество в сетях с ограниченной пропускной способностью, но они не обязательно являются единственно правильным выбором во всех возможных сферах применения.
Формат JPEG 2000 обеспечивает высокое качество изображения и низкое время задержки при кодировании в несколько циклов. На сегодняшний день он подтвердил свою значимость во всех сферах видеотехнологий, в сфере передачи данных по IP- и 3G-сетям, а также в HD- и 3D-технологиях.
Помимо качества и инфраструктуры сети, в процессе сравнения и выбора метода сжатия необходимо учитывать степень затрат ресурсов и его стоимость. В целом, методы сжатия MPEG‑2 и H.264 являются дорогостоящими, энергозатратными и требуют применения сложных технологий.
Так как кодек JPEG 2000 по сравнению с другими требует меньше энергозатрат и в целом обеспечивает большую масштабируемость, гибкость и качество изображения, то перед ним открывается блестящее будущее. Все большее число ведущих мировых поставщиков услуг телевещания, а также телекомпаний используют JPEG 2000 для трансляции крупных, глобально значимых событий – особенно с использованием мощностей IP-сетей. Однако существующая ситуация постоянно изменяется, и, возможно, завтра перед нами предстанет новый, более «навороченный» метод сжатия.

Он будет сильно отличаться в зависимости от содержимого исходных видео. Я доберусь до этого немного.

640x360 не так уж и велика. 512 Кбит/с очень разумно и, возможно, стандартно. Может быть, 768 кбит/с, если вы действительно заинтересованы в качестве.

Как это возможно? Упрощенный ответ: Существует несколько методов и фактов о сжатии видео , которые делают это возможным:

  • Не вся структура видеокадра в общем H.264 (или другие кодеки, если на то пошло) - это полное изображение . Вместо этого существуют два типа, которые в обычном порядке называются
    • Ключевые фреймы : полный рендеринг всего видеоизображения
    • Внутри кадра : описание изменений предыдущего кадра. Эти кадры обычно составляют подавляющее большинство (80% -99%) кадров в видео.
  • H.264 является "потерянным" , как и многие другие кодеки. Они не воспроизводят поэтапный, поэтапный точный дубликат исходного исходного видео. Пример : Блоки Lossy: если все, кроме одного пикселя в области, имеют один и тот же цвет, CODEC "теряет" один пиксель. Таким образом, вместо того, чтобы хранить информацию о каждом пикселе в кадре, CODEC просто говорит: "x1, y1 - x2, y2 - весь цвет x". Очень эффективный.

Все это намного сложнее, чем это, с использованием различных подходов, методов и алгоритмов в рамках определенных кодеков и между CODEC, чтобы это произошло.

Итак, вернемся к разделу "Это сильно изменится в зависимости от содержимого исходного видео". Коэффициент сжатия, который вы увидите, и результирующее качество, будут в значительной степени зависеть от:

  • содержимое видео
  • ваш толерантность к артефактам (блоки, потеря цвета, потеря определения)
  • параметры CODEC, которые вы установили, и способы их установки

Пример . Видео с дверью в комнате (например, камерой безопасности) с одним ключевым кадром каждые десять минут будет иметь удивительно высокую степень сжатия. В моих расчетах на основе салфеток этот сценарий был применен при сжатии 15 000: 1.

Поскольку вы начинаете с большого проекта кодирования видео, я бы порекомендовал пару вещей, чтобы определить, какова будет ваша степень сжатия:

  • возьмите образец исходных видео, которые вы собираетесь кодировать. 100 или более являются статистически релевантными.
  • закодировать их с различными скоростями передачи данных с различными параметрами, чтобы определить, какие итоговые характеристики соответствуют вашим потребностям.

Изменение параметров кодировщика для уменьшения размера видео может также иметь другие последствия:

  • более высокие требования к процессору.
  • ожидания игроков CODEC. Не все видео, закодированные в формате H.264, могут воспроизводиться всеми игроками.
  • более длительное время кодирования
  • различное качество

Это очень сложный вопрос. Удачи. Мой опытный тест "большой палец к ветру" говорит, что вы будете более чем счастливы с 512-768 кбит/с для своего проекта.