Upload
gorkoff
View
107
Download
0
Embed Size (px)
Citation preview
АЛГОРИТМ ФРАГМЕНТАРНОГО
СЖАТИЯ ВИДЕОПОТОКА
Огнев И.В., Огнев А.И., Горьков А.Г.
Москва, 2012 г.
Постановка задачи
Разработать эффективный
алгоритм сжатия видеопотока без
потерь
Провести исследования
разработанного алгоритма
Выбрать параметры алгоритма,
максимизирующиекоэффициент
сжатия
Основные определения
Термин Определение
Видеопоток Массив кадров
КадрНабор всех видимых пикселей и их яркостей в
конкретный момент времени
Пиксел Минимальная единица изображения
Окно Прямоугольная область n1*n2 пикселей
Фрагмент Часть кадра, ограниченная окном
РазностьРезультат выполнения операции исключающее
ИЛИ над двумя фрагментами
База данных разностейНабор всех разностей, встретившихся в
видеопотоке
Код разностиПрефиксный код, позволяющий однозначно
идентифицировать разность
Структура видеопотока
Основные методы сжатия
видеопотока
Независимое сжатие кадров
Кодирование межкадровых
изменений
Алгоритм фрагментарного
кодирования
Характеристики
видеопотока
Характеристика Выбранное значение
Частота кадров 24 кадра в секунду*
Развѐртка Прогрессивная
Соотношение сторон 3/4*
Разрешение QVGA (320/240)*
Цветовое разрешение 4 bpp
* Алгоритм нечувствителен к данному параметру
Алгоритм сжатия
видеопотока
Формирование базы элементов
• Для всех окон вычисляются элементы, реально встречающиеся в видеопотоке
Построение коротких кодов
элементов
• Для полученных элементов строится кодовое дерево
Кодирование фильма
• Для каждого окна соответствующий элемент кодируется полученным коротким кодом
Формирование базы
разностей
Формирование баз кадровФормирование локальных
баз разностейФормирование общей
базы разностей
Формирование базы кадра
(1)
Кадр N Кадр N+1
Формирование базы кадра
(2)
База кадра
Окно Разность Кол-во
1 0 1
2 0 1
3 0 1
4 Р4 1
5 Р5 1
6 Р6 1
7 0 1
… 0 1
13 Р13 1
14 Р14 1
15 Р15 1
16 0 1
… 0 1
54 0 1
Уплотнѐнная база
кадраРазность Кол-во
0 48
Р4 1
Р5 1
Р6 1
Р13 1
Р14 1
Р15 1
Формирование ЛБР
Формирование общей базы
разностей
Общая база разностей получается из локальных
баз путѐм их объединения. Т.к. объѐм баз не
позволяет хранить их в ОЗУ, необходимо
использовать специальные алгоритмы,
оптимизированные для работы с диском.
Последовательные
слияние ЛБР
К достоинствам данного
алгоритма слияний
относится простота
реализации и возможность
оценить скорость роста базы.
Главным недостатком
является дополнительный
расход времени на
копирование постоянной
части базы.
Сбалансированные
слияния ЛБР
Метод сбалансированных
слияний чуть сложнее в
реализации и не позволяет
увидеть динамику роста
общей базы разностей, но
накладные расходы на
копирование баз значительно
уменьшены.
Структура закодированного
фильма
Объѐм сжатого складывается из двух составляющих: база
данных элементов и короткие коды элементов
Коэффициент сжатия
N1,N2 – Размеры кадра
n1,n2 – Размеры окна
M – Количество кадров в фильме
bpp – Глубина цвета
Nбазы – Количество уникальных разностей
pi – частота i-ого элемента базы
Эффективное представление
базы разностей
Вместо самой базы разностей можно передавать кодовое дерево.
Это позволит значительно уменьшить объѐм передачи
Повышение степени сжатия
В формуле Kсжатия все параметры кроме n1,n2
являются константами, поэтому степень сжатия
конкретного фильма может меняться только при
изменении конфигурации (размера и геометрии)
фрагмента.
Оценка вида функции
сжатия
Типы анализируемых
фильмов
Тип фильма Описание
Студийные съѐмки Все съѐмки происходят в одном
или нескольких помещениях.
Кардинальная смена сцены
происходит сравнительно
редко.
Видовые съѐмки Съѐмки природы с множеством
маленьких движущихся
объектов. Частая смена сцены.
Мультфильмы Однообразный фон.
Сравнительно простая
анимация. Редкая смена сцены.
Студийные съѐмки
Видовые съѐмки
Мультфильмы
Результаты
• Предложен новый эффективный алгоритм
сжатия видеопотока без потерь
• Выполнена оценка эффективности
предложенного алгоритма
• Произведена оптимизация параметров
алгоритма с целью повышения коэффициента
сжатия