30

13 встреча — Сжатие данных (Р. Одинцов)

Embed Size (px)

DESCRIPTION

13 встреча Smolensk Computer Science Club Презентация Руслана Одинцова про сжатие данных ВКонтакте: http://vk.com/scsc_13

Citation preview

Page 1: 13 встреча — Сжатие данных (Р. Одинцов)

СЖАТИЕ ДАННЫХ

Руслан ОдинцовСмоленск, 201 3

Page 2: 13 встреча — Сжатие данных (Р. Одинцов)

Вместо введения

25 fps303 x 225 pxRGB

Исходное видео: 58. 3 mb, 4975 kbsСжатое видео: 0. 324 mb, 27 kbsСтепеь сжатия R = 0. 00000545 (1 84x)

Page 3: 13 встреча — Сжатие данных (Р. Одинцов)

Часть IЭнтропия

Page 4: 13 встреча — Сжатие данных (Р. Одинцов)

Неэнтропийные методы:Run-Length Encoding (RLE)

Исходная строка:

WWWWWWWWWWWWBWWWWWWWWWWWWBBBWWWWWWWWWWWWWWWWWWWWWWWWBWWWWWWWWWWWWWW

Сжатая строка:

1 2W1 B1 2W3B24W1 B1 4W

[применяется в JPEG, PCX и др. ]

Page 5: 13 встреча — Сжатие данных (Р. Одинцов)

Неэнтропийные методы:Distance Coding (DC)

aaabccca --> 1 1 301 1 00

если алфавит A = "abc"

[применяется в BWT]

Page 6: 13 встреча — Сжатие данных (Р. Одинцов)

Неэнтропийные методы:Словарные методы Lempel-Ziv (LZ)

Page 7: 13 встреча — Сжатие данных (Р. Одинцов)

Информационная энтропия

Information is theresolution ofuncertainty.

– Claude Shannon

Page 8: 13 встреча — Сжатие данных (Р. Одинцов)

Информационная энтропия:Минимальная единица информации

1 бит

2 бита

3 бита

Page 9: 13 встреча — Сжатие данных (Р. Одинцов)

Информационная энтропия

Page 10: 13 встреча — Сжатие данных (Р. Одинцов)

Информационная энтропия

Page 11: 13 встреча — Сжатие данных (Р. Одинцов)

Метод Хаффмана

Символ Код Вероятность Код Хаффманаa 00 0. 5 0b 01 0. 25 1 0c 1 0 0. 1 25 1 1 0d 1 1 0. 1 25 1 1 1

aaaabbсd --> 0 0 0 0 1 0 1 0 1 1 0 1 1 1R = 0. 875

Page 12: 13 встреча — Сжатие данных (Р. Одинцов)

Арифметическоеэнтропийное кодирование

Page 13: 13 встреча — Сжатие данных (Р. Одинцов)

Контекстное моделирование

THE ROOM WAS NOT VERY LARGE___ ROO_ ___ NOT V___ L____

Page 14: 13 встреча — Сжатие данных (Р. Одинцов)

Filter Predictor Entropyencoder

Структура компрессора

Model(s)

Page 15: 13 встреча — Сжатие данных (Р. Одинцов)

Prediction by partial match(PPM)

abbbabbb

Модель 1 -ого порядка:Контекст Символ Частотаa a 0a b 2b a 1b b 4

Page 16: 13 встреча — Сжатие данных (Р. Одинцов)

Prediction by partial match (PPM)

1 . readSymbol()2. shorten context3. while (context not found)4. output(escape sequence)5. shorten context6. output(character)7. while (context length not -1 ) do8. inc freq9. shorten context

Page 17: 13 встреча — Сжатие данных (Р. Одинцов)

Dynamic Markov Compression (DMC)

Page 18: 13 встреча — Сжатие данных (Р. Одинцов)

Часть IIПотери

Page 19: 13 встреча — Сжатие данных (Р. Одинцов)

Сжатие с потерями(Lossy compression)

Transform Entropyencoder

Потери

Filter

Page 20: 13 встреча — Сжатие данных (Р. Одинцов)

Сжатие с потерями:сжатие аудио

- Delta-coding (ADPCM)- Дискретное косинусное преобразование (DCT)- Психоакустическое моделирование- Аналитикосинтетическое сжатие речи

Page 21: 13 встреча — Сжатие данных (Р. Одинцов)

Преобразование Фурье

Page 22: 13 встреча — Сжатие данных (Р. Одинцов)

DCT

DFT

Page 23: 13 встреча — Сжатие данных (Р. Одинцов)

Сжатие с потерями:сжатие изображений

- Квантирование, YCbCr- Дискретное косинусное преобразование (DCT)- Wavelet

Page 24: 13 встреча — Сжатие данных (Р. Одинцов)

Двумерное дискретное косинусноепреобразование (DCT)

Page 25: 13 встреча — Сжатие данных (Р. Одинцов)

Двумерное дискретное косинусноепреобразование (DCT)

Page 26: 13 встреча — Сжатие данных (Р. Одинцов)

Часть IIIДругое

Page 27: 13 встреча — Сжатие данных (Р. Одинцов)

Колмогоровская сложность

Колмогоровская сложность K(x) - меравычислительных ресурсов, необходимых дляточного определения объекта x.

- Зависимость колмогоровской сложности отязыка описания ограничена- Колмогоровская сложность невычислима- На практике значение колмогоровскойсложности может быть аппроксимизированоразличными алгоритмами сжатия

Page 28: 13 встреча — Сжатие данных (Р. Одинцов)

Perpetuum mobile в сжатии данных

R = compressed_size / uncompressed_size

typ R < 1

avg R > 1

avg R <= 1 - perpetuum mobile в сжатии данных

R_copy = 1 = const

Page 29: 13 встреча — Сжатие данных (Р. Одинцов)

Премия Хаттера

Page 30: 13 встреча — Сжатие данных (Р. Одинцов)

Спасибо за внимание