19
Долинин А.А., учитель информатики и ИКТ МБОУ «Уренская СОШ № 1» Сжатие файлов. Архиваторы.

Сжатие файлов. Архивация

Embed Size (px)

Citation preview

Page 1: Сжатие файлов. Архивация

Долинин А.А., учитель информатики и ИКТ МБОУ «Уренская СОШ № 1»

Сжатие файлов. Архиваторы.

Page 2: Сжатие файлов. Архивация

Избыточность• Редакторы, работающие с текстовой, графической,

звуковой и другой информацией, кодируют ее наиболее естественным, но не самым экономичным способом.

• Действительно, если внимательно посмотреть любой текст, то можно заметить, что такие буквы «а» и «о», встречаются в нем гораздо чаще чем «ю» и «у». То же самое можно отнести и к сочетаниям букв.

• На рисунках цвета соседних точек в большинстве случаев близки по оттенку. Подобно этому в любой последовательности информации некоторые сочетания встречаются намного чаще других.

Page 3: Сжатие файлов. Архивация

Избыточность• Все это приводит к тому, что в файлах, хранящих

эту информацию, некоторые комбинации из 0 и 1 встречаются гораздо чаще, чем другие. В таких случаях говорят, что информация обладает избыточностью, и есть возможность перекодировать содержание файла, уменьшив его размер.

• Для сжатия достаточно придерживаться правила: чем чаще встречается комбинация, тем более коротким сочетанием из 0 и 1 ее можно перекодировать. Разумеется, делать это должна программа.

Page 4: Сжатие файлов. Архивация

4

Архивация и сжатие файловАрхивация – создание резервных копий (на CD, DVD). Цели:

сохранить данные на случай сбоя на диске объединить группу файлов в один архив зашифровать данные с паролем

Сжатие файлов – это уменьшение их размера. Цели: уменьшить место, которое занимают файлы на диске уменьшить объем данных для передачи через Интернет

Типы сжатия: без потерь: сжатый файл можно восстановить в исходном

виде, зная алгоритм сжатия▫тексты▫программы▫данные

с потерями: при сжатии часть информации безвозвратно теряется

фотографии (*.jpg) звук (*.mp3) видео (*.mpg)

Page 5: Сжатие файлов. Архивация

Почему файлы можно сжать?

Алгоритм RLE (англ. Run Length Encoding, кодирование цепочек одинаковых символов, используется для рисунков *.bmp)

A A … A B B … B

100 100

200 байт

Файл qq.txt

Файл qq.rle (сжатый)

A 100 B 100 4 байта

Сжатие с потерями или без??

сжатие в 50 раз!сжатие в 50 раз!

Сжатие возможно, если в данных есть повторяющиеся символы или цепочки символов, сжатие «устраняет» эту избыточность.

Page 6: Сжатие файлов. Архивация

6

Почему файлы можно сжать?Общий подход:

найти в данных повторяющиеся цепочки символов обозначить их короткими кодами (битовыми, разной длины) в начало сжатого файла записать словарь

Эффективные алгоритмы: алгоритм Хаффмана алгоритм LZW (Лемпела-Зива-Велча) алгоритм PPM (WinRAR)

Сжимаютсяхорошо плохо

случайные данные программы (*.exe) архивы (*.zip, *.rar) сжатые рисунки (*.gif, *.jpg, *.png, *.tif, …)

сжатый звук (*.mp3, *.wma) сжатое видео (*.mpg, *.wmv)

случайные данные программы (*.exe) архивы (*.zip, *.rar) сжатые рисунки (*.gif, *.jpg, *.png, *.tif, …)

сжатый звук (*.mp3, *.wma) сжатое видео (*.mpg, *.wmv)

тексты (*.txt) документы (*.doc, *.xls) несжатые рисунки (*.bmp) несжатый звук (*.wav) несжатое видео (*.avi)

тексты (*.txt) документы (*.doc, *.xls) несжатые рисунки (*.bmp) несжатый звук (*.wav) несжатое видео (*.avi)

Page 7: Сжатие файлов. Архивация

Архиватор

– это служебная программа, предназначенная для компрессии (сжатия) файлов, т.е. для уменьшения их размера и занимаемого ими дискового пространства.

Резервное копирование – создание архивированных копий файла или группы файлов.

Page 8: Сжатие файлов. Архивация

ARJ.EXE .arj

PAK.EXE .pak

LHICE.EXE .ice

ZOO.EXE .zoo

RAR.EXE .rar

ZIP.EXE .zip

По pасшиpению аpхивного файла можно опpеделить, каким аpхиватоpом создан аpхив

Программы-архиваторы:

Page 9: Сжатие файлов. Архивация

•Создание резервных копий документов.

•Создание электронных архивов;

•Перенос данных из одного ПК на

другой.

•Передача данных по сети.

Цели использования архиваторов:

Page 10: Сжатие файлов. Архивация

ФУНКЦИИ ПРОГРАММ - АРХИВАТОРОВ:•создавать архивы и извлекать из них

файлы; •добавлять, извлекать, или удалять из

архива отдельные файлы или группы файлов;

•создавать самораспаковывающиеся архивы ;

•создавать многотомные архивы;•устанавливать пароль на архив; •уменьшить размер файла для отправки по

e-mail.

Page 11: Сжатие файлов. Архивация

Специальные типы архивов SFX-архив (англ. SelF eXtracting –

самораспаковыва-ющийся) – это файл с расширением *.exe, который содержит сжатые данные и программу распаковки (около 15 Кб).

Многотомный архив – это архив, разбитый на несколько частей. Цели:

перенос через дискеты удобство скачивания через Интернет

WinRAR: abc.part1.rar, abc.part2.rar, …. многотомный SFX-архив: abc.part1.exe, abc.part2.rar, ….

для распаковки не нужен архиватор может распаковать неквалифицированный пользователь

увеличение размера файла опасность заражения вирусами

Page 12: Сжатие файлов. Архивация

Самораспаковывающиеся архивы

– это архивный файл, который будет иметь расширение .exe и запускается как обычная программа. Файлы из такого архива могут быть извлечены на любом компьютере путем запуска программы;

Page 13: Сжатие файлов. Архивация

К настоящему времени наибольшую популярность и «жизненное

пространство» завоевали архиваторы

WinZipWinRar

Page 14: Сжатие файлов. Архивация

Архиватор WinRAR: упаковка

ЛКМЛКМ

тип архива

тип архива

SFXSFX

многотомные архивы

многотомные архивы

парольпарольимя архива

имя архива

Page 15: Сжатие файлов. Архивация

Архиватор WinRAR: распаковка

ЛКМЛКМкуда распаковать?куда распаковать?

выбрать папкувыбрать папку

Page 16: Сжатие файлов. Архивация

Архиватор WinRAR в ПроводникеУпаковка Распаковка

ПКМПКМ

ПКМПКМ

Page 17: Сжатие файлов. Архивация

Информация об архиве

Page 18: Сжатие файлов. Архивация

КНИГАГлава 1.doc

150 Кб

(150 Кб)

Книга.rar30 Кб

Глава 2.docГлава 3.docГлава 4.doc

30*100% 150

= 20%Степень сжатия:

Page 19: Сжатие файлов. Архивация

Вопросы:

• Почему есть возможность уменьшать размер файлов?

• Что такое архивация?• Какие файлы не имеет смысла

архивировать?• Почему перед пересылкой текстового

файла по электронной почте имеет смысл предварительно его упаковать в архив?