Transcript

LOGO

Архивация данных

Слайд-лекция

Материал подготовлен с использованием учебных пособий и ресурсов Интернет

Избыточность

Редакторы, работающие с текстовой, графической, звуковой и другой информацией, кодируют ее наиболее естественным, но не самым экономичным способом.

Действительно, если внимательно посмотреть любой текст, то можно заметить, что такие буквы «а» и «о», встречаются в нем гораздо чаще чем «ю» и «у». То же самое можно отнести и к сочетаниям букв.

На рисунках цвета соседних точек в большинстве случаев близки по оттенку. Подобно этому в любой последовательности информации некоторые сочетания встречаются намного чаще других.

Все это приводит к тому, что в файлах, хранящих эту информацию, некоторые комбинации из 0 и 1 встречаются гораздо чаще, чем другие. В таких случаях говорят, что информация обладает избыточностью, и есть возможность перекодировать содержание файла, уменьшив его размер.

Для сжатия достаточно придерживаться правила: чем чаще встречается комбинация, тем более коротким сочетанием из 0 и 1 ее можно перекодировать. Разумеется, делать это должна программа.

Необходимость архивации данных

Архивирование редко используемой информации для освобождения места на диске;

Для переноса информации; При использовании электронной

почты; При пересылке данных в Сети.

Понятие архива

Архив (архивный файл) — файл, состоящий из одного или нескольких файлов, как правило, сжатых с помощью программы-архиватора.

Архив может состоять и из нескольких частей (томов), каждая из которых хранится как отдельный файл.

Основные действия при работе с архивами:

создание нового архива;добавление файлов в архив;просмотр содержимого архива;извлечение файлов из архива;просмотр файла в архиве;удаление файлов из архива.

Для архивации данных существуют специальные служебные программы-архиваторы, которые вместо нескольких файлов создают один - архивный

Понятие архиватора

Архиватор — программа (утилита), позволяющая создавать архивные файлы и

извлекать файлы из архивов.

Наиболее популярными программами-архиваторами являются:

На сегодняшний день программа WinRAR является признанным лидером среди архиваторов. Программа WinRAR позволяет работу с файлами практически неограниченного размера. По заявлению разработчиков, поддерживаются файлы размером до 8,5 млн терабайт. Несмотря на такие гигантские объемы информации, WinRAR способен достигать максимального коэффициента сжатия, при этом работая с высокой скоростью (по сравнению с другими распространенными архиваторами). К неоспоримым преимуществам WinRAR относится также наличие специального улучшенного алгоритма сжатия. Благодаря этому, достигается оптимальное соотношение между скоростью работы и коэффициентом сжатия при обработке мультимедийных файлов, объектных библиотек, исполняемых программ. Использование архиватора WinRAR позволяет создавать самораспаковывающиеся и многотомные архивы, восстановление поврежденных архивов, архивов, защищенных паролем и многое другое. Архиватор WinRAR поддерживает работу практически со всеми типами популярных сегодня архивов (7Z, ACE, ARJ, BZ2, CAB, GZ, JAR, LZH, TAR, UUE, Z и ISO), создание архивов типа RAR и ZIP. Умеет создавать самораспаковывающиеся архивы типа SFX. Положительным моментом является также автоматическое распознавание формата и выбор оптимального метода сжатия. При создании многотомных архивов,

размеры томов определяются не только автоматически, но и вручную. Это позволяет оптимальным образом использовать свободное место на носителе. Поддержка непрерывных архивов позволяет повысить степень сжатия на 10-50%. Благодаря удобному интерфейсу, программа является легкой в использовании. Она доступна не только на традиционных русском, английском, украинском, но и на других языках мира. Используя 128-битный алгоритм кодирования и технологии заверения сигнатур, WinRAR надежно защищает ваши архивы при работе с ними в сети Интернет. В дополнение к перечисленным выше преимуществам, WinRAR имеет дополнительные возможности управления готовыми архивами. Разработаны версии WinRAR для различных операционных платформ: Windows Vista, другие версии Windows (32-разрядные), Pocket PC, Linux, FreeBSD, Mac OS X, MS DOS и OS/2.

Скачать WinRAR очень просто. Абсолютно бесплатно предоставляется демонстрационная версия shareware, которую вы можете использовать в течение 40 дней. Как только вы убедитесь в удобстве пользования программой, можно скачать WinRAR в лицензионной версии. Следует отметить, что лицензия WinRAR действительна для всех языков и операционных платформ. После регистрации все последующие обновления WinRAR доступны пользователю абсолютно бесплатно.

Скачать программу WinRar можно с сайтов: www.rarlab.com, www.win-rar.com, www.winrar-rus.com.

Архиватор WinZip

Архиватор WinZip является одной из первых доступных программ-архиваторов для Windows, имеющих собственный графический интерфейс. Это файловый архиватор и компрессор для Microsoft Windows от компании Corel. Первоначально архиватор формата Zip (PKZIP) был создан для MS-DOS в 1989 году. Уже в 1990 году появился WinZip, как графический коммерческий интерфейс для PKZIP. На сегодняшний день архиватор WinZip уверенно входит в тройку самых распространенных архиваторов. Помимо форматов Zip и RAR, программа работает с форматами CAB, UUencode, XXencode, TAR, gzip, BinHex, MIME.. Поддерживает декомпрессию файлов bz2, rar, iso, img, 7-zip. Кроме этого, с помощью внешних программ, WinZip может работать с файлами ARJ, LZH и ARC. Основным форматом является PKZIP. Архиватор WinZip позволяет создавать самораспаковывающиеся архивы, архивы с паролями, архивы с комментариями. Современные версии WinZip имеют встроенное средство просмотра изображений, что позволяет просматривать несколько изображений в Zip – файле. Среди дополнительных возможностей последних версий WinZip, следует отметить возможность прямой записи архивов на CD / DVD, автоматизацию резервного копирования, поддержку протокола FTP, отправку ZIP архивов по электронной почте, поддержку уникода. Для удобства использования многие операции в WinZip выполняются через пошаговые мастера.

Программа WinZip поддерживает также возможность добавления новых кнопок в главное меню. Следует отметить также развернутую поддержку функции печати перечня содержимого архива. Архиватор WinZip также поддерживает одновременную работу нескольких пользователей – например, при длительном выполнении какой-либо операции. Это реализуется при помощи функции быстрого переключения пользователя. Как разработанная под ОС Windows программа-архиватор, WinZip просто, легко и органично вписывается в интерфейс Windows. К плюсам WinZip относятся высокая скорость компрессии и декомпрессии файлов вместе с высокой степенью сжатия файлов. Среди минусов программы WinZip следует отметить невозможность создания электронной подписи (сигнатуры), невозможность добавления информации для восстановления. Кроме того, периодически возникают проблемы при работе с архивами, созданными WinRAR. Скачать WinZip, как и большинство архиваторов, можно в виде бесплатной пробной версии и полной лицензионной программы. Для бесплатного использования программа доступна в течение трех недель.

Скачать программу WinZip можно с сайта: www.winrar-rus.com.

Архиватор 7-Zip

Программа 7-Zip — это бесплатный архиватор, главным преимуществом которого является его собственный алгоритм LZMA, сжимающий файлы в формат 7Z. От аналогичных WinZip и WinRAR он отличается более низкой скоростью работы, что, однако, с легкостью компенсируется гораздо более высокой степенью компрессии. Поэтому 7-Zip наиболее подходит для работы с большими файлами, преимущество 7-Zip перед более быстрыми конкурентами может доходить до 30% и более. К сожалению, довольно примитивный интерфейс и отсутствие некоторых полезных функций не позволяют этой хорошей, в общем-то, программе стать достойным соперником WinRAR и WinZip в борьбе за внимание и любовь пользователей. Зато эта программа бесплатна, 7-Zip это программное обеспечение с открытым исходным кодом, и ваша совесть остается чистой перед разработчиками. Основные характеристики 7-Zip: Высокая степень сжатия в новом формате 7z с компрессией LZMA Поддерживаемые форматы: - Упаковка / распаковка: 7z, ZIP, GZIP, BZIP2 и ТАР - Только распаковка: ARJ, CAB, CHM, CPIO, DEB, DMG, HFS, ISO, LZH, LZMA, MSI, NSIS, RAR, RPM, UDF, WIM, XAR и Z.

-Для ZIP и GZIP форматов, 7-Zip обеспечивает коэффициент сжатия на 2-10% выше, чем коэффициент, представленная PKZip и WinZip -Мощьное AES-256 шифрование в 7z и ZIP форматах -Возможно создание самораспаковывающихся архивов для 7z формата Интеграция с Windows Shell- Мощный файловый менеджер- Мощная версия для командной строки- Плагин для FAR Manager-Локализации для 74 Языков

Скачать программу 7-Zip можно с сайтов: 7-zip.org.ua, www.winrar-rus.com.

Архиватор ARJ

Программа ARJ (разработчик - Robert K. Jung) относится к числу наиболее известных продуктов своего класса. Она выполняет все функции по обслуживанию своих, архивов, может помещать файлы в архив, извлекать файлы из архива, и делать «саморизвлекающиеся» файлы и так далее.ARJ. Работает из командной строки. Выполняет все функции по обслуживанию архивов .arj , в т.ч. поддержку многотомных архивов. Arj имеет очень большое число ключей. Получить справку по ключам архиватора arj можно с помощью команд: arj(обычная справка)arj /?(подробная справка)Можно автоматизировать много действий - создание резервной копии диска, архивирование начиная с какой-то даты, добавление к имени архива текущей даты (arh970821.arj), архивирование файла с конкретного места, несколько уровней сжатия и так далее. В версии 2.55 возможна работа с длинными именами. Недостатки: отсутствие диалогового режима, некоторое неудобство работы при наличии какого-то ключа в переменной окружения (ARJ_SW) и строке запуска - взаимное уничтожение.

В результате сжатия информация В результате сжатия информация представляется в новом видепредставляется в новом виде

Как иллюстрацию рассмотрим пример одного из способов сжатия,

допустим, есть такая строчка: «ААААААБББББВВВВВВВВВВГГГГГГ».

Её длина — 28 символов. Но в ней очень много повторяющихся

одинаковых символов, поэтому можно просто записать количество

повторении и сам повторяющийся символ, в результате получится

следующее: «7А5Б10В6Г». Строчка стала занимать всего 9 символов, то

есть сократилась более чем в три раза!

Разумеется, такой метод сжатия будет работать не для всех данных.

Например, возьмём такую строчку: «АБВБГАБ ГВАВГВАТ». длина

этой строчки — 15. символов. Если мы применим к ней тот же метод,

то её длина увеличится вдвое:

«1А1Б1В1Б1Г1 А1Б1Г1В1А1В1Г1Б1А1Г».

Отсюда следует важный вывод: один и тот же алгоритм сжатия для

одних исходных данных сокращает их размер, а для других может и

увеличить.

Алгоритмов сжатия данных существует великое множество. Хорошо сжимаются

текстовые файлы (.txt,doc ,pas .раз и др.). Если файл содержит текст, написанный на

естественном языке ,например, повесть или рассказ, то коэффициент сжатия будет

равен двум-трём, а если в файле записан текст программы ,то коэффициент сжатия

достигает пяти и выше!!!

В отношении звука (waw , .au) использование универсальных методов сжатия

редко даёт аналогичные результаты -— звуковой файл сокращается всего на 20—40

%. То же самое касается и высококачественных изображений, имеющих много

деталей. Плохо архивируются либо вообще увеличиваются в размере файлы,

данные в которых уже сжаты, в том числе архивы ( WinRaR, ‚ WinZip, ArJ и др.),

графические файлы тех форматов, которые имеют собственное сжатие (. Dij, jpg и

др.), аудиофайлы (mP3), видеофайлы (.mpg, .png и др.), самораспаковывающиеся

архивы (.exe).

ТЕКСТОВЫЙ ФАЙЛТЕКСТОВЫЙ ФАЙЛ

До сжатия:

Я, ты, он, она – вместе дружная семья!

После сжатия:

Я, тыона-вмесдружь!

38 символов38 символов

19 символов19 символов

ГРАФИЧЕСКИЙ ФАЙЛГРАФИЧЕСКИЙ ФАЙЛ

До сжатия: После сжатия:

ФОТОФОТО

Сжимаются очень незначительно т.к. областей, состоящих из точек одного и того же цвета очень очень мало.мало.

Увеличив изображение в сотни раз, можно увидеть, что располагающиеся рядом пиксели хоть незначительно, но отличаются друг от друга.

Методы сжатия. Сжатие с потерями

При сжатии с потерями часть информации утрачивается, но это остается незаметным для человека.

Например: При сжатии видеозаписей быстродвижущихся объектов,

можно пренебречь мелкими деталями; При сжатии звука — тихими звуками на фоне громких; При сжатии графики — заменить цвет соседних пикселей

на близкий по значению.

Методы сжатия. Сжатие без потерь

Для сжатия информации без потерь используются различные методы сжатия: Метод Хаффмана; Метод LZW; Метод RLE.

Алгоритм Хаффмана

Алгоритм Хаффмана (Huffman) — «жадный» алгоритм, был разработан в 1952 году доктором Массачусетского технологического института Дэвидом Хаффманом.

Метод Хаффмана учитывает вероятность появления объектов и кодирует их кодами различной длины.

Например, в русском алфавите буквыО, Е, А встречаются часто, Ф, Ц, Щ, Э — редко. Чем чаще встречается буква, тем короче используется для нее код. Такой принцип кодирования применяется в азбуке Морзе:

Е • А • – Э • • – • •

Алгоритм Лемпеля-Зива-Велча

Алгоритм LZW (Lempel, Ziv, Welch) изобрели в 1977 году математики

Абрахам Лемпел и Якоб Зив, а в 1984 году его доработал Терри Велч.

Этот метод является методом «скользящего окна». Алгоритм кодирует

цепочки символов (узоры), помещая их в таблицу и заменяя более

коротким кодом. Если такая цепочка встретится вновь, то в выходной

файл будет помещена не сама цепочка, а ее более короткий код.

Алгоритм RLE

RLE (Run Length Encoding) — кодирование длин серий: серия повторяющихся байтов заменяется на один повторяющийся байт и счетчик числа повторений.

6 3

0000001110000 061304

АБВГДЕЁЖЗИ ?

LOGO

Архиватор WinRAR

Возможности WinRAR

Полная поддержка архивов форматов RAR и ZIP; Оригинальный высокоэффективный алгоритм сжатия данных; Распаковка файлов форматов CAB, ARJ, LZH, TAR, GZ, ACE, UUE, BZ2,

JAR, ISO, 7Z, Z; Создание самораспаковывающихся, непрерывных и многотомных

архивов; Добавление в архивы дополнительной информации для восстановления

архива в случае его повреждения; Возможность защиты архива паролем.

Самораспаковывающийся архив

Самораспаковывающийся архив (SFX — self-extracting archive) — файл с расширением *.exe, объединяющий в себе архив и исполняемый код для его распаковки.

Такие архивы, в отличие от обычных, не требуют отдельной программы для извлечения файлов из архива, но имеют больший размер.

Использование самораспаковывающихся архивов удобно, когда неизвестно, есть ли у пользователя, которому передаётсяархив, соответствующая программа распаковки.

Непрерывный архив

Непрерывный архив — архив, упакованный таким образом, при котором все сжимаемые файлы рассматриваются как один непрерывный поток данных.

Недостатком непрерывного архива является более медленное добавление или удаление файлов, чем при работе с обычными архивами.

Существенное увеличение степени сжатия. Причем чем меньше средний размер файлов, больше самих файлов и больше похожих друг на друга файлов, тем больше степень сжатия.

преимущества непрерывного

архива

недостаткинепрерывного

архива

Многотомный архив

Многотомный архив — архив, разбитый на несколько частей (томов).

Необходимость разбить архив на тома возникает, например, при использовании дискет, если после сжатия размер архива превышает размер одной дискеты.

Возможность работы с многотомными архивами может пригодится при работе с электронной почтой, когда почтовая программа позволяет прикрепить для отправки только один файл или почтовый сервер позволяет присоединять к письму файл ограниченного размера.

PHOTO.part01.rar

PHOTO.part02.rar

Создание архива с помощью контекстного меню

Давайте рассмотрим как создать архив с помощью контекстного меню. Выбрать документ, который вы бы хотели заархивировать. Нажать по документу правой клавишей мыши для вызова контекстного меню. Добавить в архив… позволяет добавить файлы в архив, указав месторасположение, название, формат архива, метод сжатия и параметры архивации.Добавить в архив <имя файла>.rar создаст архив с тем же именем, что и файл или папка и настройками по умолчанию.

Шаг 1

Так же архиватор можно открыть таким путём: Пуск- Все программы-WinRAR.Когда окно программы откроется выбираем документ или документы, которые необходимо заархивировать, выделяем их и нажимаем кнопку Добавить

Шаг 2

Выбираем формат архива на выбор

Шаг 3

Идёт создание архива ждите

Архивный файл удобен при хранении, копировании и перемещении файлов. Однако в сжатом виде информация представлена так, что текст не прочитать, рисунок не просмотреть, поэтому для работы с информацией требуется ее обратное преобразование – РАЗАРХИВАЦИЯ.РАЗАРХИВАЦИЯ.

Разархивация (распаковка) – восстановление файлов из архивного файла в том виде, какой они имели до помещения в архив.

Извлечение файлов из архива с помощью контекстного меню

Извлечь файлы… позволяет указать путь для извлечения.

Извлечь в текущую папку извлечет файлы из архива в текущую папку.

Извлечь в <имя папки> создаст папку с именем архива и поместит туда извлеченные файлы.

Шаг 1

При открытии архива в окне WinRAR выводится его содержимое. Выделите файлы и папки, которые вы хотите извлечь. Это можно сделать клавишами управления курсором или левой кнопкой мыши при нажатой клавише (как в Проводнике и других Windows-программах). Выделять файлы в WinRAR можно также клавишами <Пробел> и . Клавиши <+> и <-> на цифровой клавиатуре позволяют выделять и снимать выделение с группы файлов с помощью шаблонов.

Шаг 2

Выделив один или несколько файлов, нажмите кнопку "Извлечь..." вверху окна WinRAR, или же нажмите <Alt+E>,

Шаг 3

Введите в появившемся диалоговом окне нужный путь, после чего нажмите кнопку OK. Здесь же можно поменять несколько дополнительных параметров.

Шаг 4

Во время извлечения отображается окно со статистикой. Если вы хотите прервать извлечение, нажмите кнопку "Отмена". Окно WinRAR можно минимизировать в область уведомлений панели задач: для этого нажмите кнопку "Фоновый режим". Если извлечение закончится без ошибок, то WinRAR вернётся в оболочку, в противном случае появится окно диагностических сообщений.

А сейчас ответьте на вопросы:

Почему есть возможность уменьшать размер файлов? Что такое архивация? Какие файлы не имеет смысла архивировать? Почему перед пересылкой текстового файла по

электронной почте имеет смысл предварительно его упаковать в архив?

Материал подготовлен с использованием учебных пособий и ресурсов Интернет


Recommended