LOGO
Архивация данных
Слайд-лекция
Материал подготовлен с использованием учебных пособий и ресурсов Интернет
Избыточность
Редакторы, работающие с текстовой, графической, звуковой и другой информацией, кодируют ее наиболее естественным, но не самым экономичным способом.
Действительно, если внимательно посмотреть любой текст, то можно заметить, что такие буквы «а» и «о», встречаются в нем гораздо чаще чем «ю» и «у». То же самое можно отнести и к сочетаниям букв.
На рисунках цвета соседних точек в большинстве случаев близки по оттенку. Подобно этому в любой последовательности информации некоторые сочетания встречаются намного чаще других.
Все это приводит к тому, что в файлах, хранящих эту информацию, некоторые комбинации из 0 и 1 встречаются гораздо чаще, чем другие. В таких случаях говорят, что информация обладает избыточностью, и есть возможность перекодировать содержание файла, уменьшив его размер.
Для сжатия достаточно придерживаться правила: чем чаще встречается комбинация, тем более коротким сочетанием из 0 и 1 ее можно перекодировать. Разумеется, делать это должна программа.
Необходимость архивации данных
Архивирование редко используемой информации для освобождения места на диске;
Для переноса информации; При использовании электронной
почты; При пересылке данных в Сети.
Понятие архива
Архив (архивный файл) — файл, состоящий из одного или нескольких файлов, как правило, сжатых с помощью программы-архиватора.
Архив может состоять и из нескольких частей (томов), каждая из которых хранится как отдельный файл.
Основные действия при работе с архивами:
создание нового архива;добавление файлов в архив;просмотр содержимого архива;извлечение файлов из архива;просмотр файла в архиве;удаление файлов из архива.
Для архивации данных существуют специальные служебные программы-архиваторы, которые вместо нескольких файлов создают один - архивный
Понятие архиватора
Архиватор — программа (утилита), позволяющая создавать архивные файлы и
извлекать файлы из архивов.
Наиболее популярными программами-архиваторами являются:
На сегодняшний день программа WinRAR является признанным лидером среди архиваторов. Программа WinRAR позволяет работу с файлами практически неограниченного размера. По заявлению разработчиков, поддерживаются файлы размером до 8,5 млн терабайт. Несмотря на такие гигантские объемы информации, WinRAR способен достигать максимального коэффициента сжатия, при этом работая с высокой скоростью (по сравнению с другими распространенными архиваторами). К неоспоримым преимуществам WinRAR относится также наличие специального улучшенного алгоритма сжатия. Благодаря этому, достигается оптимальное соотношение между скоростью работы и коэффициентом сжатия при обработке мультимедийных файлов, объектных библиотек, исполняемых программ. Использование архиватора WinRAR позволяет создавать самораспаковывающиеся и многотомные архивы, восстановление поврежденных архивов, архивов, защищенных паролем и многое другое. Архиватор WinRAR поддерживает работу практически со всеми типами популярных сегодня архивов (7Z, ACE, ARJ, BZ2, CAB, GZ, JAR, LZH, TAR, UUE, Z и ISO), создание архивов типа RAR и ZIP. Умеет создавать самораспаковывающиеся архивы типа SFX. Положительным моментом является также автоматическое распознавание формата и выбор оптимального метода сжатия. При создании многотомных архивов,
размеры томов определяются не только автоматически, но и вручную. Это позволяет оптимальным образом использовать свободное место на носителе. Поддержка непрерывных архивов позволяет повысить степень сжатия на 10-50%. Благодаря удобному интерфейсу, программа является легкой в использовании. Она доступна не только на традиционных русском, английском, украинском, но и на других языках мира. Используя 128-битный алгоритм кодирования и технологии заверения сигнатур, WinRAR надежно защищает ваши архивы при работе с ними в сети Интернет. В дополнение к перечисленным выше преимуществам, WinRAR имеет дополнительные возможности управления готовыми архивами. Разработаны версии WinRAR для различных операционных платформ: Windows Vista, другие версии Windows (32-разрядные), Pocket PC, Linux, FreeBSD, Mac OS X, MS DOS и OS/2.
Скачать WinRAR очень просто. Абсолютно бесплатно предоставляется демонстрационная версия shareware, которую вы можете использовать в течение 40 дней. Как только вы убедитесь в удобстве пользования программой, можно скачать WinRAR в лицензионной версии. Следует отметить, что лицензия WinRAR действительна для всех языков и операционных платформ. После регистрации все последующие обновления WinRAR доступны пользователю абсолютно бесплатно.
Скачать программу WinRar можно с сайтов: www.rarlab.com, www.win-rar.com, www.winrar-rus.com.
Архиватор WinZip
Архиватор WinZip является одной из первых доступных программ-архиваторов для Windows, имеющих собственный графический интерфейс. Это файловый архиватор и компрессор для Microsoft Windows от компании Corel. Первоначально архиватор формата Zip (PKZIP) был создан для MS-DOS в 1989 году. Уже в 1990 году появился WinZip, как графический коммерческий интерфейс для PKZIP. На сегодняшний день архиватор WinZip уверенно входит в тройку самых распространенных архиваторов. Помимо форматов Zip и RAR, программа работает с форматами CAB, UUencode, XXencode, TAR, gzip, BinHex, MIME.. Поддерживает декомпрессию файлов bz2, rar, iso, img, 7-zip. Кроме этого, с помощью внешних программ, WinZip может работать с файлами ARJ, LZH и ARC. Основным форматом является PKZIP. Архиватор WinZip позволяет создавать самораспаковывающиеся архивы, архивы с паролями, архивы с комментариями. Современные версии WinZip имеют встроенное средство просмотра изображений, что позволяет просматривать несколько изображений в Zip – файле. Среди дополнительных возможностей последних версий WinZip, следует отметить возможность прямой записи архивов на CD / DVD, автоматизацию резервного копирования, поддержку протокола FTP, отправку ZIP архивов по электронной почте, поддержку уникода. Для удобства использования многие операции в WinZip выполняются через пошаговые мастера.
Программа WinZip поддерживает также возможность добавления новых кнопок в главное меню. Следует отметить также развернутую поддержку функции печати перечня содержимого архива. Архиватор WinZip также поддерживает одновременную работу нескольких пользователей – например, при длительном выполнении какой-либо операции. Это реализуется при помощи функции быстрого переключения пользователя. Как разработанная под ОС Windows программа-архиватор, WinZip просто, легко и органично вписывается в интерфейс Windows. К плюсам WinZip относятся высокая скорость компрессии и декомпрессии файлов вместе с высокой степенью сжатия файлов. Среди минусов программы WinZip следует отметить невозможность создания электронной подписи (сигнатуры), невозможность добавления информации для восстановления. Кроме того, периодически возникают проблемы при работе с архивами, созданными WinRAR. Скачать WinZip, как и большинство архиваторов, можно в виде бесплатной пробной версии и полной лицензионной программы. Для бесплатного использования программа доступна в течение трех недель.
Скачать программу WinZip можно с сайта: www.winrar-rus.com.
Архиватор 7-Zip
Программа 7-Zip — это бесплатный архиватор, главным преимуществом которого является его собственный алгоритм LZMA, сжимающий файлы в формат 7Z. От аналогичных WinZip и WinRAR он отличается более низкой скоростью работы, что, однако, с легкостью компенсируется гораздо более высокой степенью компрессии. Поэтому 7-Zip наиболее подходит для работы с большими файлами, преимущество 7-Zip перед более быстрыми конкурентами может доходить до 30% и более. К сожалению, довольно примитивный интерфейс и отсутствие некоторых полезных функций не позволяют этой хорошей, в общем-то, программе стать достойным соперником WinRAR и WinZip в борьбе за внимание и любовь пользователей. Зато эта программа бесплатна, 7-Zip это программное обеспечение с открытым исходным кодом, и ваша совесть остается чистой перед разработчиками. Основные характеристики 7-Zip: Высокая степень сжатия в новом формате 7z с компрессией LZMA Поддерживаемые форматы: - Упаковка / распаковка: 7z, ZIP, GZIP, BZIP2 и ТАР - Только распаковка: ARJ, CAB, CHM, CPIO, DEB, DMG, HFS, ISO, LZH, LZMA, MSI, NSIS, RAR, RPM, UDF, WIM, XAR и Z.
-Для ZIP и GZIP форматов, 7-Zip обеспечивает коэффициент сжатия на 2-10% выше, чем коэффициент, представленная PKZip и WinZip -Мощьное AES-256 шифрование в 7z и ZIP форматах -Возможно создание самораспаковывающихся архивов для 7z формата Интеграция с Windows Shell- Мощный файловый менеджер- Мощная версия для командной строки- Плагин для FAR Manager-Локализации для 74 Языков
Скачать программу 7-Zip можно с сайтов: 7-zip.org.ua, www.winrar-rus.com.
Архиватор ARJ
Программа ARJ (разработчик - Robert K. Jung) относится к числу наиболее известных продуктов своего класса. Она выполняет все функции по обслуживанию своих, архивов, может помещать файлы в архив, извлекать файлы из архива, и делать «саморизвлекающиеся» файлы и так далее.ARJ. Работает из командной строки. Выполняет все функции по обслуживанию архивов .arj , в т.ч. поддержку многотомных архивов. Arj имеет очень большое число ключей. Получить справку по ключам архиватора arj можно с помощью команд: arj(обычная справка)arj /?(подробная справка)Можно автоматизировать много действий - создание резервной копии диска, архивирование начиная с какой-то даты, добавление к имени архива текущей даты (arh970821.arj), архивирование файла с конкретного места, несколько уровней сжатия и так далее. В версии 2.55 возможна работа с длинными именами. Недостатки: отсутствие диалогового режима, некоторое неудобство работы при наличии какого-то ключа в переменной окружения (ARJ_SW) и строке запуска - взаимное уничтожение.
В результате сжатия информация В результате сжатия информация представляется в новом видепредставляется в новом виде
Как иллюстрацию рассмотрим пример одного из способов сжатия,
допустим, есть такая строчка: «ААААААБББББВВВВВВВВВВГГГГГГ».
Её длина — 28 символов. Но в ней очень много повторяющихся
одинаковых символов, поэтому можно просто записать количество
повторении и сам повторяющийся символ, в результате получится
следующее: «7А5Б10В6Г». Строчка стала занимать всего 9 символов, то
есть сократилась более чем в три раза!
Разумеется, такой метод сжатия будет работать не для всех данных.
Например, возьмём такую строчку: «АБВБГАБ ГВАВГВАТ». длина
этой строчки — 15. символов. Если мы применим к ней тот же метод,
то её длина увеличится вдвое:
«1А1Б1В1Б1Г1 А1Б1Г1В1А1В1Г1Б1А1Г».
Отсюда следует важный вывод: один и тот же алгоритм сжатия для
одних исходных данных сокращает их размер, а для других может и
увеличить.
Алгоритмов сжатия данных существует великое множество. Хорошо сжимаются
текстовые файлы (.txt,doc ,pas .раз и др.). Если файл содержит текст, написанный на
естественном языке ,например, повесть или рассказ, то коэффициент сжатия будет
равен двум-трём, а если в файле записан текст программы ,то коэффициент сжатия
достигает пяти и выше!!!
В отношении звука (waw , .au) использование универсальных методов сжатия
редко даёт аналогичные результаты -— звуковой файл сокращается всего на 20—40
%. То же самое касается и высококачественных изображений, имеющих много
деталей. Плохо архивируются либо вообще увеличиваются в размере файлы,
данные в которых уже сжаты, в том числе архивы ( WinRaR, ‚ WinZip, ArJ и др.),
графические файлы тех форматов, которые имеют собственное сжатие (. Dij, jpg и
др.), аудиофайлы (mP3), видеофайлы (.mpg, .png и др.), самораспаковывающиеся
архивы (.exe).
ТЕКСТОВЫЙ ФАЙЛТЕКСТОВЫЙ ФАЙЛ
До сжатия:
Я, ты, он, она – вместе дружная семья!
После сжатия:
Я, тыона-вмесдружь!
38 символов38 символов
19 символов19 символов
ФОТОФОТО
Сжимаются очень незначительно т.к. областей, состоящих из точек одного и того же цвета очень очень мало.мало.
Увеличив изображение в сотни раз, можно увидеть, что располагающиеся рядом пиксели хоть незначительно, но отличаются друг от друга.
Методы сжатия. Сжатие с потерями
При сжатии с потерями часть информации утрачивается, но это остается незаметным для человека.
Например: При сжатии видеозаписей быстродвижущихся объектов,
можно пренебречь мелкими деталями; При сжатии звука — тихими звуками на фоне громких; При сжатии графики — заменить цвет соседних пикселей
на близкий по значению.
Методы сжатия. Сжатие без потерь
Для сжатия информации без потерь используются различные методы сжатия: Метод Хаффмана; Метод LZW; Метод RLE.
Алгоритм Хаффмана
Алгоритм Хаффмана (Huffman) — «жадный» алгоритм, был разработан в 1952 году доктором Массачусетского технологического института Дэвидом Хаффманом.
Метод Хаффмана учитывает вероятность появления объектов и кодирует их кодами различной длины.
Например, в русском алфавите буквыО, Е, А встречаются часто, Ф, Ц, Щ, Э — редко. Чем чаще встречается буква, тем короче используется для нее код. Такой принцип кодирования применяется в азбуке Морзе:
Е • А • – Э • • – • •
Алгоритм Лемпеля-Зива-Велча
Алгоритм LZW (Lempel, Ziv, Welch) изобрели в 1977 году математики
Абрахам Лемпел и Якоб Зив, а в 1984 году его доработал Терри Велч.
Этот метод является методом «скользящего окна». Алгоритм кодирует
цепочки символов (узоры), помещая их в таблицу и заменяя более
коротким кодом. Если такая цепочка встретится вновь, то в выходной
файл будет помещена не сама цепочка, а ее более короткий код.
Алгоритм RLE
RLE (Run Length Encoding) — кодирование длин серий: серия повторяющихся байтов заменяется на один повторяющийся байт и счетчик числа повторений.
6 3
0000001110000 061304
АБВГДЕЁЖЗИ ?
Возможности WinRAR
Полная поддержка архивов форматов RAR и ZIP; Оригинальный высокоэффективный алгоритм сжатия данных; Распаковка файлов форматов CAB, ARJ, LZH, TAR, GZ, ACE, UUE, BZ2,
JAR, ISO, 7Z, Z; Создание самораспаковывающихся, непрерывных и многотомных
архивов; Добавление в архивы дополнительной информации для восстановления
архива в случае его повреждения; Возможность защиты архива паролем.
Самораспаковывающийся архив
Самораспаковывающийся архив (SFX — self-extracting archive) — файл с расширением *.exe, объединяющий в себе архив и исполняемый код для его распаковки.
Такие архивы, в отличие от обычных, не требуют отдельной программы для извлечения файлов из архива, но имеют больший размер.
Использование самораспаковывающихся архивов удобно, когда неизвестно, есть ли у пользователя, которому передаётсяархив, соответствующая программа распаковки.
Непрерывный архив
Непрерывный архив — архив, упакованный таким образом, при котором все сжимаемые файлы рассматриваются как один непрерывный поток данных.
Недостатком непрерывного архива является более медленное добавление или удаление файлов, чем при работе с обычными архивами.
Существенное увеличение степени сжатия. Причем чем меньше средний размер файлов, больше самих файлов и больше похожих друг на друга файлов, тем больше степень сжатия.
преимущества непрерывного
архива
недостаткинепрерывного
архива
Многотомный архив
Многотомный архив — архив, разбитый на несколько частей (томов).
Необходимость разбить архив на тома возникает, например, при использовании дискет, если после сжатия размер архива превышает размер одной дискеты.
Возможность работы с многотомными архивами может пригодится при работе с электронной почтой, когда почтовая программа позволяет прикрепить для отправки только один файл или почтовый сервер позволяет присоединять к письму файл ограниченного размера.
PHOTO.part01.rar
PHOTO.part02.rar
Создание архива с помощью контекстного меню
Давайте рассмотрим как создать архив с помощью контекстного меню. Выбрать документ, который вы бы хотели заархивировать. Нажать по документу правой клавишей мыши для вызова контекстного меню. Добавить в архив… позволяет добавить файлы в архив, указав месторасположение, название, формат архива, метод сжатия и параметры архивации.Добавить в архив <имя файла>.rar создаст архив с тем же именем, что и файл или папка и настройками по умолчанию.
Шаг 1
Так же архиватор можно открыть таким путём: Пуск- Все программы-WinRAR.Когда окно программы откроется выбираем документ или документы, которые необходимо заархивировать, выделяем их и нажимаем кнопку Добавить
Архивный файл удобен при хранении, копировании и перемещении файлов. Однако в сжатом виде информация представлена так, что текст не прочитать, рисунок не просмотреть, поэтому для работы с информацией требуется ее обратное преобразование – РАЗАРХИВАЦИЯ.РАЗАРХИВАЦИЯ.
Разархивация (распаковка) – восстановление файлов из архивного файла в том виде, какой они имели до помещения в архив.
Извлечение файлов из архива с помощью контекстного меню
Извлечь файлы… позволяет указать путь для извлечения.
Извлечь в текущую папку извлечет файлы из архива в текущую папку.
Извлечь в <имя папки> создаст папку с именем архива и поместит туда извлеченные файлы.
Шаг 1
При открытии архива в окне WinRAR выводится его содержимое. Выделите файлы и папки, которые вы хотите извлечь. Это можно сделать клавишами управления курсором или левой кнопкой мыши при нажатой клавише (как в Проводнике и других Windows-программах). Выделять файлы в WinRAR можно также клавишами <Пробел> и . Клавиши <+> и <-> на цифровой клавиатуре позволяют выделять и снимать выделение с группы файлов с помощью шаблонов.
Шаг 2
Выделив один или несколько файлов, нажмите кнопку "Извлечь..." вверху окна WinRAR, или же нажмите <Alt+E>,
Шаг 3
Введите в появившемся диалоговом окне нужный путь, после чего нажмите кнопку OK. Здесь же можно поменять несколько дополнительных параметров.
Шаг 4
Во время извлечения отображается окно со статистикой. Если вы хотите прервать извлечение, нажмите кнопку "Отмена". Окно WinRAR можно минимизировать в область уведомлений панели задач: для этого нажмите кнопку "Фоновый режим". Если извлечение закончится без ошибок, то WinRAR вернётся в оболочку, в противном случае появится окно диагностических сообщений.
А сейчас ответьте на вопросы:
Почему есть возможность уменьшать размер файлов? Что такое архивация? Какие файлы не имеет смысла архивировать? Почему перед пересылкой текстового файла по
электронной почте имеет смысл предварительно его упаковать в архив?
Материал подготовлен с использованием учебных пособий и ресурсов Интернет