Анализ и оценка систем адресации данных в современных...

Preview:

Citation preview

Квалификационная работа

«Анализ и оценка систем адресации данных в современных ЭВМ»

Выполнил:студент 1 курса

группа НКСГерасимов С.В.

Концепция хранения

Взаимодополняющие технологии развития:

1. СОД (обработка данных)

2. СППР (принятие решений)

Сложившаяся ситуация: информации слишком много, но она не структурирована и как следствие недостоверна

Именно на разрешение этого противоречия - отсутствие информации при наличии и даже избытке - и нацелена концепция Хранилищ Данных (Data Warehouse)

Не менее известны и другие концепции: Information Warehouse, Data Mart, On-Line Analitical Processing (OLAP), Relational On-Line Analitical Processing (ROLAP)

Файловая система

Часть операционной системы, которая «отвечает» за корректное хранение данных и предоставление доступа к ним пользователю и прикладным программам

Порядок, определяющий способ организации, хранения и именования данных на носителях информации ИТ-оборудования

Система адресации данных является одной из самых существенных составных частей файловой системы. Именно система адресации позволяет находить нужный файл среди множества как пустых, так и занятых блоков на диске.

Задачи

1. именование файлов;

2. программный интерфейс работы с файлами для приложений;

3. отображения логической модели файловой системы на физическую организацию хранилища данных;

4. организация устойчивости файловой системы к сбоям питания, ошибкам аппаратных и программных средств;

5. содержание параметров файла, необходимых для правильного его взаимодействия с другими объектами системы (ядро, приложения и пр.).

Физическая структура

Сектор (sector) является наименьшей порцией данных, имеющей уникальный адрес на жестком диске

Каждый жесткий диск – это «слоеный пирог» из нескольких дисков, то совокупность дорожек, одинаково удаленных от центра на всех рабочих поверхностях дисков, образует так называемый цилиндр

Выбор ФС

Наиболее важные параметры при выборе файловой системы FAT, FAT32, NTFS 4.0 или NTFS 5.0.:

- нужно понять для чего будет использована ФС, будь то сервер или рабочая станция

- нужно учитывать количество дисков, требования к безопасности

Минимальный размер кластера FAT, NTFS

Кластер (Cluster) – это минимальный участок памяти на диске, который может быть выделен файловой системой при создании файла. Физически кластер представляет собой несколько смежных секторов, число которых должно быть равно степени 2 (то есть кластер может включать 1, 2, 4, 8, 16, 32 или даже 64 сектора)

Логическая конфигурация

Раздел (Partition) – это часть физического диска, которая после форматирования может использоваться файловой системой как отдельное устройство

Типы разделов:

Основной (загрузочный)

Дополнительный (расширенный) Создается с целью преодоления ограничений на количество основных разделов

Активный раздел – основной раздел, с которого производится загрузка ОС при включении компьютера

В начало сектора помещается так называемая главная загрузочная запись – Master Boot Record (MBR)

Физическая организация файла

непрерывное размещение (а);

связанный список кластеров (б);

FAT, связанный список индексов (в);

перечень номеров кластеров (г)

С каждым кластером диска связывается

некоторый элемент – индекс. При такой

физической организации сохраняются все

достоинства предыдущего способа:

минимальность адресной информации,

отсутствие фрагментации, отсутствие проблем

при изменении размера

FAT

Существует несколько разновидностей FAT,

отличающихся разрядностью индексных

указателей, которая и используется в

качестве условного обозначения: FAT12,

FAT16 и FAT32. В файловой системе FAT12

используются 12-разрядные указатели, что

позволяет поддерживать до 4096 кластеров

в области данных диска, в FAT16 - 16-

разрядные указатели для 65 536 кластеров и

в FAT32 - 32-разрядные для более чем 4

миллиардов кластеров.

Недостатки FAT

Используемый в FAT метод хранения адресной информации о файлах не

отличается большой надежностью - при разрыве списка индексных

указателей в одном месте, например из-за сбоя в работе программного

кода ОС по причине внешних электромагнитных помех, теряется

информация обо всех последующих кластерах файла.

Отличительные свойства NTFS

поддержка больших файлов (теоретически до 16 Терабайт) и

больших дисков (2^64 байт);

восстанавливаемость после сбоев и отказов программ и

аппаратуры управления дисками;

высокая скорость операций, в том числе и для больших

дисков;

низкий уровень фрагментации, в том числе и для больших

дисков;

гибкая структура, допускающая развитие за счет добавления

новых типов записей и атрибутов файлов с сохранением

совместимости с предыдущими версиями ФС;

устойчивость к отказам дисковых накопителей;

поддержка длинных символьных имен;

контроль доступа к каталогам и отдельным файлам.

Структура Inode

Создание ФС, база для теста

➔каталог с музыкальными файлами формата mp3, размером

от 10 до 27 Мбайт, суммарным объёмом 430

Мбайт;

➔avi-файл, сшитый из пяти серий фильма "Пункт назначения", объемом 3,4 Гбайт;

➔iso-образ компакт-диска (дистрибутив Xubuntu

12.10 Quantal), объёмом 1,4 Гбайт.

Алгоритм замера

$ cp file newfile

последовательно копировались (в пределах целевого устройства и его файловой системы) каталог с музыкальными файлами, дерево портежей, avi- и iso-файлы. Затем новобразованные копии столь же последовательно удалялись командой

$ rm -Rf newfile

Время каждой операции замерялось по выводу команды date перед её началом и после успешного завершения, по схеме

$ date && cp file newfile && date

Быстродействие LINUX

ext3, journal reiser, defaults XFS, defaults JFS, defaults ext2, defaults00:00

02:24

04:48

07:12

09:36

12:00

14:24

16:48

Анализ ext2,3 JFS, ReiserFS, XFS

В случае, не очень часто имеющих дело с очень большими файлами и файловыми системами, да к тому же владельцев ноутбука, ext2 — первый кандидат.

В качестве второго кандидата можно рассматривать ReiserFS — пожалуй что лидера по интегрированному быстродействию среди журналируемых файловых систем.

ext3 в режиме полного журналирования и JFS. Характерно при этом, что обе эти файловые системы считаются наиболее устойчивыми к сбоям.

JFS — похоже, более подходящим: всё-таки суммарно она оказывается несколько быстрее, нежели ext3 journal

XFS, напротив, будет плохим выбором для файловых систем, содержащих большое количество мелких и часто обновляемых файлов

Recommended