20
ДЕДУПЛИКАЦИЮ В КАЖДЫЙ ЦОД! Дмитрий Дощаный ДИРЕКТОР ЦЕНТРА РЕШЕНИЙ КРОК НА БАЗЕ ТЕХНОЛОГИЙ ЕМС

Дедупликацию в каждый ЦОД

  • View
    77

  • Download
    3

Embed Size (px)

Citation preview

Page 1: Дедупликацию в каждый ЦОД

ДЕДУПЛИКАЦИЮ – В КАЖДЫЙ ЦОД!

Дмитрий ДощаныйДИРЕКТОР ЦЕНТРА РЕШЕНИЙ КРОК НА БАЗЕ ТЕХНОЛОГИЙ ЕМС

Page 2: Дедупликацию в каждый ЦОД

РОСТ ДАННЫХ – ЧЕГО ОЖИДАТЬ?С 2009 по 2020. . .

2009 2020

Объем информации вырастет в 44 раза

Количество контейнеров информации — файлов, архивов, изображений —(то, что надо хранить, чем управлять и что защищать, вырастет в 67 раз)

Но количество ИТ-специалистов в мире вырастет всего в 1,4 раза

Источник: IDC Digital Universe Study, sponsored by EMC, May 2010

Page 3: Дедупликацию в каждый ЦОД

ПРИНЦИП ДЕДУПЛИКАЦИИ ДАННЫХ

Page 4: Дедупликацию в каждый ЦОД

ГДЕ МОЖНО ПРИМЕНИТЬ ДЕДУПЛИКАЦИЮ?

• Продуктивные системы

• Архивные системы

• Системы резервного копирования

Поддерживается небольшим числом СХД, чаще всего совместно со сжатием

Реальная экономия 20-30% пространства

Ограниченная функциональность

Сравнение по имени/размеру объекта

Сотни процентов экономии пространства

Зрелая технология Простота внедрения

Page 5: Дедупликацию в каждый ЦОД

РЕЗЕРВНОЕ КОПИРОВАНИЕ В БОЛЬШИНСТВЕ КОМПАНИЙ

• Копирование всех данных на ленту• Отправка лент в хранилище [?]• В неделю копируется до 200% объема данных (часто больше)• Скорость резервного копирования редко кого устраивает• Скорость восстановления непредсказуема и зачастую намного меньше

планируемой• Риск потери данных из-за старения лент• Риск утери лент при транспортировке/

хранении

5

Page 6: Дедупликацию в каждый ЦОД

ОБЫЧНЫЙ ПУТЬ ЭВОЛЮЦИИ БЭКАПА– КОПИРОВАНИЕ НА ДИСК

• Дисковые системы быстрее..(Особенно при восстановлении)

• Дисковые системы надежнее..(RAID, Кэш с батарейкой, дублированиекомпонентов и т.п.)

• Дисковые системы проще в управлении..• Дисковые системы проще и безопаснее

при развертывании удаленного хранилища резервных копий..

• Дисковые системы сильно подешевелиза последние несколько лет..

Page 7: Дедупликацию в каждый ЦОД

НО ХРАНЕНИЕ НА ДИСКЕ ВСЕХ КОПИЙ ЭТО СЛИШКОМ ДОРОГО

Продуктивныеданные1x

Резервныекопии8x-20x

Page 8: Дедупликацию в каждый ЦОД

КЛЮЧ К ЭФФЕКТИВНОМУ ХРАНЕНИЮ –ДЕДУПЛИКАЦИЯ ДАННЫХФакты:“Развертывание систем с дедупликацией прогрессирует необычно быстро для достаточно новой технологии.”

Влияние на рынок:“Gartner рассматривает эту технологию как революционную, потому что она радикально снижает стоимость резервного копирования и восстановления с использованием дисков...”“…игнорировать ее невозможно.”

Рекомендации: “…убедитесь, что вашу организациюустраивает надежность и зрелостьпредлагаемого вендором решения.”

Source: Dave Russell, Gartner.

“К 2012 г. дедупликация будет использоваться в75% всех СРК.”

[...так говорит Gartner]

Page 9: Дедупликацию в каждый ЦОД

КАК РАБОТАЕТ ДЕДУПЛИКАЦИЯ?

Алгоритм:• Разбиение потока данных на блоки постоянной/переменной

длины• Вычисление сигнатуры (хэша) для каждого блока• Сохранение только уникальных блоков в сжатом виде

Результат: возможность упаковать 10 TB резервных копий в 1 TB дискового пространства = снижение стоимости хранения, возможен отказ от лент, эффективная репликация и т.п.

Page 10: Дедупликацию в каждый ЦОД

ПОДХОДЫ К АЛГОРИТМАМ ДЕДУПЛИКАЦИИ• Блоки фиксированной длины :

• Блоки переменной длины (средний размер блока: 8-12 КБ) :

Компан ия VMware - в едущи й поставщ ик си стем вир туализа ции ..

Компан ия Micros oft – в едущи й поставщ ик си стем вир туализа ции..

Компания Microsoft - ведущий п оставщик систем ви ртуализац ии..

Компания VMware - в едущий по ставщик с истем вир туализаци и ..

Избыточные данные

Page 11: Дедупликацию в каждый ЦОД

Даже относительно небольшая степень дедупликации дает приличную экономию..

De-dupe Ratio

Экономияобъема

1:1 0%2:1 50%3:1 67%4:1 75%5:1 80%6:1 83%7:1 86%8:1 87%9:1 89%

10:1 90%50:1 98%

100:1 99%

4:1

75%

De-dupe

TraditionalBackup(1 Month retention)

10:1

90%

De-dupe

TraditionalBackup(4 Month retention)

СКОЛЬКО МОЖНО ВЫИГРАТЬ?

Page 12: Дедупликацию в каждый ЦОД

КЛАССЫ ДЕДУПЛИКАЦИИ

• На клиенте• На медиа-сервере• На целевом устройстве

Page 13: Дедупликацию в каждый ЦОД

ДЕДУПЛИКАЦИЯ НА КЛИЕНТЕДедупликация

на клиенте системы РК

Дедупликацияспециализированным

клиентом

Media Server

Дедупликация на аппаратном уровне

Клиент ПО резервного

копирования

Специализированное хранилище дедуп-данных

Дедупликация

Дисковое пространство для хранения дедуп-данных

+ Сокращение трафика в сети

+ Сокращение времени резервного копирования

+ Скорость восстановления –десятки МБ/с

- Требует перенастройки/замены существующей системы СРК

- Плохо подходит для больших СУБД

- Нагружает продуктивный сервер

Page 14: Дедупликацию в каждый ЦОД

ДЕДУПЛИКАЦИЯ НА МЕДИА-СЕРВЕРЕ

Специализированное хранилище дедуп-данных(например, PureDisk)

Дедупликация Media Server

Дисковое пространство для хранения дедуп-данных

Дедупликация на аппаратном уровне

Клиент ПО резервного

копирования

+ Некоторое сокращение трафика в сети

+ Сокращение времени резервного копирования

+ Не нагружает продуктивный сервер

- Требует перенастройки/замены существующей системы СРК

- Плохо подходит для больших СУБД

Page 15: Дедупликацию в каждый ЦОД

TARGET-ДЕДУПЛИКАЦИЯ

Дедупликация на аппаратном уровне

Клиент ПО резервного

копирования

Media Server

Дедупликация

+ Просто интегрируется в любую существующую СРК (VTL)

+ Скорость РК/восстановления –сотни мегабайт/с

+ Не нагружает продуктивный сервер

- Не сокращает трафик в сети

- Стоимость выше чем у первых двух вариантов

Page 16: Дедупликацию в каждый ЦОД

ДЕДУПЛИКАЦИЯ НА ЦЕЛЕВОМ УСТРОЙСТВЕ. ВАЖНО:• Дедупликация: inline или post-processing• Производительность: быстрый CPU или много дисков• Интеграция: протоколы, типы данных, ПО резервного

копирования• Репликация: расписание, топология, нагрузка• Надежность: недоступность данных, потеря данных• TCO: насколько просто управлять и поддерживать• Общая зрелость решения: работает или нет

Page 17: Дедупликацию в каждый ЦОД

Дедупликация

Post Process:Копирование, потом дедупликация

Копия

3x ввод/вывод

ДЕДУПЛИКАЦИЯ: INLINE ИЛИ POST-PROCESSING

Дедупликация

Inline: Дедупликацияво время копирования

РепликацияДедупликацияЗапись

Дополнительное время уязвимости

Запись

Дедупликация

Репликацияt t

Page 18: Дедупликацию в каждый ЦОД

ДЕДУПЛИКАЦИЯ – С ЧЕГО НАЧАТЬ?Специалисты КРОК помогут Вам самостоятельно провести обследование, чтобы получить ответы!

• Какие данные хранятся в файловых и почтовых системах, когда они созданы и как часто используются?

• Какой коэффициент дедупликации можно получить на данных?

• Какие проблемы есть в инфраструктуре резервного копирования?

• Любые другие вопросы по хранению и управлению информацией

Это потребует несколько минут времени ежедневно в течение одной недели

Page 19: Дедупликацию в каждый ЦОД

ФИНАНСИРОВАНИЕ ПРОЕКТОВ: НЕТ ДЕНЕГ? — ЕСТЬ ВЫХОД!

• ЛИЗИНГ– Предсказуемые финансовые потоки– Оптимизация налогообложения– Пополнение оборотных средств

• ПРОДАЖА В КРЕДИТ– Сроки — до 5 лет– Возможно кредитование оборудования,

софта и работ– Периодичность платежей — ежемесячные или ежеквартальные,

в начале или конце периода– Может потребоваться аванс и страхование– Необходимо прохождение кредитного комитета

Page 20: Дедупликацию в каждый ЦОД

СПАСИБО ЗА ВНИМАНИЕ!

Дмитрий ДощаныйДИРЕКТОР ЦЕНТРА РЕЩЕНИЙ КРОК НА БАЗЕ ТЕХНОЛОГИЙ ЕМСТел.: +7(495) 974 2274 E-mail: [email protected]