19
Online backup: технологии хранения больших объемов данных Белешев Роман IASO Backup

Роман Белешев - Online backup: технологии хранения больших объемов данных

Embed Size (px)

DESCRIPTION

IT_Share. Highload 2.0

Citation preview

Page 1: Роман Белешев - Online backup: технологии хранения больших объемов данных

Online backup: технологии хранения больших объемов данных

Белешев РоманIASO Backup

Page 2: Роман Белешев - Online backup: технологии хранения больших объемов данных

Online backup сервис (SaaS) Сотни тысяч пользователей Петабайты данных Партнеры по всему миру Десятки брендов И ни одной СУБД

О компании

Page 3: Роман Белешев - Online backup: технологии хранения больших объемов данных

Данные хранятся на сервере Необходимо малое бэкапное окно Простое копирование файлов – не

вариант

Online backup:определяющие особенности

Page 4: Роман Белешев - Online backup: технологии хранения больших объемов данных

Клиент как источник всех бед Сервер: и куда все это девать Что делать, когда сервера начинает не

хватать

Направления борьбы с Big data

Page 5: Роман Белешев - Online backup: технологии хранения больших объемов данных

Источники big data на клиенте

Много (мелких) объектов Структура файлов История изменений Порядок – десятки

миллионов

Большие объекты Базы данных Порядок -

терабайты

Page 6: Роман Белешев - Online backup: технологии хранения больших объемов данных

Мотивация: данные устроены «неплохо»

Файлы нарезаются на блоки

Блоки идентифицируются хэшами

Де-дупликация: принцип

Page 7: Роман Белешев - Online backup: технологии хранения больших объемов данных

«Блочный» состав файла фиксируется При бэкапе контент файла сравнивается

поблочно На сервер отправляются только новые

блоки

Де-дупликация в действии

1 2 3 4 5 6 7 8

1 9 3 4 5 6 7 10

1 9 3 11 5 6 7 10 12

1

2

3

Page 8: Роман Белешев - Online backup: технологии хранения больших объемов данных

Хранилище для: Структуры файлов Версий файлов Состава файлов из

блоков

Backup register

Page 9: Роман Белешев - Online backup: технологии хранения больших объемов данных

БД на сервере? Встроенная БД на

клиенте? А так ли надо SQL? Данные отдельно –

индексы отдельно Модификация:

вперед и только вперед

Дельта – заливка

Backup register: выбор технологии

Page 10: Роман Белешев - Online backup: технологии хранения больших объемов данных

Как БЛОБы в БД? Как файлы в файловой системе? Объекты должны быть среднего размера Не класть «яйца» в одну корзину

Как хранить контент на сервере

Page 11: Роман Белешев - Online backup: технологии хранения больших объемов данных

Кабинет – это набор блоков

Блоки сгруппированы оптимально

Кабинет формируется на клиенте

Кабинет атомарно отправляется на сервер

Кабинеты

Page 12: Роман Белешев - Online backup: технологии хранения больших объемов данных

Вычислительная нагрузка минимальна

«Интеллектуальность» сервера минимальна

Промышленный сетевой протокол

Большой быстрый диск с быстрой сетевой картой

Организация сервера

Page 13: Роман Белешев - Online backup: технологии хранения больших объемов данных

Много независимых серверов

Проблемы с расширяемостью и надежностью

Отсутствие общей картины

Неудобство управления

«Безоблачная» юность и проблемы дальнейшего роста

Page 14: Роман Белешев - Online backup: технологии хранения больших объемов данных

Бэкапы должны идти всегда Прозрачное масштабирование Централизованное управление и

мониторинг

Требования к облаку

Page 15: Роман Белешев - Online backup: технологии хранения больших объемов данных

Использовать готовый сервис Использовать готовое ПО Создать своё (узкоспециализированное)

облако Поделиться знанием с клиентом

Поиск «облачного» решения

Page 16: Роман Белешев - Online backup: технологии хранения больших объемов данных

Устройство облака

Много независимых узлов хранения

Один управляющий узел

Клиент взаимодействует с управляющим узлом и «своими» узлами хранения

Клиент «помнит» где лежат данные

Page 17: Роман Белешев - Online backup: технологии хранения больших объемов данных

Собственный управляющий процесс Управление узлами хранения Мониторинг клиентских агентов Отсутствие СУБД

Управляющий узел

Page 18: Роман Белешев - Online backup: технологии хранения больших объемов данных

Они лучше решают конкретную задачу Они удерживают систему от

«расползания» Иногда более дешевы (в перспективе) В конце концов, это интересно

Изобретайте велосипеды

Page 19: Роман Белешев - Online backup: технологии хранения больших объемов данных

С удовольствием отвечу на ваши

вопросы

Спасибо за внимание

+375 29 502 30 32, [email protected]