BigПочта: как мы строили DataLake в Почте России / Алексей...

BigПочтаАлексей Вовченко

Кейс из жизни

2012 год – посылка из США под новый год, с подарками всем друзьям•27 ноября - экспорт из США•25 декабря - появилась у нас на границе•30 декабря – поездка в центральный офис EMS

вызволять (5 часов)

Ответ – Матрешка

Что такое почта?

Ритейл

Логистика

Нельзя терять данные

47 тыс. отделений2 млн. новых отправлений в день200-400 млн. событий в сутки

ДанныеПочтыРоссии

Задача - Построить отказоустойчивую инфраструктуру для решения задач почты

Получение Хранение Очистка Валидация

Обработка Аналитика Экспорт

Требования

• OpenSource• Exadata + OracleBI

• уже работает, нужно лучше

Задачи на релиз 0

1. Получить данные от всех логистических систем

2. Построить модель данных (матрешка)

3. Построить отчет «Остатки» состояние на вчера

4. Предоставить доступ к отчету пользователям

Front REST(in)

Map-Reduce

Front REST(in)

Map-Reduce

Front REST(in)

Map-Reduce

Front REST(in)

Релиз 0

Map-Reduce

Front REST(in)

Новые задачи • Нагрузкапользователей

• Доступ к данным по ключу

• Обработки данных не укладываются в реляционную логику

Выбор SQL движка

• Загрузка из HDFS

• Нагрузка – много пользователей

• Тяжелые OLAP запросы

Выбор SQL движка – выводы:

Все SQL движки над HDFS – медленные

Лидеры

Map-Reduce

Front REST(in)

было

Map-Reduce

Front REST(in)

стало

• Доступ к данным по ключу

Доступ к данным по ключу

по ID из 100млрд записей найти 10-100 нужных (pochta.ru)

• Решение key-value базы• Пробовали SparkSQL

• Пробовали Hadoop/Hive/in-memory/Vertica

• Кандидаты:

Релиз 1

Map-Reduce

Cluster

Spark SQL Thrift

Front REST(in)

Map-Reduce

Cluster

Spark SQL Thrift

Front REST(in)

Новые задачи

• А теперь давайте считать real-time…

Выбор streaming

Задачи:• Kafka -> Kafka

• Kafka -> Cassandra

• Kafka -> Hadoop (Hive)

Map-Reduce

Cluster

Spark SQL Thrift

Front REST(in)

Проблемы Spark Streaming

Producer ?? Consumer

Producer Message Message Consumer

Producer Message Consumer

At-Most-Once

At-Least-Once

Exactly-Once

Проблемы Spark Streaming

Producer Message Message Consumer

• Spark checkpoint когда изменился код• Offsets Zookeeper – медленно

• Spark Kafka Direct API

• Spark checkpoint

• Реализовали свой механизм• PostgreSQL (ключ: topic, clientid, partition id, value: offset)

Map-Reduce

Cluster

Spark SQL Thrift

Front REST(in)

Map-Reduce

Cluster

Spark SQL Thrift

Front REST(in)

• Данные в batch != streaming

Map-Reduce

Cluster

Spark SQL Thrift

Front REST(in)

Map-Reduce

Cluster

Spark SQL Thrift

Front REST(in)

было

Релиз 2

Map-Reduce

Cluster

Spark SQL Thrift

Front REST(in)

Map-Reduce

Cluster

Spark SQL Thrift

Front REST(in)

• Pentaho не держит нагрузку

• Прием не держит пики

• SparkThrift +Cassandra – не стабильны

• Spark Streaming -высокодоступность

Масштабируемость фронтов

Map-Reduce

Cluster

DockerFront REST(out)

REST(in)

Высокодоступность SparkStreaming

• Ночью кластер занят на 100%

• Если streaming-job падает, он не может подняться

• Yarn очереди – жалко терять ресурсы

Map-Reduce

Cluster

REST(in)

Релиз 3

Map-Reduce

Cluster

Spark SQL Thrift

Front REST(in)

Map-Reduce

Cluster

REST(in)

Релиз 3

Пилотирование Yandex ClickHouse

•Очень быстрая база

•ClickHouse + docker

•Универсальный загрузчик данных (Spark+Scala+local-table+paritions)

Пилотирование Yandex ClickHouse

•Провели нагрузочное тестирование• Результат – для наших задач не подходит• Под нагрузкой – 100% (3600%)CPU• Скорость сопоставима с Vertica, но очень большая

нагрузка на оборудование

Пилотирование Flink

• Flume не всегда стабилен

• Flume сложно мониторить

• Шаг влево-вправо – сложно

• Решение – Flink

• Пробовали NiFi – не понравился

Map-Reduce

Cluster

REST(in)

Релиз 3

Map-Reduce

ClickHouse

Cluster

CH Front DockerFront REST

(out)REST

Релиз 3.5

Путь данных: Прием

Путь данных: Онлайн обработка

data data

Путь данных: Снова онлайн обработка

data data

Cluster

Путь данных: онлайн сохранение в Cassandra

Путь данных: вся онлайн обработка

data data

Cluster

export

Путь данных: batch обработка

Cluster

ClickHouse

Путь данных: batch экспорт

Front+Docker+nginx Node

(0.5X)

DataCloud front docker (Pentaho, rest, DC services)

KafkaVerticaNode (SAS 10k)

Kafka Cluster + Vertica Cluster + ClickHouse Cluster + Spark

Streaming Cluster

Cassandra (SSD)

Cassandra Cluster + HadoopControl (main ring)

DataNode (SATA)

Hadoop Cluster

DataNode (SATA)

А как же инфраструктура?

Одна инфраструктура

• DataLake (for RAW data)• Batch ETL• Real-time processing• Analytics OLAP/OLTP processing• High-load rest (export)• High-load rest (input)• DataBus• BI• ML

• Hortonworks HDP+HDF• Hadoop• Yarn• Hive(tez)• Spark (+streaming)• Flume• Kafka

• Vertica• ClickHouse• PostgreSQL• Cassandra• Pentaho BI• Docker (scalable rest)

Можно миксовать

Map-Reduce

ClickHouse

Cluster

(out)REST

Нет свободной аналитики

CH Front

ClickHouse

Map-Reduce

Cluster

REST(in)

Streaming only, no Hadoop

Map-Reduce

ClickHouse

Cluster

(out)REST

Hadoop only, no Streaming

Map-Reduce

OozieClickHouse

Cluster

(out)REST

Нет задач доступа по ключу

REST(out)

Cluster

Map-Reduce

OozieClickHouse

Hadoop only, нет задачи и BI

ClickHouse

CH Front REST(out)

Cluster

Map-Reduce

DockerFront REST(in)

Что осталось?

• Flink->prod

• More data -> more nodes

• CI/CD full automatic

• Monitoring/puppet everything

• Sleep at the nights!

Что дальше?

• DataLab (Spark ML, …)

• IgNite

• Spark structured streaming

Выводы

• Не нужно останавливаться на достигнутом

• Каждую задачу должен решать свой инструмент

• Не надо бояться расширять архитектуру за счет хороших и

подходящих инструментов

BigПочта – вопросы?Алексей Вовченко

AVovchenko@luxoft.comSkype: itsneinhttps://www.linkedin.com/comm/in/alexey-vovchenko-3a1b6744

BigПочта: как мы строили DataLake в Почте России / Алексей...

Engineering

Как строили МГУ - phys.msu.ru fileбыло грамотно, по последнему слову науки, и для этого требовались сотни тысяч

Noah's Ark 115ч180 newsgamedia.org/wp-content/uploads/2017/06/16136-Noahs-Arc... · 2017-05-19 · Библия не говорит, что Ной и его сыновья строили

AWS 기반 데이터 레이크(Datalake) 구축 및 분석 - 김민성 (AWS 솔루션즈아키텍트) : 8월 온라인 세미나

Сочи-2014 - EWNCewnc.org/files/sochi/Doklad-Sochi-2014_EWNC.pdf3 Сочи-2014: десять лет без права на закон. Как строили «лучший мир»

план виховної роботи на і семестр 2014 2015 вовченко о.м

Une infrastructure de stockage et sa suite analytique : Le duo gagnant du Datalake Foundation

Coub - как мы строили аналитическую платформу на несколько миллиардов событий в месяц, Михаил Табунов

Как мы строили Jelastic - облачную платформу (PaaS) нового поколения (Дмитрий Лазаренко)

Projet DataLake Pour le Prudentiel - Banque de France

звіт класного керівника вовченко о.м. за 2013 2014 н.р

生産財企業のサービスイノベーション戦略－エフェクチ Title …基本ソフトウエアである「プレディックス（Predix）」と、Big Dataを収集保管するデーターベースである「データレイク（DataLake）」を構築し

ВЫПУСК 3 2010 CAT MAGAZINEС начала проекта мы строили доверительные отношения с клиентом и доказали нашу способность

Datalake de l'idée à la plateforme

с. 1-60 Кемеровской 2013, 1 · PDF fileКемерово -3 - -5 -6 ... города и села, строили новые за-воды, ... символики,

Как мы строили аналитическую платформу на несколько миллиардов событии в месяц

презентація досвіду роботи вчителя вовченко о.м

ОСНОВАНА 6 МАРТА 1925 ГОДА · Юные москвичи оказались в музее, где узнали, как в ста-рину строили избы и

Державна установа «Інститут досліджень ... · 2019-10-22 · 17. Вовченко О. В. Державна політика як механізм

Сочи-2014 · 2017. 10. 10. · Сочи-2014: десять лет без права на закон. Как строили «лучший мир» гической экспертизы,

Как мы строили аналитическую платформу на несколько миллиардов событии в месяц, Михаил Табунов