8
Алексей Галаган ВОЗМОЖНОСТИ ОРГАНИЗАЦИИ ОБРАБОТКИ БОЛЬШИХ И СВЕРХБОЛЬШИХ МАССИВОВ ДАННЫХ

Teradata. Возможности организации обработки больших и сверхбольших массивов данных

Embed Size (px)

DESCRIPTION

Международный Логистический Клуб. 20140827. Электронное взаимодействие при организации трансграничных логистических процессов.

Citation preview

Page 1: Teradata. Возможности организации обработки больших и сверхбольших массивов данных

Алексей Галаган

ВОЗМОЖНОСТИ ОРГАНИЗАЦИИ ОБРАБОТКИ БОЛЬШИХ И СВЕРХБОЛЬШИХ МАССИВОВ ДАННЫХ

Page 2: Teradata. Возможности организации обработки больших и сверхбольших массивов данных

2 04/10/2023 Teradata Confidential

6X

X

17

XX

67

XX

27

XX

7X

X

Мировой лидер в области хранилищ данных

• Top 10 мировых публичных компаний ПО

• Top 10 стратегических IT вендоров

Глобальное присутствие

• 2,500+ заказчиков в 77 странах

• 10,000+ сотрудников

Финансовые результаты (2013 г.)

• Оборот более $2.5 млрд.

• Рыночная капитализация более $10млрд.

Решения Teradata для управления данными

Data Mart Appliance

Extreme Data Appliance

Data Warehouse Appliance

Active Enterprise

Data Warehouse

Appliance for Hadoop

Aster Big Analytics Appliance

SAS High Performance

Analytics

Масштабируемост

ьдо 12TB до 186PB до 22PB до 61PB до 10PB до 5PB до 52TB

Тип задач

Тестирование/

Разработка небольших

витрин данных

Аналитический архив,

обеспечивающий глубокое

погружение в данные

Стратегическая аналитика,

система поддержки принятия решений, быстрое

сканирование

Стратегическая и операционная

аналитика, обновление

данных в реальном времени, активные нагрузки

Платформа для загрузки,

хранения и предобработки

данных на основе Hadoop

1.3.2/2.1

Платформа для анализа Больших

данных с поддержкой SQL MapReduce для новых типов и

источников данных

Выделенное решение для реализации

модели SAS high-performance

analytics

Page 3: Teradata. Возможности организации обработки больших и сверхбольших массивов данных

3 04/10/2023 Teradata Confidential

Цел

евы

е и

нд

икатор

ы Т

С Р

Ф

№1. Формирование единого транспортного пространства России на базесбалансированного развития эффективной транспортной инфраструктуры

Создание единой централизованной модели транспортного комплекса на базе высоконадежной, масштабируемой платформы, оптимизированной под задачи отрасли

№2. Обеспечение доступности, объема и конкурентоспособности транспортных услуг по критериям качества для грузовладельцев на уровне потребностей инновационного развития экономики страны

Создание бизнес сервисов, обеспечивающих грузовладельцев полной, согласованной, актуальной информацией.

№3. Обеспечение доступности и качества транспортных услуг для населения в соответствии с социальными стандартами

Моделирование пассажиропотоков, привязка единой транспортной модели к планам регионального развития, миграционным потокам, пропускным возможностям транспортных узлов

№4. Интеграция в мировое транспортное пространство и реализация транзитного потенциала страны

Переход на международные протоколы информационного взаимодействия на базе транснациональных индустриальных моделей

№5. Повышение уровня безопасности транспортной системы

Ситуационные центры и системы оперативного мониторинга на базе активных хранилищ данных

Цели Транспортной стратегии России

Page 4: Teradata. Возможности организации обработки больших и сверхбольших массивов данных

4 04/10/2023 Teradata Confidential

Управление транспортным комплексом на основе детальной аналитики

Data Warehouse Advanced Analytics

Integrated Discovery

Platform (IDP)

SQL Framework Access Layer

Pre-Built Analytics Functions

Integrated

Data Warehouse(IDW)

1 2

3 4

Page 5: Teradata. Возможности организации обработки больших и сверхбольших массивов данных

5 04/10/2023 Teradata Confidential

Кластеризация потоков и анализ графовМногомерные бизнес индикаторы и геопривязка потоков

Санкей диаграммы, мощность событийных потоков

Новая парадигма анализаОт визуализации агрегатов к комплексному исследованию детальных данных

Page 6: Teradata. Возможности организации обработки больших и сверхбольших массивов данных

6 04/10/2023 Teradata Confidential

Управление наземного транспорта СингапураПроект PLANET Цели и вызовы

Управление наземного транспорта Сингапура планирует, организует и обслуживает транспортную инфраструктуру города. Население мегаполиса превышает 5 миллионов человек – особенно актуальными являются следующие задачи:

• Оптимизация транспортной системы – повышение пропускной способности, сокращение общего времени поездки, повышение уровня комфорта при перемещении по городу для пассажиров общественного транспорта

• Формирование политики в области транспорта на детальных, достоверных данных

• Стратегическое планирование и операционное управление комплексом за счет мониторинга показателей наземного транспорта

• Использование информационной системы для решения задач управления и прогнозирования

Решение

Модель транспортной системы и логическая модель данных Teradata

Хранилище данных Teradata

Данные:• о билетах на общественный транспорт• о поездках частных а/м • о загруженности дорог

Объём данных:• 4.6 млрд. записей за 3 года

Результат

Формирование транспортной политики на достоверных данныхМониторинг и анализ показателей функционирования транспортной системыМоделирование и прогнозирование поведения транспортной системыПрогнозирование загруженности дорог с точностью более 80%Планирование мощности транспортной системыОптимизация маршрутов общественного транспортаРасчёт тарифов общественного транспорта и проезда по платным дорогамПовышение эффективности работы сотрудников на 13%Снижение затрат на ИТ на 19% в год

Page 7: Teradata. Возможности организации обработки больших и сверхбольших массивов данных

7 04/10/2023 Teradata Confidential

Таможенная служба Швейцарии

Цели и вызовы

Таможенная служба Швейцарии решает следующие задачи: борьба с незаконной иммиграцией и криминальными явлениями, защита населения и окружающей среды, общественная безопасность, контроль импорта/экспорта и проведения досмотров, проверка уплаты налогов и сборов на границе, сбор детальных данных и статистики о перемещении пассажиров и грузов.

Источники данных:

• Электронные таможенные декларации • Данные о перемещении по платным автодорогам• NCTS – глобальная электронная система таможенных

деклараций Евросоюза и Европейской ассоциации свободной торговли

Решение

Логическая модель данных Teradata

Хранилище данных Teradata

Данные:• 16 млн. деклараций на импорт• 6.5 млн. деклараций на экспорт• 7.5 млн. транзитных регистраций• 23 млрд. CHF таможенных поступлений – 30% бюджета

Швейцарии

Результат

• Аналитическая и оперативная отчётность в режиме реального времени

• Анализ рисков• Сегментация клиентов

таможенной службы• Мониторинг показателей

эффективности• Контроль уплаты налогов и

сборов• Мониторинг перемещения

граждан• Повышение эффективности

работы сотрудников таможни• Возможность использования

данных хранилища для вероятностной оценки потенциального мошенничества

Page 8: Teradata. Возможности организации обработки больших и сверхбольших массивов данных

8 04/10/2023 Teradata Confidential

Преимущества партнерского подходаАЦ «Концепт» и Teradata - синергия методологии и технологического потенциала

АЦ «Концепт» - лидер в методологии анализа и прогнозного моделирования ТК:

Опыт реализации профильных проектов в транспортной отрасли РФ

Собственная научно-методологическая база

Штат специалистов в области автоматизации прогнозных и аналитических задач

Научно-технологическая кооперация позволяет эффективно решать задачи, сформулированные в Транспортной стратегии РФ, в части моделирования и прогнозирования транспортных потоков

Teradata – лидер в создании высоко эффективных решений по хранению и обработке больших объемов данных

Опыт в реализации крупных международных проектов управления ТК

Собственная методология проектирования промышленных хранилищ данных, тиражируемая референтная модель данных

Штат специалистов в РФ, реализующий проекты федерального уровня