9
Реализация требований современных информационно- насыщенных бизнес-архитектур за счет трансформации архитектуры данных и форм представления бизнес- сущностей С. Л. Добриднюк – Директор по исследованиям и инновациям ДРБ ГК «Диасофт», тел. +7(495)-780-75-75, факс +7(495)-780-75-76, sdobridnuk @ diasoft . ru Обсуждаются бизнес-потребности высокотехнологичных организаций, работающих в сфере банковской деятельности, государственного управления, телекоммуникациях, здравоохранении, сетевом ритейле, трансформирующие архитектуру предприятия. По мнению автора, на новом технологическом и архитектурном витке развития вновь растет интерес к датацентрическим архитектурам. В противовес интегрированным СУБД и моделеориентированным архитектурам новые архитектуры обеспечивают множественность типов и форм представления информационных сущностей, поддерживают гибкость и изменчивость содержащейся информации, работая в распределенной вычислительной среде. Это позволяет гибко и быстро подстраиваться под ключевые параметры бизнеса, эффективно управлять затратами на создание и развитие поддерживающих ИТ систем. Состояние вопроса Согласно исследованиям Gartner Industry Research, целый ряд отраслей таких, как банковская деятельность, государственное управление, телекоммуникации, здравоохранение являются стратегически зависимыми от ИТ-технологий. Особенности их деятельности предписывают специальные бизнес- требования к информационной архитектуре предприятия: Архитектура должна позволять вносить изменения 1

Доклад "Реализация требований современных информационно-насыщенных бизнес-архитектур за счет трансформации

Embed Size (px)

Citation preview

Page 1: Доклад "Реализация требований современных информационно-насыщенных бизнес-архитектур за счет трансформации

Реализация требований современных информационно-насыщенных бизнес-архитектур за счет трансформации архитектуры данных и форм представления бизнес-сущностей

С. Л. Добриднюк – Директор по исследованиям и инновациям ДРБ ГК «Диасофт», тел. +7(495)-780-75-75, факс +7(495)-780-75-76, sdobridnuk @ diasoft . ru

Обсуждаются бизнес-потребности высокотехнологичных организаций, работающих в сфере банковской деятельности, государственного управления, телекоммуникациях, здравоохранении, сетевом ритейле, трансформирующие архитектуру предприятия. По мнению автора, на новом технологическом и архитектурном витке развития вновь растет интерес к датацентрическим архитектурам. В противовес интегрированным СУБД и моделеориентированным архитектурам новые архитектуры обеспечивают множественность типов и форм представления информационных сущностей, поддерживают гибкость и изменчивость содержащейся информации, работая в распределенной вычислительной среде. Это позволяет гибко и быстро подстраиваться под ключевые параметры бизнеса, эффективно управлять затратами на создание и развитие поддерживающих ИТ систем.

Состояние вопроса

Согласно исследованиям Gartner Industry Research, целый ряд отраслей – таких, как банковская деятельность, государственное управление, телекоммуникации, здравоохранение являются стратегически зависимыми от ИТ-технологий. Особенности их деятельности предписывают специальные бизнес-требования к информационной архитектуре предприятия:

Архитектура должна позволять вносить изменения в ИТ ландшафт и содержимое ключевых справочников плавно, без революционных возмущений;

Высокая производительность – речь идет о централизованной работе десятков и сотен тысяч точек обслуживания и продаж;

Высокая надежность и устойчивость к агрессивной эксплуатации, исключающая техногенный и «человеческий» фактор;

Низкая стоимость начального «захода» в архитектуру, затраты на ее развитие должны коррелировать с реальным ростом объемов бизнеса.

В современных комплексных архитектурах процесс оказания услуги включает бизнес-процессы, выполняемые не только в рамках предприятия,

1

Page 2: Доклад "Реализация требований современных информационно-насыщенных бизнес-архитектур за счет трансформации

но и на смежных предприятиях и организациях – превращаясь в «сквозные» бизнес-процессы масштаба региона. Бизнес-модель такого предприятия чаще всего отличается значительной изменчивостью по причине постоянного обновления продуктов и услуг.

Информационная модель предприятий в B2C сфере часто включает функции постоянного сбора информации о клиентах: об их покупках, предпочтениях, учет поведения при выборе товара иди услуги, и др. При этом собираемая и обрабатываемая информация не имеет заранее определенной схемы представления, слабоструктурирована и может содержаться в принципиально различных представлениях – включая фото/видео/географический контекст.

Аналитики Gartner считают, что доминирующими форм-факторами архитектуры современных ИТ-систем станут SOA (Service-Oriented Architecture), либо SOA в комбинации с EDA (Event-Driven Architecture). Но их реализация на практике часто происходит с большими сложностями.

Причины ситуации

Для написания информационных систем в парадигме JavaEE1

компании-разработчики применяют обычно два популярных процесса проектирования информационных систем: «Сode first» - рассматривая целевую систему как набор классов и интерфейсов и интегрированного концептуального представления, сознательно исключая уровень физического представления данных; и «Data first» - когда сначала создается ER-модель данных архитектуры системы, и на ее платформе затем строятся активные компоненты – процедуры, функции, методы и пр.

Последний способ применяют разработчики с большой практикой разработки информационных архитектур типа «клиент-сервер» и опытом сопровождения реляционных систем управления базами данных (СУБД). Но, даже работая с новыми информационными сущностями, такие специалисты не могут избавиться от привычки представлять все данные в реляционном виде или накладывать ограничения существующих СУБД на всю систему и архитектуру предприятия в целом.

Известно, что динамичность меняющейся бизнес-модели несколько лет назад уже превысила возможности большинства традиционных ИТ-систем динамично меняться. Исходя из этого, задача создания эффективной архитектуры данных не только остается, но и выходит на первый план для крупномасштабных организаций, сталкивающихся в свой деятельности с

1 Java Platform, Enterprise Edition, сокращенно Java EE — набор спецификаций и соответствующей документации для языка Java, описывающей архитектуру серверной платформы для задач средних и крупных предприятий.

2

Page 3: Доклад "Реализация требований современных информационно-насыщенных бизнес-архитектур за счет трансформации

проблемами при использовании большого объема разрозненных данных.

Наиболее распространенным и проработанным на сегодняшний момент является использование в архитектуре данных SQL-ориентированных реляционных баз данных. Эти СУБД широко используются для хранения структурированных данных, имеют мощный язык запросов, включая поддержку ACID2-транзакций. Вместе с тем, по мере развития информационно-телекоммуникационной сети Интернет, приобретают популярность Web-приложения, при помощи которых реализуются задачи создания социальных сетей, распределенных поисковых систем, систем электронной коммерции, поддержки мобильных и распределенных приложений. Традиционные достоинства реляционных СУБД и системного программного ПО в таких архитектурах уже не кажутся преимуществом, а порой являются сдерживающим фактором.

Альтернативные СУБД как элемент архитектуры данных

Ответом на указанные вызовы стало появление большого числа проектов создания «альтернативных» СУБД - объектно-ориентированных, документоориентированных, графовых, класса ключ-значение, NoSQL, BigTable и пр. Емкость рынка альтернативных СУБД растет темпами до 70% в год, достигнув в 2014 г объема в 3,4 млрд. долларов3.

Часть разработчиков – например проекты Cloudera, MapR, MarkLogic, 10Gen получают финансирование в сотни миллионов долларов и даже успешно полностью вернули (проект Aerospike) все первоначальные инвестиции.

Большое разнообразие типов обрабатываемых данных – структурированных и слабоструктурированных, видов их представления – цифрового, аудио-визуального, вариантов хранения – распределенного и централизованного, наличие специальных требований по быстродействию, отказоустойчивости, информационной безопасности повлекло за собой не только разработку большого числа специализированных СУБД, но и трансформацию архитектуры данных.

Целью трансформации является смена фокуса видения, когда все данные любой формы представления рассматриваются в совокупности – как самая важная ценность предприятия, вокруг которой создаются сервисы и организуется бизнес. Этот «датацентрический» путь трансформации всей

2 Atomicity, Consistency, Isolation, Durability (ACID) — атомарность, согласованность, изолированность, надежность требования к транзакционной СУБД, обеспечивающие наиболее надёжную и предсказуемую её работу.

3 [В Интернете]. URL: http :// wikibon . org / wiki / v / Hadoop - NoSQL _ Software _ and _ Services _ Market _ Forecast _2012-2017

3

Page 4: Доклад "Реализация требований современных информационно-насыщенных бизнес-архитектур за счет трансформации

комплексной архитектуры не противоречит мнению авторитетов - ведь и Дж.Захман говорил про то, что преобразования архитектуры предприятия могут начаться из любой клетки его таблицы-модели.

Таким образом, сегодня мы наблюдаем конвергенцию подходов «Code first» и «Data first» и появление нового вида архитектур предприятия – где слой архитектуры данных не так четко отделен от слоя системного и прикладного программного обеспечения, где нет навязывания единых СУБД для работы с разнородными информационными сущностями.

Новые подходы к архитектуре данных

Как же решаются в современных альтернативных архитектурах данных и соответствующей ей архитектуре предприятия вышеуказанные задачи? Перечислим несколько примеров.

Компактность и страничная организация физических данных в реляционных SQL СУБД сегодня не имеют экономического значения – дисковая и оперативная память в современных ЭВМ стали одной из самых дешевых компонент. Появляются новые быстродействующие компоненты – типа твердотельных жестких дисков или высокоскоростной связи, позволяющей отказаться от встроенной долговременной памяти в принципе.

В архитектуре данных таких информационных систем присутствует несколько хранилищ данных, разделенных по физическому способу хранения данных и типу их организации. Для работы с постоянными данными используются традиционные накопители на дисках, но временные таблицы и рабочие данные – располагаются исключительно в оперативной памяти. Надежность хранения данных в оперативной памяти обеспечивается специальными аппаратными средствами.

Особенностью является то, что данные и объекты в оперативной памяти могут иметь переменную длину и нелинейную адресацию. Это позволяет применять в архитектуре современные решения для быстрой трансформации и выборки данных, например при помощи оригинальных алгоритмов индексирования и матричных преобразований. Практически в каждой архитектуре информационной системы типа «социальная сеть» очень много внимания уделяется технологиям быстрого построения графов социальных связей пользователей для последующего применения в системах коллективного взаимодействия, рейтингования инициатив и сортировки контента участников.

Вторым сдерживающим фактором, унаследованным от реляционных СУБД, является строгая структура данных и система ее поддержки,

4

Page 5: Доклад "Реализация требований современных информационно-насыщенных бизнес-архитектур за счет трансформации

разделяющая DML4 и DDL5 операторы, контроль целостности типов данных. Такая реализация архитектуры данных затрудняет смену версии программного обеспечения, мешает быстро адаптировать информационную систему к изменчивому бизнес-ландшафту.

В архитектурах предприятия, устраняющих данный недостаток, содержится компонента промежуточной ORM6 обертки, обеспечивающая реализацию «Code first» парадигмы. Она хранит описание предметной области в специальной мета-базе данных, отделяя логическое представление данных от деталей физической реализации в объектной модели кода.

Перспективным видится хранение в ООП-виде справочников бизнес-продуктов – поскольку интересы бизнеса требуют быстрой адаптивности к рынку, подразумевая гибкое управление общими и индивидуальными схемами комиссий и тарифов, что удобнее делать на принципах ООП - наследовании и полиморфизме.

Кроме клиентских данных, мета-база может содержать полную онтологическую модель информационной системы – включая не только данные, но и активный код. Поддержка многоканального обслуживания требует выделения в отдельный слой унифицированной бизнес-логики – что тоже можно хранить в мета-базе данных. Это повышает уровень языка работы с информацией, делает его насыщеннее и абстрактнее. Но поиск единого языка манипулирования информацией, представленной в различной форме, пока не завершен. С момента провозглашения М.Фаулером в 2011 году идеи «универсального языка для данных»7 практического решения для этой задачи пока не найдено.

Третьим отличием от обычных архитектур данных является отказ от строгой транзакционности, реализуемой сложными механизмами репликации. В широком круге применений, таких как e-commerce, допускается временная рассинхронизация данных на узлах данных архитектуры предприятия. Появление экземпляра нового объекта данных во всех узлах системы может допускаться в течение минут, часов, и даже дней. Целостность и консистентность данных, и арбитраж конфликтов при такой

4 Data Manipulation Language (DML) язык управления (манипулирования) данными — семейство компьютерных языков, используемых в СУБД для получения, вставки, удаления или изменения объекта данных.

5 Data Definition Language (DDL) - язык описания данных — семейство компьютерных языков, используемых в СУБД для описания структуры баз данных.

6 Object-relational mapping, - объектно-реляционное отображение — технология программирования, связывающая СУБД с концепциями объектно-ориентированных языков программирования, создавая «виртуальную объектную базу данных».

7 M. Fowler, «Polyglot Persistence», 2011. [В Интернете]. URL: http://martinfowler.com/bliki/PolyglotPersistence.html.

5

Page 6: Доклад "Реализация требований современных информационно-насыщенных бизнес-архитектур за счет трансформации

асинхронности может реализовываться на уровне приложения, а не на уровне центральной СУБД.

Четвертым отличием новых архитектур, является повышенная забота о производительности. Поставщики промышленных реляционных СУБД, как правило, решают задачи производительности «вертикальным» масштабированием – переносом систем на крупные многопроцессорные комплексы. В то время как бизнес требует «мягкого» наращивания затрат на покупку оборудования и постепенного увеличения производительности информационных архитектур – без серьезных начальных финансовых затрат. Это лучше всего достигается при «горизонтальном» масштабировании – подключением, по мере развития бизнеса, однотипных дешевых дополнительных компьютеров, объединенных между собой в единую сеть. Поддержка «горизонтального масштабирования», «электронных архивов», CDN8 понятна как программистам, так и финансистам, поскольку решает ключевые вопросы выживания ИТ-проекта, делая затраты на построение и поддержание информационных систем соразмерными с генерируемой бизнесом прибылью.

Заключение

Пик применения «классических» реляционных СУБД пожалуй уже пройден, за ними в ближайшее десятилетие останется лишь ниша транзакционных операций – например в обработке финансовых проводок, где важна мгновенная целостность.

На настоящий момент трудно сказать, какие решения для СУБД и архитектуры данным мы увидим через 5 лет. Но то, что современная архитектура предприятия, это уже не столько о «системах», сколько о «данных» - несомненно. Об этом говорит высокая динамика развития системного программного обеспечения в этой сфере и подходов к архитектуре данных.

8 Content Delivery Network - Сеть доставки (и дистрибуции) контента6