30
Российский офис Консорциума W3C при поддержке Центра семантических технологий НИУ ВШЭ Анализ международных практик поддержки R&D по направлению “Открытые Данные”

Анализ международных практик поддержки R&D по направлению “Открытые Данные”

Embed Size (px)

DESCRIPTION

Анализ международных практик поддержки R&D по направлению “Открытые Данные”

Citation preview

Page 1: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

Российский офис Консорциума W3C

при поддержке

Центра семантических технологий НИУ ВШЭ

Анализ международных практик

поддержки R&D по направлению

“Открытые Данные”

Page 2: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

2

История развивалась…

Документы Датасеты Связанные данные

Эра документов С принятием директивы Re-use of Public Sector Information Directive (2003/98/EC,

17/11/2003) в Евросоюзе начался процесс публикации информации государственного сектора

– Public Sctor Information (PSI).

К июлю 2005 года все 25 стран – членов Евросоюза ввели соответствующие положения

директивы в свои национальные законодательства.

Эра датасетов Страны-лидеры по открытию государственной информации все больше стали публиковать

информацию в виде каталогизированных наборов данных, или «датасетов» (Open

Government Data – OGD). В 2009 году, опубликованная Директива администрации США

предписала всем правительственным агентствам в 45-дневный срок опубликовать по 3 новых

датасета на специально выделенных страницах порталов agency/…/data.gov. и добились

существенных результатов, они продолжают фокусировать свои усилия на облегчении для

общественности поиска данных и раскрытия их в самых разнообразных форматах.

По мере наращивания массивов публикации пришло осознание, что для достижения

эффективности использования бизнесом и гражданами данных не достаточно публиковать

эти наборы в виде файлов, таблиц и графиков на выделенных государственных порталах.

При использовании таких форматов публикации обнаружились некоторые проблемы:

Accessibility (Доступность) - +++ Discoverability (Обнаруживаемость данных) + Cross-referencing (возможность перевязывания данных) –

Page 3: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

3

Handling (Управляемость) +++ Costs (Стоимость) +++

Datasets Management Systems (системы управления датасетами) ?!

Data catalog federation ?! (?! – оказалось, что надо развертывать системы!)

Причем, все трудности использования данных перекладываются “на плечи” разработчиков прикладных систем:

Выяснилось, что затраты на подготовку данных (моделирование, структуризацию,

“выравнивание” по словарям) с лихвой компенсируются легкостью их повторного

использования - “re-use”.

Page 4: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

4

Эра связанных данных В 2009 году была предложена 5-ти звездная модель форматов раскрытия данных Реализация

направления «Открытые государственные данные – OGD» получила развитие в сторону

«Государственные связанные данные – GLD).

В 2011 году Европейская Комиссия запустила стратегию Open Data Strategy for Europe

(IP/11/1524), которая, как ожидается, будет приносить экономике ЕС до 40 миллионов ЕВРО

ежегодно. Директива 2003/98/EC по вторичному использованию информации

государственного сектора явилась по факту первым из наборов средств, призванных

облегчить представителям деловых кругов получение доступа к государственной

информации и разрешения на ее вторичное использование. В настоящее время данная

Директива находится под пересмотром, вследствие которого предполагается расширить как

доступ к информации, так и сферу воздействия Директивы, тем самым придавая Открытым

Данным (Open Data) статус ценного источника, способного обеспечить экономический рост

Евросоюза.

В дополнение к пересмотру официальной инфраструктуры Открытых Данных, Комиссия

одобрила проведение на различных уровнях всевозможных инициатив по поддержке,

включая Call for tenders (от 19 июля 2011г.) для "Портала Открытых Данных Еврокомиссии"

("Commission Open Data Portal"), Call for tenders (от 3 августа 2012г.) для программы

"Вспомогательные сервисы для информации государственного сектора и политики

Открытых Данных (“Support services for the Public Sector Information and Open Data Policy"), а

также требование настоящего Проекта, ставящего своей задачей помочь “Европейским

малым и средним предприятиям обрести возможности и ресурсы, необходимые для

создания инновационных услуг в области аналитики содержимого и данных." (стр. 51

рабочей программы 2013 FP7)

Представление о данных как об открытых данных для рыночного использования в настоящее

время является широко распространенным. Среди крупных и мелких компаний,

фокусирующихся на данном секторе, следует отметить Azure Data Marketplace (Microsoft),

data.com (Salesforce.com), InfoChimps.com и DataMarket.com. Новая стоимостная цепочка

данных включает в себя не только продажу данных нескольким покупателям, но и

тенденцию, следуя которой компаниям специализирующимся на консолидации и

курировании наборов данных могут передавать ряд аспектов управления данными,

Page 5: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

5

Подобные компании обеспечивают данным добавочную ценность, такую как согласование

данных, размещение данных, наличие общих API данных, а также поставляемые уже в

комплекте продукты для их дальнейшего использования в стоимостной цепочке.

В настоящее время в Евросоюзе широким фронтом идет процесс публикации

государственных данных в формате связанных данных.

Источник: https://raw.github.com/LATC/EU-data-cloud/master/diagram/eu-data-cloud.png

Что изменилось в модели GLD по сравнению с моделью OGD:

Accessibility (Доступность) Discoverability (Обнаруживаемость данных) Cross-referencing (возможность перевязывания данных) Handling (Управляемость) Costs (Стоимость) Linked Data Publishing Linked Data Querying/Browsing Vocabulary Management Systems URI Management Systems (красным цветом выделены новые направления усилий)

Наличие информации в машиночитаемом и связанном формате (GLD), а также

достаточного количества согласованных метаданных могло бы обеспечить использование

перекрестных ссылок, а также решить проблему совместимости и тем самым значительно

повысить ценность подобной информации для ее повторного использования. Также

необходимо наличие технической инфраструктуры с тем, чтобы обеспечить долгосрочное

наличие информации. В дополнение к вышеперечисленному, требуется усиленная

Page 6: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

6

поддержка НИОКР и инноваций в области анализа данных и создания средств визуализации.

В отчете 2009 года Digital Britain ("Цифровая Британия") данные характеризовались как

‘инновационная валюта’ и ‘источник жизненной силы в экономике знания’1. Большая

часть данной инновационной валюты производится, собирается или приобретается

правительственными структурами во всех странах ЕС. Это важный сырьевой материал для

широкого спектра новых информационных продуктов и сервисов, основывающихся на

новых возможностях анализа и визуализации данных, полученных из различных источников.

Однако, основными препятствиями, с которыми сталкиваются компании в процессе

получения открытых данных в качестве необходимых источников информации для своей

деятельности, являются:

Правовые рамки: Несмотря на определенные улучшения, произошедшие вследствие

влияния Директивы 2003 года о вторичном использовании информации

государственного сектора, сохраняется ряд проблем, связанных с национальными

законами и практиками. Это приводит к фрагментации рынка внутренней информации

и препятствует созданию международных информационных сервисов.

Деловая компетентность: В связи с незрелым характером Европейского (и

всемирного) сектора Открытых Данных, потенциальные предприниматели по

прежнему ждут создания более надежной и прозрачной базы, на которой можно было

бы построить надежный бизнес. Согласно исследованию, проведенному MEPSIR в

2006 году для бизнес-сектора открытых данных, существует так называемая "игровая

площадка" ("playground"), которая требует инвестиций, но приносит мало прибыли

(сюда входят мобильные приложения, сервисы визуализации и им подобные), а также

"поля сражений" ("battlegrounds"), которые дают ощутимую прибыль, связанную с

большим объемом инвестиций в инфраструктуру данных, и которые характеризуются

большей конкуренцией, (метеослужбы, бизнес-информация и т.п.). Дискуссии,

проводимые по возможностям деловой активности в данном секторе носят по

прежнему общий характер, далекий от принятия решений на высшем уровне.

Информированность в области финансирования и венчурного капитала: Вслед за

предпринимателями, потенциальные инвесторы также по-прежнему обходят стороной

сферу открытых данных. Среди факторов, способных изменить в ближайшие месяцы

оценку экономики данных с позиции финансового сектора, можно отметить влияние

такого явления, как Big Data, а также серьезных шагов, предпринимаемых Facebook,

Google, Bing и им подобными.

Гармонизированный и взаимосвязанный рынок данных: По прежнему небольшим

остается объем открытых данных, потребность в которых охватывала бы значительные

географические зоны (с соответствующим количеством возможных потребителей

информации). Согласующиеся наборы данных, на основе которых может быть создан

конкретный сервис, присутствуют в одном регионе и отсутствуют в другом. Таким

образом целевые рынки для приложений и сервисов набирают слишком малый объем

для того чтобы набрать удовлетворяющее количество потребителей, способных

приносить прибыль. Гармонизация данных, всеобщие стандарты, и взаимосвязанность

данных вне зависимости от национальной принадлежности и языка являются жизненно

важными факторами для создания привлекательного с экономической точки зрения

1 http://www.official-documents.gov.uk/document/cm76/7650/7650.pdf.

Page 7: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

7

рынка.

Проверенные бизнес-модели: В целом для основанного на Web и мобильного видов

бизнеса не существует какой-либо проверенной модели, по которой может быть

создано успешное деловое предприятие. Кроме того, следует принимать во внимание,

что данный сектор насыщен продуктами и сервисами, предоставляемыми бесплатно.

Таким образом более сложные виды бизнеса должны быть построены на основе более

продуманных концепций, таких как freemium-модель или open source (открытый

источник), которые по-прежнему носят экспериментальный характер.

Базовым средством, способным обеспечить автоматическое создание приложений,

работающих на базе Связанных Открытых Данных (Linked Open Data), является концепция

восприятия данных в качестве Data-as-a-Service (DaaS) для виртуализированного доступа к

данным. Следуя принципу прочих XaaS (Everything as a Service) (Все как Сервис) концепций,

в которых продукт или сервис предоставляется в самодостаточной форме, DaaS

основывается на идее, состоящей в том, что данные могут быть предоставлены пользователю

по его требованию вне зависимости от географической и организационной принадлежности

провайдера и потребителя. С помощью верного DaaS решения компания может

комбинировать (Связанные) Открытые Данные из различных источников с собственными

данными и использовать полученные результаты для улучшения своей работы.

На каких направлениях сосредоточены исследования и

разработки

API: Стандартные API позволяют приложениям интегрировать данные в режиме

реального времени при помощи новейших способов управления версиями и форматов

открытых данных. Использование API наряду с жизненным циклом ОД означает

возможность отслеживания использования данных, внедрения тарификации и

обеспечения API ключами для управления смешанными видами бизнеса в качестве

freemium-модели.

Облачные вычисления: Брокеры данных, располагающие большим количеством

хранимых наборов данных, получают существенную выгоду с помощью облачных

вычислений посредством использования инфраструктуры, которая может быть легко

установлена и расширена по мере необходимости, в зависимости от потребности в

объеме и пропускной способности. Подобная эффективная модель размещения

приносит финансовую прибыль как брокеру, так и потребителю данных.

Linked Data, Big Data: Принцип Семантического Web находит отклик среди

лидирующих Web-компаний. С помощью schema.org Google, Yahoo! и Bing

обращаются к сценарию Семантического Web с целью получения большего количества

данных, улучшенной функциональной совместимости и мощной рыночной силы,

которую можно использовать в работе.

В рамках работ по унификации моделей данных опубликованных европейских датасетов

начаты разработка унифицированных базовых словарей для “выравнивания и согласования

данных. В этих работах (февраль – ноябрь 2012 г. приняли участие 67 экспертов из 21

стран-участников, представляющих университеты, международные стандартизирующие

Page 8: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

8

организации и агентства Евросоюза.

Источник: https://joinup.ec.europa.eu/sites/default/files/D1.1_20_UNCEFACT.pdf

Данные-как-Сервис (Data-as-a-Service): Активное международное финансирование

НИОКР и инноваций обусловлено тем, что научная поддержка рассматривается как

обязательная составляющая при преодолении барьеров по открытию

государственных данных. Университеты Европы и Америки при помощи финансовых

программ реализуют научно-исследовательские проекты по открытым данным,

охватывающих широкий спектр исследований и приложений. С 2010г. финансирование

НИОКР проектов осуществляется в рамках таких программ поддержки, как the

Framework Programs for Research and Development, the Competitiveness and Innovation

Program, а также ISA Program.

Создание конкретных DaaS-приложений остается дорогостоящей и затратной по времени

задачей. На данном пути можно обозначить три основных проблемы:

В отношении интеграции и управления данными разработчики сталкиваются с

разнообразием новых форматов данных и языков запросов. Разработчики вынуждены

бороться с отсутствием однородности между различными наборами данных. Решение

данных проблем может потребовать создания различных новых систем баз данных и

инструментов хранения, обработки и доступа к несходным данным.

После завершения процесса интеграции, работающие на основе данных приложения

требуют создания новых принципов взаимодействия данных, способных решить

конкретные задачи и раскрыть возможности лежащих в основе форматов данных.

Использование преимуществ Связанных Данных требует динамичного обнаружения

доступных ресурсов данных, плавной интеграции Связанных Данных из различных

источников, информации о происхождении, а также оценки качества информации.

Здесь также должен соблюдаться принцип Data-as-a-Service. Это означает, что

пользователи должны иметь возможность обнаруживать, интегрировать и использовать

доступные разнотипные источники данных для конкретного случая и по первому

требованию.

Нельзя недооценивать важность наличия интерфейсов для конечных пользователей,

реализующих принципы универсальной визуализации, изучения и взаимодействия

Связанных Данных. С целью ускоренного создания приложений, основанных на

Открытых Данных, разработчики должны обладать инструментами для визуализации и

проведения анализа, позволяющие им динамично создавать многофункциональные

пользовательские интерфейсы.

В рамках реализации Open Data Strategy for Europe, ЕС намерен обеспечить разработчиков

приложений полноценной самодостаточной платформой для ускоренного создания

Page 9: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

9

приложений и сервисов, работающих на основе Открытых Данных. Принцип

самодостаточности в данном контексте означает, что разработчик приложения имеет

возможность создавать и модифицировать приложения и сервисы по мере необходимости

без необходимости ручного программирования.

Создание сервисов и приложений происходит по простой и самодостаточной схеме:

Обнаружение источника данных: На первом этапе разработчик может обнаруживать

и выявлять необходимые для работы приложения источники данных. На основе

данных, поставляемых курирующими сервисами (curation services), которые

обеспечивают наличие очищенных наборов данных, включая описание источников

данных (метаданных), полученных благодаря множеству инициатив по Открытым

Данным, доступные наборы данных могут быть изучены, рассортированы и

отфильтрованы соответственно их метаданным, таким как область применения,

расположение, создатель, время создания, доступные меры по обеспечению качества и

многое другое. Данный процесс приводится в исполнение при помощи расширяемого

набора инструментов для визуального изучения, просмотра, поиска и анализа

доступных источников данных.

Интеграция и использование данных: С момента выбора разработчиком набора

данных (или множественных наборов данных), он может быть интегрирован и

использован в приложении простым нажатием кнопки. Контролируемые словари,

таксономии или списки кодов будут предоставляться для обеспечения надежной

основы для семантического связывания соответствующих данных на базе программы

ЕС ISA.

Пользовательский интерфейс для ускоренного создания приложения: Работая

поверх интегрированного корпуса данных, платформа обеспечивает наличие

исключительного многофункционального пользовательского интерфейса,

обеспечивающего различные виды взаимодействия с данными, включая визуализацию

данных, графический браузер данных, основанное на wiki- и шаблонах редактирование

и аннотирование, а также визуальное изучение и поиск. Он может быть с легкостью

модифицирован с помощью использования богатого выбора встроенных виджетов,

которые могут быть установлены полностью декларативным способом, с

использованием либо простого, основанного на wiki- синтаксиса либо форм

конфигурации. Подобным образом даже обычные пользователи могут создавать

продвинутые пользовательские интерфейсы, обеспечивающие такие виды

взаимодействия как пользовательская визуализация (например, включающая в себя

отчеты и таблицы), совместное использование знания и интерфейсы ввода данных,

мэшапы с внешними источниками или поддержка особой модальности данных

(например, временные, пространственные, социальные сетевые данные и т.п.).

Расширение платформы с помощью SDK: Тогда как первые три шага могут быть

выполнены без помощи программирования, дальнейшее расширение платформы

возможно при условии использования собственных компонентов: применение

встроенных API, а также простых в использовании SDK позволяет с легкостью писать

собственные, предназначенные для конкретных сценариев виджеты и динамичные

поставщики данных.

Софинансирование НИОКР и инноваций

Комиссия поддержала создание открытых данных при помощи ряда финансовых программ, в

Page 10: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

10

164,1

34 10 1,06 110

50

100

150

200

ISA FP7 Open Data

Innovation

Open

Governmental

Datasets

Open

Government

Initiative at

NASA

Объем финансирования, млн. евро

частности, таких как the Framework Programmes for Research and Development, the

Competitiveness and Innovation Programme, а также the ISA programme. Данные проекты

охватывают широкий спектр исследований, приложений и типов организаций.

Проект Linked Open Data (LOD22), который стартовал в сентябре 2010 года, рассчитан

на 4 года. Он направлен на использование Web в качестве платформы для интеграции

информации и данных, а также на использование семантических технологий с целью

повышения пригодности использования государственных данных.

Проект OpenAIRE3, начавшийся в декабре 2009 года, партнерами которого являются

представители 25 стран ЕС и нескольких ассоциированных стран, ставит своей задачей

создание совместной инфраструктуры для пилотного проекта ЕС по раскрытию доступа к

исследовательским данным (EC Pilot for Open Access to Research Information).

Акция ISA по обеспечению семантического взаимодействия (SEMIC.EU4) направлена на

поддержку идеи создания Открытых Государственных Метаданных, как первого шага в

направлении выравнивания метаданных как на национальном, так и общеевропейском

уровнях.

Некоторые примеры

программ НИОКР

Меры обеспечения финансирования и поддержки: стимулирование НИОКР и

инноваций в области открытых данных

Комиссия также намерена проводить стимулирующую деятельность, направленную на

расширение открытого доступа к государственной информации, посредством различных

финансовых программ. Она будет использовать различные средства стимулирования рынка,

тестирования и поощрения создания инновационных решений, а также обеспечения

максимально возможного использования открытых данных.

Поддержка НИОКР и инноваций

Комиссия намерена оказывать поддержку в проведении НИОКР в области технологий

2 http://lod2.eu/.

3 http://www.openaire.eu/.

4 http://www.semic.eu/

Page 11: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

11

обращения с данными, таких как добыча данных, их анализ и визуализация. В период с 2011

по 2013 годы Комиссия планирует потратить на эти цели порядка 100 миллионов евро.

Информационный менеджмент также является одним из ключевых направлений ИКТ в

программе Horizon 2020, которая представляет собой поддержку ЕС в области исследований

и инноваций на период с 2014 по 2020 годы.

Комиссия будет поддерживать технические инновации и их внедрение с помощью пилотных

акций, тестовых и демонстрационных инновационных приложений, таких как

геоинформационные системы, сервисы, основанные на использовании информации о

месторасположении (GIS), а также приложений содержательного характера в области

образования, культуры или моды. Данная поддержка будет осуществляться в рамках

программ CIP-ICT PSP в 2012-13гг. и далее - в рамках Horizon 2020.

В дополнение к этому, Комиссия будет помогать в организации конкурсов открытых

данных, предназначенных ускорить создание новых информационных сервисов, а также

берет на себя инициативу в действиях, направленных на улучшение доступа к капиталу для

предпринимателей, разрабатывающих новые информационные сервисы на основе данных

государственного сектора.

Поддержка информационных инфраструктур - порталы данных для Европы

С целью облегчить создание информационных продуктов и сервисов, использующих данные

различных стран ЕС, Комиссия намерена работать над созданием двух взаимосвязанных

общеевропейских порталов данных.

В 2012 году начнет свою работу портал, позволяющий получать и использовать ресурсы

данных Еврокомиссии и прочих европейских организаций и ведомств. Параллельно с этим,

будут выявлены и анонсированы определения метаданных с высоким потенциалом

повторного использования. Стандартные условия использования поставят своей задачей

максимально возможное потребление европейских данных в инновационных

информационных сервисах соответственно Решению Комиссии о повторном использовании

информации Комиссии.

Комиссия также будет работать совместно с странами - членами ЕС, органами

государственного сектора и региональными организациями над созданием пан-европейского

портала данных, который начнет свою работу в 2013 году, и с помощью которого будет

открыт доступ к широкому спектру наборов данных по всему ЕС (включая данные,

доступные на портале Комиссии). В тех случаях. когда это возможно, работа будет

основываться на существующих структурах и разработках, и далее портал будет постепенно

расширяться с тем, чтобы охватить все ключевые наборы данных со всех стран ЕС.

Поддержка будет обеспечиваться в начальном периоде в рамках программы CIP (2011-2013).

В период с 2014 по 2020 годы, финансирование инфраструктуры европейского электронного

сервиса государственных данных будет осуществляться фондом Connecting Europe Facility5.

Комиссия также будет продолжать оказывать поддержку программам оцифровки

материалов, а также развитию платформы Europeana, обращающейся к важным аспектам

повторного использования данных.

5 См. Предложения Комиссии для CEF, COM(2011)665, COM(2011)657/3.

Page 12: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

12

Поддержка инфраструктур исследовательских данных

Комиссия оказывает поддержку в рамках FP7, а также предполагает продолжать

аналогичную деятельность в рамках программы Horizon 2020, направленную на создание

надежной и устойчивой сервисной инфраструктуры для научных данных в Европе,

отвечающей потребностям требующей переработки большого количества данных научно-

исследовательской деятельности по программе 2020, руководствующейся рекомендациями

отчета ‘Riding the Wave’. Она обеспечит доступ и взаимодействие с множеством

информации, начиная от "сырых" основанных на наблюдениях и экспериментальных данных

и заканчивая публикациями во всех научных областях.

Данная инфраструктура включает в себя технические, организационные и нормативные

аспекты, требующие интенсивного согласования с странами-членами ЕС, а также третьими

странами и международными организациями с целью обеспечения глобальной

функциональной совместимости и взаимовыгодного доступа. Комиссия намерена работать

совместно с международными партнерами с целью создания стандартов для обеспечения

глобального доступа к данным и их совместимости.

Выводы

Страны-лидеры и международные институты в направлении открытия данных находятся на

3-м этапе развития своих проектов, - формировании датасетов связанных данных.

Страны-лидеры сформировали R&D программы в качестве обязательного направления

реализации государственной политики открытия данных.

Реализуемые R&D программы носят международный характер:

Ирландия (NUI Galway’s Digital Enterprise Research Institute (DERI) – более 100

сотрудников) ведет разработки для стандартов и платформ для правительства США и

Евросоюза.

Эксперты и ученые W3C, Open Knowledge Foundation и др. участвуют практически во

всех R&D проектах и программах, привнося в них накопленные опыт и компетенции.

В рамках R&D разрабатываются не только новые стандарты представления и

публикации данных, и программные платформы, но и разрабатываются перспективные

бизнес-сценарии использования государственных данных. Выявляются также наиболее

перспективные отрасли и направления, для которых концентрируются финансовые

ресурсы для публикации данных.

Page 13: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

13

Приложение №1 к Отчету «Анализ международных практик поддержки R&D по направлению Открытых Данных»

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

1 ISA ISA - это программа поддержки, в рамках которой осуществляется финансирование мероприятий Европейской Комиссии. В рабочем плане «Электронное правительство (eGovernment)» очерчены области, требующие совместных действий государств-членов, намечены цели и заданы временные рамки для достижения этих целей. В принятых в Малмо и Гранаде министерских декларациях государства-члены подтвердили свою приверженность целям рабочего плана. Государства-члены обязались самостоятельно реализовывать пункты рабочего плана «Электронного правительства» в своих странах. Комиссия осуществляет надзор за ходом выполнения плана и предоставляет государствам-членам специальные знания вместе с эталонными данными, так чтобы они могли оценить свои собственные достижения, а также сравнить их с результатами других государств-членов. ISA поддерживает реализацию следующих программ:

Европейская стратегия взаимодействия (EIS). Программа построения европейского «цифрового

общества» (Digital Agenda), одна из флагманских инициатив стратегии «EURпа-2020».

Рабочий план «Электронное правительство» на 2011-2015 гг.

ISA дополняет:

Программу поддержки политики по развитию информационных и коммуникационных технологий (ICT Policy Support Programme) в рамках Программы повышения конкурентоспособности за счет инноваций

2010-2015 ISA (Interoperability Solutions for European Public Administrations - «Решения по взаимодействию для европейских органов государственного управления»)

164,1 млн. EUR http://ec.europa.eu/isa/policy/policy1_en.htm http://ec.europa.eu/isa/index_en.htm Официальные документы: http://ec.europa.eu/isa/library/index_en.htm

Page 14: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

14

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

(CIP), доводя проверенные решения до стадии эксплуатационной готовности.

2 LOD2 Получение знаний из взаимосвязанных данных: НИОКР в области оригинальных новаторских технологий

Web`а Семантических Данных. Расширение и интеграция находящихся в открытом

доступе взаимосвязанных данных Всемирной Паутины. Принятие и внедрение Связанных Данных для СМИ,

предприятий и правительств. Проект LOD2 позволит осуществить интеграцию связанных данных с существующими крупномасштабными приложениями и продемонстрировать преимущества такого подхода на примере трех прикладных сценариев. Полученные в результате инструментальные средства, методы и наборы данных имеют потенциал изменить тот Web, который мы знаем сегодня.

01.09.2010 – 31.08.2014

Координатор: Universitaet Leipzig ГЕРМАНИЯ Участники: National University of Ireland, Galway ИРЛАНДИЯ

Zemanta Pametne Spletne Storitve Insvetovanje d.o.o. СЛОВЕНИЯ

Openlink Group Limited СОЕДИНЕННОЕ

КОРОЛЕВСТВО

Exalead ФРАНЦИЯ

Korea Advanced Institute of Science and Technology РЕСПУБЛИКА КОРЕЯ

TenForce BVBA* БЕЛЬГИЯ

Universitaet Mannheim ГЕРМАНИЯ

Седьмая Рамочная Программа (FP7)

Суммарная стоимость: 9 928 343 EUR Доля ЕС: 7 249 999 EUR

Сайт проекта: http://lod2.eu/Welcome.html О проекте в системе CORDIS: http://cordis.europa.eu/projects/rcn/95562_en.html

Page 15: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

15

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

Semantic Web Company GmbH АВСТРИЯ

Open Knowledge Foundation Limited LBG СОЕДИНЕННОЕ

КОРОЛЕВСТВО

Stichting Centrum Voor Wiskunde en Informatica НИДЕРЛАНДЫ

Institut Mihajlo Pupin СЕРБИЯ

Instytut Informatyki Gospodarczej sp z.o.o. ПОЛЬША Wolters Kluwer Deutschland GmbH ГЕРМАНИЯ Vysoka Skola Ekonomicka v Praze ЧЕШСКАЯ РЕСПУБЛИКА

3 LATC Программа круглосуточной поддержки Связанных Открытых Данных (LOD Around-The-Clock (LATC) Support Action) направлена на оказание содействия организациям и отдельным лицам в публикации и использовании качественных Связанных Данных во Всемирной Сети. Достижения в сферах крупномасштабной обработки данных,

01.09.2010 - 31.08.2012

Координатор: National University of Ireland, Galway ИРЛАНДИЯ Участники:

Седьмая Рамочная Программа (FP7)

Суммарная стоимость: 1 188 784 EUR Доля ЕС: 1 059 999 EUR

Сайт проекта: http://latc-project.eu/ О проекте в системе CORDIS: http://cordis.europa.eu/projects/index.cfm?fusea

Page 16: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

16

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

интеграции данных и качественной оценки информации все в большей степени зависят от наличия больших объемов отображающих действительность данных. Формирующийся Web Связанных Данных представляет собой крупнейший источник относящихся ко многим предметным областям, отображающих действительный мир и поступающих в реальном времени данных, которые существуют в данный момент, содержат миллиарды утверждений и охватывают разнообразные сферы деятельности: медийные компании типа Би-Би-Си и Рейтер, фармацевтические компании типа Eli Lilly и Johnson & Johnson, а также правительственные органы США и Великобритании публикуют Связанные Данные в Web. Глобальное пространство данных позволяет осуществлять разработку приложений, использующих преимущества универсальных идентификаторов ресурсов URI и унифицированной модели данных (RDF) на основе масштабируемого протокола доступа к данным (HTTP).

Freie Universitaet Berlin ГЕРМАНИЯ

Vereniging Voor Christelijk Hoger Onderwijs WetenschappeLijk Onderzoek en Patientenzorg НИДЕРЛАНДЫ

Institut fur Angewandte Informatik ev ГЕРМАНИЯ

Talis Information Limited СОЕДИНЕННОЕ

КОРОЛЕВСТВО

ction=app.details&TXT=Linked+Data&FRM=1&STP=10&SIC=&PGA=&CCY=&PCY=&SRC=&LNG=en&REF=95552

4 Внедрение инноваци-

онной концепции Открытых

Данных

Стартапы и небольшие компании, стремящиеся создавать продукты и услуги на основе открытых данных, получают возможность претендовать на новый вид так называемых «Инновационных ваучеров». Ваучеры номиналом 5 тысяч фунтов стерлингов готовятся к выпуску Британским Государственным управлением по стратегиям технического развития (TSB). Имеются ваучеры, выдаваемые за предпринимательские идеи в таких сферах деятельности, как агро-пищевая промышленность, энергетика, водно-канализационное хозяйство, освоение космоса. В последующие два года новаторы и изобретатели, работающие в области Открытых Данных, смогут подавать заявки на получение ваучеров стоимостью 1,1 млн ф. ст. Они будут распределяться каждые три месяца, с поквартальным количеством 25 штук, и

5 лет ODI (Open Data Institute, Институт открытых данных)

1,1 млн. ф. ст. на этот проект, и в целом: В течение пяти лет ODI получил 10 миллионов ф. ст. от прави-тельства Соединенного Королевства (через Агент-ство по инновациям Соединенного

http://www.theodi.org/

Page 17: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

17

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

присуждаться следующим категориям претендентов:

Компании малого бизнеса, создающие услуги и решения с использованием Открытых Данных.

Новые компании, стремящиеся воплотить идею в рабочий прототип.

Специализированные консалтинговые компании, работающие над проблемой интегрирования открытых данных с другими информационными источниками с целью разработки продуктов и опытных образцов.

Консультанты по вопросам интеллектуальной собственности компаний, идеи которых предполагают использование открытых данных.

Королевства и Британское Государственное управление по стратегиям технического развития), плюс 750 000 долл. США от благотворительной инвести-ционной фирмы Omidyar Network, а в настоящее время работает над обеспе-чением долговремен-ного устойчивого развития за счет сбалан-сированности фондов и получения прямых доходов.

5 LDBC (Linked Data Benchmark Council, Совет по эталонному тестированию

решений на основе

Связанных Данных)

Не реляционное администрирование данных приобретает характер и значение жизненной потребности для ориентированной на использование данных экономики, основываясь на больших, распределенных, гетерогенных и сложно-структурированных наборах данных. Эта новая парадигма администрирования данных также приводит к тому, что результаты научных исследований оказывают сильное воздействие на молодые новаторские компании, работающие над

30.09.2012 - 30.03.2015

Координатор: Universitat Politecnica de Catalunya ИСПАНИЯ

Участники: The Semantic Technology

Седьмая Рамочная Программа (FP7)

Суммарная стоимость: 3 462 512 EUR Доля ЕС: 2 660 000 EUR

Проект только запущен, сайт официально еще не открыт. В системе CORDIS: http://cordis.europa.eu/projects/index.cfm?fuseaction=app.details&TXT=Linked+Data&FRM=1&STP=10&SIC=&PGA=&CCY=&PCY=&SRC=&LNG=en&REF=105871

Page 18: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

18

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

новыми технологиями RDF и управления графическими данными, вследствие чего они начинают играть существенную роль в упомянутой выше «экономике данных». Стандарты и эталонное тестирование (бенчмаркинг) являются двумя наиболее важными факторами для разработки новой информационной технологии, хотя еще не созданы всесторонний пакет эталонных тестов и соответствующие практические методики для RDF- и графических баз данных, не говоря уж об отсутствии компетентного органа, устанавливающего эталонные параметры тестирования и процедуру аудирования официальных результатов. Без них дальнейшие разработки и восприятие таких технологий ставятся под сомнение, поскольку промышленность не получает ясных, ориентированных на потребителя ориентиров производительности и функциональности. Цель проекта LDBC заключается в создании первого всестороннего пакета открытых, справедливых и нейтральных по отношению к поставщикам эталонных тестов для RDF/графических баз данных, одновременно с учреждением LDBC как организации для получения, аудирования и публикации результатов. Таким образом, лежащей в основе LDBC научной инновацией является создание содержательных эталонных тестов, полученных путем комбинирования фактических сценариев использования с глубоким пониманием технических аспектов узких мест современной технологии, которым обладают исследователи и архитекторы передовых систем баз данных. LDBC объединит обширное сообщество ученых-исследователей и поставщиков RDF/графических баз данных для учреждения независимого органа, фонда LDBC, ответственного за разработку спецификаций и процедур эталонного тестирования, а также за проверку и обнародование результатов. Создаваемый форум станет долгоживущей, поддерживаемой промышленностью ассоциацией,

Institute (STI), Innsbruck АВСТРИЯ

Stichting VU-VUmc НИДЕРЛАНДЫ Network Engine for Objects in Lund AB ШВЕЦИЯ Tecnische Universitaet Muenchen ГЕРМАНИЯ Openlink Group Limited СОЕДИНЕННОЕ

КОРОЛЕВСТВО Foundation for Research and Technology - Hellas ГРЕЦИЯ Ontotext AD БОЛГАРИЯ

Page 19: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

19

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

аналогичной TCP (Комитету по вопросам обработки транзакций и её эффективности) Поставщики и пользовательские организации также примут участие в этой деятельности, чтобы иметь возможность влиять на разработку эталонных текстов и пользоваться очевидными маркетинговыми возможностями.

6 EUCLID («ЭВКЛИД») Программа обучения

применению Связанных

Данных

Связанные Данные зарекомендовали себя, как эффективное средство де факто для публикации структурированных данных в Web, вследствие чего наблюдается поразительный рост количества организаций, включивших в свою практику применение основных принципов этой концепции для представления и связывания наборов данных с целью беспрепятственного осуществления обмена, интеграции и повторного использования данных. Все больше и больше коммерческих предприятий, работающих в сфере информационно-коммуникационных технологий, предлагают новаторские услуги по администрированию данных, построенные на базе Связанных (Открытых) Данных, тем самым формируя повышенный спрос на специалистов-практиков, обладающих квалификацией и профессиональными знаниями в этой области. Наличие и доступность таких специальных знаний станут решающим фактором, если европейские компании захотят во всей полноте воспользоваться преимуществами этих перспективных технологий администрирования данных, а также научно-техническим опытом, накопленным за последние годы исследователями, техническими энтузиастами и ранними последователями нововведений в различных государствах-членах ЕС. Проект EUCLID поможет продвинуться к этой цели за счет предоставления всесторонней программы обучения, поддерживаемой комбинированными учебными материалами и каналами электронного обучения, подогнанными под фактические потребности специалистов-практиков в области обработки данных. Основанная на опыте консорциума, аккумулированном в более чем

01.05.2012 - 30.04.2014

Координатор STI International Consulting und Research GmbH АВСТРИЯ

Участники: The Open University СОЕДИНЕННОЕ

КОРОЛЕВСТВО Ontotext AD БОЛГАРИЯ

Karlsruher Institut fuer Technologie ГЕРМАНИЯ

Седьмая Рамочная Программа (FP7)

Суммарная стоимость: 742 428 EUR Доля ЕС: 661 998 EUR

http://www.euclid-project.eu/ http://cordis.europa.eu/projects/index.cfm?fuseaction=app.details&TXT=Linked+Data&FRM=1&STP=10&SIC=&PGA=&CCY=&PCY=&SRC=&LNG=en&REF=103709

Page 20: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

20

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

20 проектах по Связанным Данным с участием свыше 40 компаний и государственных учреждений в более чем 10 странах, дополненная обратной связью от более 20 учебных мероприятий и углубленным анализом обсуждений, ведущихся через почтовую рассылку, дискуссионные форумы, Твиттер и блогосферу, рассматриваемая программа обучения будет сфокусирована на методиках и программном обеспечении для интеграции, поиска и визуализации Связанных Данных, которые, по заявлениям практиков, представляют собой наиболее проблемные области. Учебная программа будет реализована в виде интерактивных учебных материалов, размещенных на Web-сайте сообщества, и будет оцениваться, уточняться и расширяться посредством проведения серии вебинаров, индивидуального обучения, непрерывной обратной связи с членами сообщества и их непосредственного участия, координируемых назначенным руководителем сообщества. Значительная доля материалов будет состоять из примеров, относящихся к реальным сценариям применения наборов данных и приложений, фрагментов программного кода, демонстрационных образцов, прогоняемых разработчиками на своих машинах, а также описаний передового опыта и практических руководств. Окончательный вариант программы обучения будет распространяться через iTunes U в виде серии электронных книг, дополненной материалами с Web-сайта сообщества. Предоставляя все эти компоненты по передаче важнейших знаний, EUCLID не только способствует восприятию промышленностью передового опыта работы со Связанными Данными и соответствующих технологий, но - что, возможно, даже важнее - будет стимулировать их дальнейшее совершенствование и объединение наряду с поддержкой устойчивого функционирования сообщества - то есть, обеспечивать реализацию всех существенных аспектов, если принять в расчет новизну данной области и высокую скорость ее развития за последнее время.

Page 21: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

21

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

7 COMDATA Инфрастру-ктуры для

администриро-вания данных, ориентирован-

ного на конкретные сообщества

Объемы структурированных данных, создаваемых, передаваемых и архивируемых во Всемирной Паутине, постоянно растут. Одним из важнейших движений в этом контексте, движением по внедрению Связанных Данных, пропагандируется ускоренная онлайновая публикация больших объемов структурированных данных при соблюдении следующих трех базовых принципов:

присвоение унифицированного идентификатора ресурсов (URI) каждому опубликованному ресурсу;

публикация структурированных данных в соответствии с URI, относящемуся к данному ресурсу; и

включение для каждого ресурса ссылок на аналогичные онлайновые ресурсы.

Публикация Связанных Данных в различных формах представления в настоящее время процветает в Web, чему немало способствуют правительственные органы, социальные сети и научные работники из различных отраслей знаний. Несвязанные между собой сообщества пользователей в постоянно возрастающей степени проявляют интерес к поиску в Связанных Данных, манипулированию ими и возможности произвольно объединять такие данные, что необходимо им для создания новых приложений. К сожалению, имеющиеся сегодня в их распоряжении инфраструктуры данных предоставляют лишь весьма ограниченную и довольно неэффективную поддержку их потребностей. Настоящее предложение сконцентрировано на проектировании новых распределенных инфраструктур администрирования данных с целью обеспечения возможности распределенного, основанного на потребностях конкретного сообщества, манипулирования такими разнородными и взаимосвязанными данными в целом. Затронуты две связанные между собой исследовательские проблемы.

01.09.2011 - 31.08.2014

Universite de Fribourg ШВЕЙЦАРИЯ

Седьмая Рамочная Программа (FP7)

Суммарная стоимость: 75 000 EUR Доля ЕС: 75 000 EUR

http://www.unifr.ch/home/welcomeE.php http://cordis.europa.eu/projects/index.cfm?fuseaction=app.details&TXT=Linked+Data&FRM=1&STP=10&SIC=&PGA=&CCY=&PCY=&SRC=&LNG=en&REF=100008

Page 22: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

22

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

Первая проблема касается проектирования и внедрения эффективной платформы с хранилищем для представления, опроса и распределения очень больших объемов Связанных Данных. Вторая проблема заключается в разработке новых механизмов абстрагирования для интеграции наборов Связанных Данных апостериори, после того, как они уже были опубликованы. Остальная часть настоящего документа посвящена формулировке основных исследовательских задач, подлежащих рассмотрению в данном контексте, и обзору программы исследований по реализации рассматриваемой здесь концепции. В нем воспроизводится структура Рабочей программы для описания Предложения по реинтеграционным грантам для обеспечения профессионального роста.

8 LINKEDUP LinkedUp:

Связывание Web-данных

для Образователь-ного проекта.

Открытый конкурс по интеграции данных в

масштабе Web

Проект LinkedUp нацелен на стимулирование применения больших объемов имеющихся в Web общедоступных открытых данных, особенно образовательными учреждениями и организациями. Это будет достигнуто путем выявления и поддержки в высшей степени новаторских приложений по крупномасштабному управлению информацией в Web через открытую конкуренцию (LinkedUp Challenge) и специализированные оценочные схемы. Концепция LinkedUp Challenge заключается в реализации имеющей глобальное значение индивидуализированной модели обучения университетского уровня на основе открытых Web-данных и информации. Учитывая разнообразие имеющей отношение к образовательному процессу информации в Web, в диапазоне от метаданных Открытых Образовательных Ресурсов до обширных запасов знаний, получаемых через Связанные Данные (в одной только облачной среде Связанных Открытых Данных насчитывается 31 миллиард RDF-утверждений), следует признать, что достижение указанной цели, а именно, оказание индивидуализированных и

01.11.2012 - 31.10.2014

Координатор: Gottfried Wilhelm Leibniz Universitaet Hannover ГЕРМАНИЯ Участники: The Open University СОЕДИНЕННОЕ

КОРОЛЕВСТВО Exact Learning Solutions S.p.A. ИТАЛИЯ

Open Knowledge Foundation Ltd. LBG

Седьмая Рамочная Программа (FP7)

Суммарная стоимость: 1 170 554 EUR Доля ЕС: 1 058 497 EUR

http://cordis.europa.eu/projects/index.cfm?fuseaction=app.details&TXT=Linked+Data&FRM=1&STP=10&SIC=&PGA=&CCY=&PCY=&SRC=&LNG=en&REF=105621

Page 23: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

23

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

доступных услуг обучения, требует преодоления значительных трудностей, связанных с администрированием информации и данных масштаба Web, в том числе Больших Данных, к которым можно отнести проблемы масштабируемости, функциональной совместимости, многоязычности и неоднородности. Таким образом, проект LinkedUp Challenge дает целевой сценарий по формулированию проблемных требований, оценочных критериев и пороговых значений, которые отражены в базовой оценочной структуре LinkedUp. В решениях по управлению информацией должны использоваться данные и учебно-аналитические методы, способствующие выработке исключительно индивидуализированных и контекстно-зависимых представлений гетерогенных Web-данных. Основываясь на прочном союзе организаций с компетенцией в таких областях, как администрирование открытых Web-данных, интеграция данных и обучение с использованием Web-ресурсов, проектом LinkedUp предусмотрено получение следующих основных результатов: базовая структура общего назначения для оценки приложений, использующих Web-данные, образовательные наборы данных с гарантированным высоким качеством, новаторские методы реализации крупномасштабного управления Web-информацией, формирование и объединение сообществ государственного и частного секторов, полноценная передача инновационных технологий по управлению информацией в Web.

СОЕДИНЕННОЕ

КОРОЛЕВСТВО

Open Universiteit Nederland НИДЕРЛАНДЫ

Elsevier B.V. НИДЕРЛАНДЫ

9 Наборы Открытых Правитель-ственных Данных

Одной из главных сфер интересов в LiDRC (Научно-исследовательском центре связанных данных) являются связанные правительственные данные. В этом сообщении научный сотрудник DERI (Исследовательского центра по цифровым технологиям для предприятий) Евангелос Калампокис (Evangelos Kalampokis) дает обзор последних работ в указанной сфере, проводившихся в различных странах. Государственный сектор экономики собирает, производит,

LiDRC (Научно-исследовательский центр связанных данных) при DERI (Исследовательском центре по цифровым технологиям для предприятий)

http://linkeddata.deri.ie/ http://linkeddata.deri.ie/node/72

Page 24: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

24

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

воспроизводит и распространяет большие объемы информации из многих областей деятельности, таких, как социальная, экономическая, географическая, коммерческая и образовательная. Общепризнано, что такая информация служит основным сырьем для цифровых продуктов и услуг, которые способствуют экономическому росту. Главная проблема, затрудняющая повторное использование этой информации, заключается в том, она содержится в изоляции посредством использования различных форматов и систем защиты интеллектуальной собственности. С недавних пор не только практики, но и правительства по всему миру осознали важность публикации правительственных данных в соответствии с открытыми стандартами и начали движение в этом направлении. Более того, в июне 2009 г. Тим Бернерс-Ли призвал правительства не только публиковать свои данные в Web, используя открытые стандарты, но также обратить особое внимание на публикацию связанных правительственных данных. Последний подход позволит комбинировать данные из различных источников стандартизированным способом, что даст возможность разрабатывать услуги и приложения, предоставляющие обществу дополнительные преимущества. Поэтому в течение последних двух лет специалисты-практики и правительства во всем мире вели работы, преследуя две цели:

Создание каталогов правительственных данных, содержащих пригодные для скачивания файлы в таких общепринятых форматах, как XML, CSV и RDF.

Создание приложений, представляющих правительственные данные в виде связанных данных с помощью API Web-служб RESTful, поисковых интерфейсов типа SPARQL и др.

Здесь мы описываем наиболее значительные инициативы

Page 25: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

25

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

различных стран в этих направлениях, то есть, разработка каталогов правительственных данных и приложений для работы со связанными правительственными данными. Каталоги открытых правительственных данных. Хотя могут иметься различные источники правительственных данных, разбросанные по всему Web (например, Web-сайты различных государственных служб), здесь мы представляем инициативные проекты, нацеленные на сбор и организацию в конкретном месте Всемирной Паутины некоторого количества наборов данных, имеющих отношение к органам государственного управления. В рассматриваемых каталогах используются различные форматы данных. Эти форматы можно разбить на три группы: форматы исходных данных (напр., XML, CSV, TXT, XLS), форматы геокосмических (геопространственных) данных (напр., SHP, KML), и формат RDF. Направления исследований Наборы Открытых Правительственных Данных

10 Инициативный проект

Открытого Правительства

в NASA

NASA является сторонником идеи Открытого Правительства. Основываясь на заложившем в 1958 г. основу этой организации законодательном акте, обязывающем NASA «... обеспечивать максимально широкое и практически осуществимое распространение информации касательно ее деятельности и результатов оной», Агентство продолжает прилагать усилия для повышения степени открытости внутри него. Тот же законодательный акт обязывает NASA «... создавать условия для привлечения научного сообщества...» как часть его миссии. Руководители Агентства считают это требование своей перманентной задачей по организации сотрудничества в таких формах, которые трудно было даже предугадать на момент основания Агентства. План дальнейшей

NASA http://www.nasa.gov/open/

http://open.nasa.gov/plan/progress/

http://www.nasa.gov/open/plan/ongoing-

overview.html

Page 26: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

26

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

деятельности NASA в этом направлении отражает достигнутые успехи и уроки, полученные в результате воплощения в жизнь принципов Открытого Правительства, которые составляют неотъемлемую часть деятельности и корпоративной культуры NASA на протяжении вот уже более полувека.

11 Связывание Открытых Правитель-ственных Данных

Проект «Связывание Открытых Правительственных Данных (СОПД)» посвящен исследованию способов открытия и связывания правительственных данных с помощью Семантических Web-технологий. Относящиеся к деятельности правительства наборы данных преобразуются в RDF и связываются с Web`ом Данных, после чего готовятся демоверсии и обучающие руководства по объединению связанных правительственных данных из различных источников и их применению. Портал исследовательской группы TWC «Связывание Открытых Правительственных Данных (СОПД)» (TWC Linking Open Government Data, LOGD) содержит коллекцию наборов RDF-данных, сконвертированных из данных Правительства США и других аналогичных по характеру источников, доступных в Web. Ниже приведена актуальная статистическая информация о наборах данных, доступных через портал СОПД. По состоянию на 28.08.2011 г. 20:15: Сгенерировано 9 946 868 757 RDF-триплетов. Сконвертировано 5 165 таблиц для получения 2 018 версий 1 880 наборов данных от 117 исходных организаций, доступных в виде 1 887 наборов дословных RDF-данных. В 1 651 расширенных наборах данных используются 472 свойств объектов и 221 класс. Во всех наборах данных суммарно использовано 303 260 предикатов.

2009 — настоящее

время

Rensselaer Polytechnic Institute (RPI)

Белый дом (USA.gov)

Точных цифр на сайте нет. Финансовая поддержка: DARPA, Microsoft Research, Fujitsu, Lockheed Martin

http://data-gov.tw.rpi.edu/wiki http://logd.tw.rpi.edu/

Page 27: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

27

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

Образцы различных версий 546 наборов данных доступны через точку доступа LOGD SPARQL и пригодны для поиска по запросам, примеры которого можно найти в разделе «How to find datasets using the LOGD sparql endpoint («Как находить наборы данных с помощью точки доступа LOGD sparql»). Направления исследований Семантический Web, RDF, SPARQL, LOD.

12 OpenLab OpenLab, действующий в настоящее время проект Седьмой Рамочной Программы европейского Сообщества по научным исследованиям, техническим разработкам и демонстрационным мероприятиям в целях создания общеевропейской области исследований и инноваций (2007 - 2013) требует участия новых партнеров для решения определенных задач по этому проекту. В частности, такие задачи касаются проведения новаторских экспериментов, демонстрирующих технический уровень, научную новизну и качественный уровень в области Интернета будущего.

Начало: 01 сент. 2011 г.

Продолжи-тельность: 30 месяцев

Université Pierre et Marie Curie

Седьмая Рамочная Программа (FP7)

Совокупный бюджет: 7,35 млн. EUR Доля ЕС: 5 млн. EUR

http://www.ict-openlab.eu/home.html

13 PlanetData Проект PlanetData нацелен на формирование жизнеспособного EURпейского сообщества ученых-исследователей, поддерживающего деятельность организаций по представлению их данных новыми и практичными способами. Способность эффективно и рационально извлекать смысл из огромных объемов данных, непрерывно публикуемых в глобальной сети, включая потоковые данные, сообщения в (микро)блогах, цифровые архивы, ресурсы научной информации с большим объемом вычислений (eScience), наборы данных государственного сектора и Облачную среду Связанных Открытых Данных является критически важным элементом процесса перехода Европы к обществу знаний. Она позволяет коммерческим структурам, правительствам, сообществам и индивидуумам принимать обоснованные решения, получая конкурентные преимущества и повышая свое благосостояние в

01.10.2010 - 30.09.2014

Продолжи-тельность: 48 месяцев

The Semantic Technology Institute (STI) Innsbruck

Седьмая Рамочная Программа (FP7)

Суммарная стоимость: 3,72 млн. EUR Доля ЕС: 3,02 млн. EUR

http://www.planet-data.eu/

Page 28: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

28

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

общем. Проект PlanetData базируется на трех целевых установках, которые в совокупности ведут к формированию долговременного сообщества, состоящего из научных и промышленных партнеров. Это сообщество получает поддержку при проведении исследований методов крупномасштабного администрирования данных путем предоставления ему наборов данных и доступа к специализированной технологии администрирования данных. Сообщество также пользуется преимуществами комплексной программы обучения, распространения знаний, стандартизации и налаживания деловых связей, направленной на усиление существующих и установление новых партнерских отношений, обучение организаций ключевым вопросам работы с открытыми данными и передачи результатов исследований в промышленность. Цели проекта PlanetData: Исследования: Объединение подходов к крупномасштабному администрированию данных из различных дисциплин с целью создания целостных решений проблем, с которыми приходится сталкиваться при работе с данными на мировом уровне. Предоставление и администрирование данных: Разработка силами лаборатории PlanetData Lab программного обеспечения для работы с большими объемами данных, поддерживающего реляционные, графические и потоковые модели обработки данных, которое позволит исследователем тестировать и подтверждать правильность своих методик. Возможные направления исследований:

Создание определительных словарей для описания

Page 29: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

29

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

наборов данных и их контекстного окружения. Построение каталога наборов данных с вертикальной

структурой областей определения, выбранных за их высокий внедренческий потенциал и соответствие потребностям в средствах администрирования данных.

Обнародование методических указаний и передового опыта по предоставлению данных, чтобы стимулировать использование имеющихся наборов данных конечными пользователями, а также в целях повышения эффективности их интеграции в новые виды продуктов и услуг.

Воздействие: Создание средства, с помощью которого результаты научных исследований и экспериментов, полученные в сети PlanetData, можно было бы использовать:

для повышения образовательного уровня применительно к крупномасштабному администрированию данных как в научных, так и промышленных организациях;

для объединения усилий исследователей из несмежных дисциплин с целью формирования интегрированного сообщества, способного поддерживать организации при целенаправленной публикации ими своих данных, решая таким образом ключевые задачи по крупномасштабному администрированию данных;

для стимулирования восприятия новых подходов промышленными предприятиями за счет стандартизации и стратегического планирования мероприятий по обмену информацией и налаживанию деловых связей.

Направления исследований Управление семантическими данными. «Большие Данные» (Big Data).

Page 30: Анализ международных практик  поддержки R&D по направлению  “Открытые Данные”

30

№ Название

проекта

Краткое описание проекта.

Основные направления исследований

Сроки

выполнения

проекта

Наименование

исследовательской

организации

Заказчик

или

рамочная

программа

Объем

финансирования

Ссылки

в Интернет

14 Доступ к семантическим

данным

IKS (Interactive Knowledge

Stack - «Интерактив-

ный стек знаний (ИСЗ)»)

Базовая концепция семантических данных. Форматы представления семантических данных. Языка запроса для семантических данных. Организация хранения семантических данных и доступа к

ним в хранилищах триплетов. Концепция Связанных Данных.

Миссия IKS заключается в предоставлении организационной платформы и формировании сообщества для работы над проектами по разработке ПО с открытыми исходными кодами в пространстве систем управления семантическим контентом. Речь идет о создании рабочей среды для поставщиков систем управления контентом (CMS), разработчиков ПО с открытыми исходными кодами и исследователей, которая позволила бы им координировать усилия по разработке семантических технологий для CMS-продуктов с конечной целью создания таких семантических техно-логий, способных заменить собой и превзойти по эффективности некоторые традиционные технологии, применяемые в настоящее время в сиcтемах управления контентом на основе широко используемого в Web комплекса серверного программного обеспечения LAMP или Java.

2011-2012 Сообщество разработчиков систем управления семантическим контентом: University of Paderborn (Университет Падерборна) Центр по исследованиям и разработке программного обеспечения при Ближневосточном Техническом университете

EURпейский союз

6,58 млн. EUR - доля Европейского Союза в субсидировании

http://www.iks-project.eu/ http://www.iks-project.eu/academy/storing-and-accessing-semantic-data