102
Открытые базы знаний и семантические вики Катков Юрий, WikiVote! 1

школа открытых данны. открытые базы знаний и семантические вики

Embed Size (px)

Citation preview

Page 1: школа открытых данны. открытые базы знаний и семантические вики

1

Открытые базы знаний и

семантические викиКатков Юрий, WikiVote!

Page 2: школа открытых данны. открытые базы знаний и семантические вики

2

Содержание

• Linked Open Data и Semantic Web• Стандарты LOD• Основные базы знаний и примеры использования• Dbpedia• Мастер-класс по Dbpedia

Page 3: школа открытых данны. открытые базы знаний и семантические вики

3

Semantic web и Linked DataОсновные стандарты

Page 4: школа открытых данны. открытые базы знаний и семантические вики

4

Linked Open Data и Semantic Web

• Открытые базы знаний являются частью направления Semantic Web

• Ядром Semantic Web являются стандарты• Объект стандартизации – способ представления и обмена

данными• Linked Data использует только часть стандартов Semantic Web

Page 5: школа открытых данны. открытые базы знаний и семантические вики

5

Сл

оен

ый

пи

рог

SW

Page 6: школа открытых данны. открытые базы знаний и семантические вики

6

Сл

оен

ый

пи

рог

SW

Page 7: школа открытых данны. открытые базы знаний и семантические вики

7

URIUniform Resource Identifier

служит для однозначного именования

сущностей

основное правило: не существует двух объектов с одинаковыми URI

URL – частный случай URI

Page 8: школа открытых данны. открытые базы знаний и семантические вики

8

Сл

оен

ый

пи

рог

SW

Page 9: школа открытых данны. открытые базы знаний и семантические вики

9

позволяет представлять данные в виде троек, формируя граф данных

( subject , predicate , object )

RDF

Page 10: школа открытых данны. открытые базы знаний и семантические вики

10

позволяет представлять данные в виде троек, формируя граф данных

( subject , predicate , object )

RDF

URI URI URI или литерал

Page 11: школа открытых данны. открытые базы знаний и семантические вики

11

Леонардо место_рождения ВинчиЛеонардо дата_рождения 15.04.1452

Леонардо да Винчи родился в городе Винчи 15 апреля 1452 года

<http://ex.org/Leo> <http://ex.org/birthDate>

<http://ex.org/Vinci>

"1452-04-15"^^xsd:date

<http://ex.org/Leo> <http://ex.org/birthPlace>

Page 12: школа открытых данны. открытые базы знаний и семантические вики

12

позволяет представлять данные в виде троек, формируя граф данных

( subject , predicate , object )

RDF

вершина ребро вершина

Page 13: школа открытых данны. открытые базы знаний и семантические вики

13

Графовая модель удобна и гибка

Page 14: школа открытых данны. открытые базы знаний и семантические вики

14

Графовая модель удобна и гибка

Page 15: школа открытых данны. открытые базы знаний и семантические вики

15

Графовая модель удобна и гибка

Page 16: школа открытых данны. открытые базы знаний и семантические вики

16

Графовая модель удобна и гибка

Page 17: школа открытых данны. открытые базы знаний и семантические вики

17

RDF имеет несколько способов записи

Page 18: школа открытых данны. открытые базы знаний и семантические вики

18

RDF имеет несколько способов записи

Turtle

N-triplesN3

Page 19: школа открытых данны. открытые базы знаний и семантические вики

19

@prefix xsd: <http://www.w3.org/2001/XMLSchema#> . @prefix ex: <http://ex.org/> .

ex:Leo ex:birthDate "1452-04-15"^^xsd:date . ex:Leo ex:birthPlace ex:Vinci .

Page 20: школа открытых данны. открытые базы знаний и семантические вики

20

RDF имеет несколько способов записи

Turtle

N-triplesN3

XMLJSON

Page 21: школа открытых данны. открытые базы знаний и семантические вики

21

<?xml version="1.0"?> <rdf:RDF

xmlns:xsd="http://www.w3.org/2001/XMLSchema#" xmlns:ex="http://ex.org/" xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">

<rdf:Description rdf:about="http://ex.org/Leo"> <ex:birthDate rdf:datatype = "http://www.w3.org/2001/XMLSchema#date">1452-04-15 </ex:birthDate>

<ex:birthPlace rdf:resource="http://ex.org/Vinci" /> </rdf:Description>

</rdf:RDF>

Page 22: школа открытых данны. открытые базы знаний и семантические вики

22

Сл

оен

ый

пи

рог

SW

Page 23: школа открытых данны. открытые базы знаний и семантические вики

23

RDFS и OWLСтандарты для создания структурированных словарей

Page 24: школа открытых данны. открытые базы знаний и семантические вики

24

RDFS и OWLСтандарты для создания структурированных словарей

КРАТКО

Page 25: школа открытых данны. открытые базы знаний и семантические вики

25

RDFS и OWLСтандарты для создания структурированных словарей

Page 26: школа открытых данны. открытые базы знаний и семантические вики

26

RDFS и OWLСтандарты для создания

структурированных словарей

Page 27: школа открытых данны. открытые базы знаний и семантические вики

27

RDFS и OWLСтандарты для создания

структурированных словарей

классификаций

Page 28: школа открытых данны. открытые базы знаний и семантические вики

28

RDFS и OWLСтандарты для создания

структурированных словарей

глоссариев

классификаций

Page 29: школа открытых данны. открытые базы знаний и семантические вики

29

RDFS и OWLСтандарты для создания

структурированных словарей

глоссариев

классификацийтезаурусов

Page 30: школа открытых данны. открытые базы знаний и семантические вики

30

RDFS и OWLСтандарты для создания

структурированных словарей

глоссариев

классификаций

тематических карт

тезаурусов

Page 31: школа открытых данны. открытые базы знаний и семантические вики

31

RDFS и OWLСтандарты для создания

структурированных словарей

глоссариев

таксономий

классификаций

тематических карт

тезаурусов

Page 32: школа открытых данны. открытые базы знаний и семантические вики

32

RDFS и OWLСтандарты для создания

структурированных словарей

глоссариев

таксономий

классификаций

тематических карт

тезаурусов

семантических сетей

Page 33: школа открытых данны. открытые базы знаний и семантические вики

33

RDFS и OWLСтандарты для создания

структурированных словарей

глоссариев

таксономий

классификаций

тематических карт

тезаурусов

семантических сетей

схем данных

Page 34: школа открытых данны. открытые базы знаний и семантические вики

34

RDFS и OWLСтандарты для создания

структурированных словарей

глоссариев

таксономий

классификаций

тематических карт

тезаурусов

семантических сетей

схем данных

TBox

Page 35: школа открытых данны. открытые базы знаний и семантические вики

35

RDFS и OWLСтандарты для создания

структурированных словарей

онтологий

схем данных

глоссариевсемантических сетей

таксономий

классификаций

тематических карт

тезаурусов

TBox

Page 36: школа открытых данны. открытые базы знаний и семантические вики

36

ЗАЧЕМ НУЖНЫ

Структурированные словари

онтологии

схемы данных

глоссариисемантические сети

таксономии

классификации

тематические карты

тезаурусы

TBox

Page 37: школа открытых данны. открытые базы знаний и семантические вики

37

Онтологии нужны для

Page 38: школа открытых данны. открытые базы знаний и семантические вики

38

стандартизациитерминологии

Онтологии нужны для

Предложение: связь национальностьБудем всегда называть терминомhttp://dbpedia.org/property/nationality« »

Page 39: школа открытых данны. открытые базы знаний и семантические вики

39

стандартизациитерминологии

автоматического обогащения данных

Онтологии нужны для

Предложение: связь национальностьБудем всегда называть терминомhttp://dbpedia.org/property/nationality« »

Любой, кто имеет свойствонациональность, является

человеком, а его национальностьявляется страной. А страна – это

частный случай населенного места« »

Давайте, если говорим о Леонардо даВинчи, будем всегда пользоваться его идентификатором в Dbpedia« »

Page 40: школа открытых данны. открытые базы знаний и семантические вики

40

Автоматическое обогащение данных

Page 41: школа открытых данны. открытые базы знаний и семантические вики

41

Автоматическое обогащение данных

Page 42: школа открытых данны. открытые базы знаний и семантические вики

42

Автоматическое обогащение данных

Page 43: школа открытых данны. открытые базы знаний и семантические вики

43

Автоматическое обогащение данных

Page 44: школа открытых данны. открытые базы знаний и семантические вики

44

Автоматическое обогащение данных

Page 45: школа открытых данны. открытые базы знаний и семантические вики

45

Автоматическое обогащение данных

Page 46: школа открытых данны. открытые базы знаний и семантические вики

46

Сл

оен

ый

пи

рог

SW

Page 47: школа открытых данны. открытые базы знаний и семантические вики

47

SPARQLЗапросы к RDF-данным

Page 48: школа открытых данны. открытые базы знаний и семантические вики

48

SPARQLSPARQL Protocol and RDF Query Language

Page 49: школа открытых данны. открытые базы знаний и семантические вики

49

PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>

SELECT * WHERE { ?a rdf:type dbpedia-owl:Company . } LIMIT 100OFFSET 300

Выполняем на dbpedia.org/sparql

Page 50: школа открытых данны. открытые базы знаний и семантические вики

50

Page 51: школа открытых данны. открытые базы знаний и семантические вики

51

?a rdf:type dbpedia-owl:Company

Запрос:

Page 52: школа открытых данны. открытые базы знаний и семантические вики

52

?a rdf:type dbpedia-owl:Company

Запрос:

Page 53: школа открытых данны. открытые базы знаний и семантические вики

53

Открытые базы знанийОбзор состава данных Linked dataПрименение в реальных приложениях

Page 54: школа открытых данны. открытые базы знаний и семантические вики

54

Page 55: школа открытых данны. открытые базы знаний и семантические вики

55

Page 56: школа открытых данны. открытые базы знаний и семантические вики

56

Page 57: школа открытых данны. открытые базы знаний и семантические вики

57

Page 58: школа открытых данны. открытые базы знаний и семантические вики

58

Page 59: школа открытых данны. открытые базы знаний и семантические вики

59

Page 60: школа открытых данны. открытые базы знаний и семантические вики

60

Page 61: школа открытых данны. открытые базы знаний и семантические вики

61

Page 62: школа открытых данны. открытые базы знаний и семантические вики

62

Откуда берутся дети?данные

Page 63: школа открытых данны. открытые базы знаний и семантические вики

63

Откуда берутся дети?данные

Их специально

создают

научные группы

Page 64: школа открытых данны. открытые базы знаний и семантические вики

64

Откуда берутся дети?данные

Их специально

создают

научные группы

Их публикуюткоммерческиефирмы

Page 65: школа открытых данны. открытые базы знаний и семантические вики

65

Откуда берутся дети?данные

Их специально

создают

научные группы

Их публикуюткоммерческиефирмы

они генерируютсяпо требованию

FOAF

DOAP

RDFizers

exporters

SIOC

Page 66: школа открытых данны. открытые базы знаний и семантические вики

66

Linked Data consumption

Page 67: школа открытых данны. открытые базы знаний и семантические вики

67

Для чего нужны данные

Их можноанализировать

На их основе можно строить

приложения для конечного

пользователя

На их основе можно строить

приложения не для конечногопользователя

Они могут быть частью

логики системы

(базой знаний в смысле ЭС)

Page 68: школа открытых данны. открытые базы знаний и семантические вики

68

На их основе можно строить

приложения для конечного

пользователя

Открытые гос. данные

Данные о фильмахЭнциклопедические данные

Данные о музыке

Page 69: школа открытых данны. открытые базы знаний и семантические вики

69

Для чего нужны данные

Их можноанализировать

На их основе можно строить

приложения для конечного

пользователя

На их основе можно строить

приложения не для конечногопользователя

Они могут быть частью

логики системы

(базой знаний в смысле ЭС)

Page 70: школа открытых данны. открытые базы знаний и семантические вики

70

Усиление алгоритмов мат.лингвистики

На их основе можно строить

приложения не для конечногопользователя

Рекомендационные системы

Page 71: школа открытых данны. открытые базы знаний и семантические вики

71

Для чего нужны данные

Их можноанализировать

На их основе можно строить

приложения для конечного

пользователя

На их основе можно строить

приложения не для конечногопользователя

Они могут быть частью

логики системы

(базой знаний в смысле ЭС)

Page 72: школа открытых данны. открытые базы знаний и семантические вики

72

Их можноанализировать

Data journalism

Eurostat

Открытые гос.данные

Page 73: школа открытых данны. открытые базы знаний и семантические вики

73

Для чего нужны данные

Их можноанализировать

На их основе можно строить

приложения для конечного

пользователя

На их основе можно строить

приложения не для конечногопользователя

Они могут быть частью

логики системы

(базой знаний в смысле ЭС)

Page 74: школа открытых данны. открытые базы знаний и семантические вики

74

Они могут быть частью

логики системы

(базой знаний в смысле ЭС)

Pubmed

GALEN

SNOMED-CT

Page 75: школа открытых данны. открытые базы знаний и семантические вики

75

Для чего нужны данные

Их можноанализировать

На их основе можно строить

приложения для конечного

пользователя

На их основе можно строить

приложения не для конечногопользователя

Они могут быть частью

логики системы

(базой знаний в смысле ЭС)

Page 76: школа открытых данны. открытые базы знаний и семантические вики

76

Как искать данные

Общаться

Смотреть каталоги Смотреть визуализации

Искать как текст

Mailing lists

Q&Aфорумы

CKAN

Swoogle

Sig.ma Sindice

Page 77: школа открытых данны. открытые базы знаний и семантические вики

77

Page 78: школа открытых данны. открытые базы знаний и семантические вики

78

Как знакомиться с данными

Пробные

SPARQL-запросы Смотреть визуализации

Погулять по датасетуCKAN descriptions Sig.ma

Посмотреть метаданные

MarblesVoiD

Semantic Sitemap

LinksailorПосмотреть статистику

Page 79: школа открытых данны. открытые базы знаний и семантические вики

79

http://freebase.com/

Page 80: школа открытых данны. открытые базы знаний и семантические вики

80

http://mappings.dbpedia.org/server/statistics/ru/

Page 81: школа открытых данны. открытые базы знаний и семантические вики

81

Пробные SPARQL-запросыSELECT DISTINCT ?p WHERE { ?s ?p ?o .} LIMIT 1000

Page 82: школа открытых данны. открытые базы знаний и семантические вики

Прагматическое введение в Linked Data 82

Пробные SPARQL-запросы

16.03.2012

SELECT ?p (COUNT ?p as ?countPredicate) WHERE { ?s ?p ?o}GROUP BY ?pORDER BY DESC (?countPredicate)LIMIT 100

Page 83: школа открытых данны. открытые базы знаний и семантические вики

83

Повсеместно используемые термины

rdf:typeskos:Concept

rdfs:Class

rdfs:subClassOf

owl:Class

rdfs:label

owl:sameAs

a

Page 84: школа открытых данны. открытые базы знаний и семантические вики

84

Очень частые термины

foaf:name dc:subject

rdfs:domain

rdfs:rangeskos:related

Page 85: школа открытых данны. открытые базы знаний и семантические вики
Page 86: школа открытых данны. открытые базы знаний и семантические вики
Page 87: школа открытых данны. открытые базы знаний и семантические вики
Page 88: школа открытых данны. открытые базы знаний и семантические вики
Page 89: школа открытых данны. открытые базы знаний и семантические вики
Page 90: школа открытых данны. открытые базы знаний и семантические вики
Page 91: школа открытых данны. открытые базы знаний и семантические вики
Page 92: школа открытых данны. открытые базы знаний и семантические вики

http://dbpedia.org/sparql

Page 93: школа открытых данны. открытые базы знаний и семантические вики

93

SELECT * WHERE { ?a <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://dbpedia.org/ontology/Company> . } LIMIT 100

Page 94: школа открытых данны. открытые базы знаний и семантические вики

94

PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dbpedia-owl: <http://dbpedia.org/ontology/>

SELECT * WHERE { ?a rdf:type dbpedia-owl:Company . } LIMIT 100

Page 95: школа открытых данны. открытые базы знаний и семантические вики

95

SELECT * WHERE { ?a rdf:type dbpedia-owl:Company . } LIMIT 100

Page 96: школа открытых данны. открытые базы знаний и семантические вики

96

SELECT * WHERE{ ?a rdf:type dbpedia-owl:Company . ?a dbpprop:companyName ?corporation .}LIMIT 100

Page 97: школа открытых данны. открытые базы знаний и семантические вики

97

SELECT * WHERE{

?a rdf:type dbpedia-owl:Company ; dbpprop:companyName ?corporation .}LIMIT 100

Page 98: школа открытых данны. открытые базы знаний и семантические вики

98

SELECT * WHERE{ ?companyURL rdf:type dbpedia-owl:Company ; dbpprop:companyName ?corporation ; dbpedia-owl:foundedBy ?founderURL . }LIMIT 100

Page 99: школа открытых данны. открытые базы знаний и семантические вики

99

SELECT * WHERE{ ?companyURL rdf:type dbpedia-owl:Company; dbpprop:companyName ?corporation ; dbpedia-owl:foundedBy ?founderURL . ?founderURL rdf:type dbpedia-owl:Artist .}LIMIT 100

Page 100: школа открытых данны. открытые базы знаний и семантические вики

100

SELECT * WHERE{ ?companyURL rdf:type dbpedia-owl:Company ; dbpprop:companyName ?corporation ; dbpedia-owl:foundedBy ?founderURL . { ?founderURL rdf:type dbpedia-owl:Artist. } UNION { ?founderURL rdf:type dbpedia-owl:Actor. } UNION { ?founderURL rdf:type dbpedia-owl:MartialArtist. } UNION { ?founderURL dbpedia-owl:occupation dbpedia:Martial_arts.} }LIMIT 100

Page 101: школа открытых данны. открытые базы знаний и семантические вики

101

SELECT * WHERE{ ?companyURL rdf:type dbpedia-owl:Company ; dbpprop:companyName ?corporation ; dbpedia-owl:foundedBy ?founderURL . ?founderURL rdf:type dbpedia-owl:Artist ; rdf:type dbpedia-owl:Actor ; rdf:type dbpedia-owl:MartialArtist ; dbpedia-owl:occupation dbpedia:Martial_arts .}LIMIT 100

Page 102: школа открытых данны. открытые базы знаний и семантические вики

102

SELECT * WHERE{ ?companyURL rdf:type dbpedia-owl:Company ; dbpprop:companyName ?corporation ; dbpedia-owl:foundedBy ?founderURL . ?founderURL dbpedia-owl:birthDate ?founderBirth . FILTER (?founderBirth > "1940-03-10"^^xsd:date ) . { ?founderURL rdf:type dbpedia-owl:Artist. } UNION { ?founderURL rdf:type dbpedia-owl:Actor. } UNION { ?founderURL rdf:type dbpedia-owl:MartialArtist. } UNION { ?founderURL dbpedia-owl:occupation dbpedia:Martial_arts.}}LIMIT 100