41
De l'intelligence dans les données ouvertes Mathieu d’Aquin (@mdaquin) Knowledge Media Institute, The Open University, UK Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Embed Size (px)

DESCRIPTION

Presentation a la matinee Donnees Ouverte LIRMM - Montpellier - 28/11/2013 Presentation at the Open Data workshop LIRMM http://odrg.lirmm.fr/index.php/event-details?id=14

Citation preview

Page 1: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

De l'intelligence dans les données ouvertes

Mathieu d’Aquin (@mdaquin) Knowledge Media Institute,

The Open University, UK

Problèmes et solutions dans les domaines

l’enseignement et de la gestion des données personnelles

Page 2: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

De l'intelligence dans les données ouvertes

Mathieu d’Aquin (@mdaquin) Knowledge Media Institute,

The Open University, UK

Problèmes et solutions dans les domaines

l’enseignement et de la gestion des données personnelles

Intelligence artificielle fouille

de données, raisonnement,

gestion des connaissances

Pas importe lesquelles,

On préfère les données web

Données web ouvertes comme solutions

au problèmes (nouveaux et anciens)

Parce que l’ouverture du web et des

données génère de nouveaux problèmes Ca, c’est moi

Un endroit intéressant

Page 3: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Primaire

Secondaire

Université

Pourquoi l’enseignement? L’éducation, avant

(en simplifiant beaucoup)

Page 4: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Primaire

Secondaire

Universities

Maintenant… (Et on simplifie toujours)

Autre institutions avec des cours en ligne

Open Universities

coursera

e d X

UDACITY

MIT

OCW

OpenLearn

MOOCs

et OER

Page 5: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Siri, I want to become a

professional photographer.

What should I do?

“I want to be a photographer,

what should I do?”

I found this Open University

course (T189), that you can

enrolled to in the regional centre

2 miles from here (cost £427).

“OK, anything free I can try

first?”

There is an Introduction to

Photography course on MIT

OCW, and a Computational

Photography course on coursera

starting soon.

Page 6: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Besoin de données ouvertes, partagées et

intégrées de toutes ces sources (linked data…)

coursera

e d X

UDACITY

MIT

OCW

OpenLearn

courses

courses

courses

requirements requirements

topics

topics

topics

topics

learning

outcomes learning

outcomes

learning

outcomes locations

locations

results results

results

assessment

http://linkedup-project.eu

http://linkeduniversities.org

Page 7: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Exemple: L’Open University

L’Open University: – La plus grosse université du

royaume uni: 250K étudiants par an, 8000 enseignants, un gros campus a Milton Keynes

– Crée en 1969

– Presque entièrement fondée sur l’enseignement a distance

– 13 centre régionaux, plus les centres nationaux

– Cours disponibles dans plusieurs dizaines de pays

Partager, transmettre, connecter l’information (publique!): un calvaire

Page 8: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

data.open.ac.uk

La première plateforme linked data provenant de

et utilisée par l’ensemble d’une université

Page 9: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Plein de (catégories) de données

Course information: 580 modules/ description of the course, information about the levels and number of

credits associated with it, topics, and conditions of enrolment.

Research publications: 16,000 academic articles / information about authors, dates, abstract and venue of the

publication.

Podcasts: 2220 video podcasts and 1500 audio podcats / short description, topics, link to a

representative image and to a transscript if available, information about the course the

podcast might relate to and license information regarding the content of the podcast.

Open Educational Resources: 640 OpenLearn Units / short description, topics, tags used to annotate the resource,

its language, the course it might relate to, and the license that applies to the content.

Youtube videos: 900 videos / short description of the video, tags that were used to annotate the video,

collection it might be part of and link to the related course if relevant.

University buildings: 100 buildings / address, a picture of the building and the sub-divisions of the building

into floors and spaces.

Library catalogue: 12,000 books/ topics, authors, publisher and ISBN, as well as the course related.

Others…

Page 10: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Mais que faire? (applications)

Découverte

de ressources

Recherche

Exploration

Social

Page 11: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Exemple (super simple)

Carte interactive des bâtiments de l’Open University en Angleterre

Page 12: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Espaces

Etages

ID Address Code postal

Bâtiments

bat1

bat1-address

Postcode-mk76aa

name “Berrill building”

data.open.ac.uk

Milton Keynes

inDistrict

Buckinghamshire

inCounty

Mk76aa-location

location

lat long

52.024924 -0.709726

data.ordnancesurvey.co.uk

Page 13: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Pourquoi les données ouvertes/pourquoi en linked data.

Exemple en dehors de l’Open University

“Unistats, which incorporates the KIS, provides course level information on all undergraduate higher education courses provided in the UK, which are of at least one year’s duration and consist of 120 or more credits of study” [1]

« Données ouvertes » incluant des statistiques sur les taux de réussite aux diplômes universitaires dans les différents institutions anglaises, sur la poursuite d’étude et le recrutement des étudiants.

[1] http://www.hesa.ac.uk/includes/C13061_resources/Unistats_checkdoc_definitions.pdf?v=1.12

Page 14: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Le genre de chose que

l’ont peut faire avec

ces données.

Page 15: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Mais…

Page 16: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

… pour construire cette application

Il faut accepter les termes et conditions (click), télécharger le fichier zip, décompresser, mettre le xml dans ca propre DB, et finalement, construire l’appli.

Fournir les données en linked data avec SPARQL c’est faire tout ca une fois, pour tout le monde.

http://data.linkededucation.org/linkedup/catalog/browse/

Page 17: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

90 lignes de HTML/Javascript,

écrites en 2-3 heures

select distinct ?course ?label ?link ?perc where {

?o <http://purl.org/linked-data/cube#dataSet>

<http://data.linkedu.eu/kis/dataset/commonJobs>.

?o <http://data.linkedu.eu/kis/ontology/job>

<http://data.linkedu.eu/kis/job/354>.

?o <http://data.linkedu.eu/kis/ontology/course>

?course.

?course <http://purl.org/dc/terms/title> ?label.

?course

<http://data.linkedu.eu/kis/ontology/courseUrl>

?link.

?o

<http://data.linkedu.eu/kis/ontology/percentage>

?perc.

filter ( ?perc > 0 )

} order by desc(?perc)

Avec cette requête SPARQL

Page 18: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Pourquoi les données ouvertes/pourquoi en linked data.

Exemple entre l’Open University et la BBC

Page 19: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles
Page 20: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

data.open.ac.uk

Semantic

Indexing

Semantic Index

Named Entity

Recognition

Podcasts, OpenLearn

Units and Articles

Semantic Entities

(Dbpedia)

Indexes

BBC Programme or iPlayer page

Synopsis

Similarity-

Based Search

Indexes

Interface

Resource

descriptions

Resources URIs +

common topics

d'Aquin, M., Allocca, C. and Collins, T. (2012) DiscOU: A Flexible Discovery Engine for Open

Educational Resources Using Semantic Indexing and Relationship Summaries, Demo ISWC 2012

Page 21: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

API/Service

Interface

(Javascript)

Injected with bookmarklet

Named Entity

Recognition Indexing

Similarity

Search

Common Topic

Extraction

Programme

URI

Scored

semantic

entities

Prg. URI &

Res. URI

Common Sem. Entity

Scored sem.

Entities & Prg

URI

Prg. URI

Resource

URIS

Page 22: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

La même chose, avec juste du texte

(discou.info/alfa)

Page 23: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Et encore, avec du matériel de cours

propriétaire (ouvert + fermé)

Page 24: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Amener plus d’intelligence Learning Analytics avec des connaissances du domaine

Web logs or

application

logs

Web logs or

application

logs

Web logs or

application

logs

Generic

Ontology of

events,

resources

and actions

Domain

specific

extension

ontology (=

background

knowledge)

Analytics

with

domain

specific

filters,

views and

reasoning

Page 25: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Moodle analytics a la NHS

Page 26: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Amener plus d’intelligence Learning Analytics avec de la fouille de données (ouvertes/web)

d'Aquin, M. and Jay, N. (2013) Interpreting Data Mining Results with Linked Data for Learning

Analytics: Motivation, Case Study and Direction, LAK 2013

Page 27: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Un autre exemple: Données publiques/privées/personnelles, besoin de pus de données,

besoin de connaissances

Classification des

régions du royaume

uni en accord avec les

sujets d’intérêts

d’après l’inscription

aux cours des

étudiants de l’Open

University

Comment expliquer

ces groupes?

Solution actuellement explorée : La programmation logique inductive combinée

avec le parcours du linked open data graph

Tiddi, I., d'Aquin, M. and Motta, E.Explaining Clusters with Inductive Logic Programming and Linked Data, Poster at ISWC 2013,

Page 28: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

De l’analyse intelligente de données ouvertes a la

gestion de l’information personnelle

L’information personnelle a une place particulière

Rarement données ouverte

Utiliser pour améliorer les processus de l’organisation

Rarement disponible pour les utilisateurs

Et si les données personnelles était ouvertes au utilisateurs qui les génèrent

Page 29: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Exemple:

MOLUTI Personal Analytics in the browser

http://moluti.com

Page 30: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Exemple: UCIAD personal analytics dashboard

Tableaux de bord de mes (étudiants, enseignants, etc.) activités sur les sites de l’Open University

Implication pour la gestion des données privées

Implication pour l’intégration de données

d'Aquin, Elahi, Motta. Semantic technologies to support the user-centric analysis of activity data. SDoW 2011 at ISWC 2011

Thomas and d'Aquin. On the privacy implications of releasing consumer activity data. KMi Tech. Report kmi-13-02, 2013.

http://uciad.info

Page 31: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Des situations de plus en plus complexes qui nécessitent des

raisonnements de plus en plus complexes

Page 32: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Facebook

graph API

Basic

linked data

Facebook

Ontology

Ontological

inference

(types,

relations)

Epistemic

logic theory

of Facebook

Epistemic

inference

(who knows

what)

Page 33: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Facebook Ontology (extract)

Person Post

Photo

Video

Status

update Comment

Agent

App

subclass

author

likes

includes

subclass

author on

Place

in

{Everyone, Friends_of_Friends, All_Friends, Custom}

scope

Page 34: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Example epistemic rules

Ka Post(X) :- author(X, a)

Ka Post(X) :- scope(X, All_Friends), author(X, Y), friend(Y, a)

Ka Post(X) :- includes(X,Y), friend(Y, a)

Ka wasIn(P, Y) :- includes(X,Y), in(X,P), Ka Post(X)

Ka wasWith (Y,Z) :- includes(X, Y), include(X,Z), Ka Post(X)

Page 35: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

d'Aquin, Thomas. Modeling and reasoning upon facebook privacy settings. Demo at ISWC 2013

Page 36: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

http://youtu.be/iFocaRtLdQg

Page 37: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Conclusion

Un retour au web sémantique?

Besoin en traitement intelligent de l’information de plus en plus présent

Réconcilier les approches “raw data” avec la modélisation, l’extraction et le manipulation de la connaissance.

Page 38: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Check out:

Linkeduniversities.org

Linkedup-project.eu

linkedup-challenge.org

data.linkededucation.org/linkedup/catalog

data.linkededucation.org/linkedup/devtalk semprivacy.com

mksmart.org

Page 39: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Un peu d’intégration

Ref privon

Page 40: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Datami

http://datami.co.uk

Page 41: De l'intelligence dans les données ouvertes - Problèmes et solutions dans les domaines l’enseignement et de la gestion des données personnelles

Trust in

websites

Sensitivity

of data

d'Aquin, Elahi, Motta. Semantic monitoring of personal web activity to support the management of trust and

privacy. SPOT 2010 at ESWC 2010

Un peu d’intelligence