Upload
mathieu-daquin
View
886
Download
1
Embed Size (px)
DESCRIPTION
Presentation a la matinee Donnees Ouverte LIRMM - Montpellier - 28/11/2013 Presentation at the Open Data workshop LIRMM http://odrg.lirmm.fr/index.php/event-details?id=14
Citation preview
De l'intelligence dans les données ouvertes
Mathieu d’Aquin (@mdaquin) Knowledge Media Institute,
The Open University, UK
Problèmes et solutions dans les domaines
l’enseignement et de la gestion des données personnelles
De l'intelligence dans les données ouvertes
Mathieu d’Aquin (@mdaquin) Knowledge Media Institute,
The Open University, UK
Problèmes et solutions dans les domaines
l’enseignement et de la gestion des données personnelles
Intelligence artificielle fouille
de données, raisonnement,
gestion des connaissances
Pas importe lesquelles,
On préfère les données web
Données web ouvertes comme solutions
au problèmes (nouveaux et anciens)
Parce que l’ouverture du web et des
données génère de nouveaux problèmes Ca, c’est moi
Un endroit intéressant
Primaire
Secondaire
Université
Pourquoi l’enseignement? L’éducation, avant
(en simplifiant beaucoup)
Primaire
Secondaire
Universities
Maintenant… (Et on simplifie toujours)
Autre institutions avec des cours en ligne
Open Universities
coursera
e d X
UDACITY
MIT
OCW
OpenLearn
MOOCs
et OER
Siri, I want to become a
professional photographer.
What should I do?
“I want to be a photographer,
what should I do?”
I found this Open University
course (T189), that you can
enrolled to in the regional centre
2 miles from here (cost £427).
“OK, anything free I can try
first?”
There is an Introduction to
Photography course on MIT
OCW, and a Computational
Photography course on coursera
starting soon.
Besoin de données ouvertes, partagées et
intégrées de toutes ces sources (linked data…)
coursera
e d X
UDACITY
MIT
OCW
OpenLearn
courses
courses
courses
requirements requirements
topics
topics
topics
topics
learning
outcomes learning
outcomes
learning
outcomes locations
locations
results results
results
assessment
http://linkedup-project.eu
http://linkeduniversities.org
Exemple: L’Open University
L’Open University: – La plus grosse université du
royaume uni: 250K étudiants par an, 8000 enseignants, un gros campus a Milton Keynes
– Crée en 1969
– Presque entièrement fondée sur l’enseignement a distance
– 13 centre régionaux, plus les centres nationaux
– Cours disponibles dans plusieurs dizaines de pays
Partager, transmettre, connecter l’information (publique!): un calvaire
data.open.ac.uk
La première plateforme linked data provenant de
et utilisée par l’ensemble d’une université
Plein de (catégories) de données
Course information: 580 modules/ description of the course, information about the levels and number of
credits associated with it, topics, and conditions of enrolment.
Research publications: 16,000 academic articles / information about authors, dates, abstract and venue of the
publication.
Podcasts: 2220 video podcasts and 1500 audio podcats / short description, topics, link to a
representative image and to a transscript if available, information about the course the
podcast might relate to and license information regarding the content of the podcast.
Open Educational Resources: 640 OpenLearn Units / short description, topics, tags used to annotate the resource,
its language, the course it might relate to, and the license that applies to the content.
Youtube videos: 900 videos / short description of the video, tags that were used to annotate the video,
collection it might be part of and link to the related course if relevant.
University buildings: 100 buildings / address, a picture of the building and the sub-divisions of the building
into floors and spaces.
Library catalogue: 12,000 books/ topics, authors, publisher and ISBN, as well as the course related.
Others…
Mais que faire? (applications)
Découverte
de ressources
Recherche
Exploration
Social
Exemple (super simple)
Carte interactive des bâtiments de l’Open University en Angleterre
Espaces
Etages
ID Address Code postal
Bâtiments
bat1
bat1-address
Postcode-mk76aa
name “Berrill building”
data.open.ac.uk
Milton Keynes
inDistrict
Buckinghamshire
inCounty
Mk76aa-location
location
lat long
52.024924 -0.709726
data.ordnancesurvey.co.uk
Pourquoi les données ouvertes/pourquoi en linked data.
Exemple en dehors de l’Open University
“Unistats, which incorporates the KIS, provides course level information on all undergraduate higher education courses provided in the UK, which are of at least one year’s duration and consist of 120 or more credits of study” [1]
« Données ouvertes » incluant des statistiques sur les taux de réussite aux diplômes universitaires dans les différents institutions anglaises, sur la poursuite d’étude et le recrutement des étudiants.
[1] http://www.hesa.ac.uk/includes/C13061_resources/Unistats_checkdoc_definitions.pdf?v=1.12
Le genre de chose que
l’ont peut faire avec
ces données.
Mais…
… pour construire cette application
Il faut accepter les termes et conditions (click), télécharger le fichier zip, décompresser, mettre le xml dans ca propre DB, et finalement, construire l’appli.
Fournir les données en linked data avec SPARQL c’est faire tout ca une fois, pour tout le monde.
http://data.linkededucation.org/linkedup/catalog/browse/
90 lignes de HTML/Javascript,
écrites en 2-3 heures
select distinct ?course ?label ?link ?perc where {
?o <http://purl.org/linked-data/cube#dataSet>
<http://data.linkedu.eu/kis/dataset/commonJobs>.
?o <http://data.linkedu.eu/kis/ontology/job>
<http://data.linkedu.eu/kis/job/354>.
?o <http://data.linkedu.eu/kis/ontology/course>
?course.
?course <http://purl.org/dc/terms/title> ?label.
?course
<http://data.linkedu.eu/kis/ontology/courseUrl>
?link.
?o
<http://data.linkedu.eu/kis/ontology/percentage>
?perc.
filter ( ?perc > 0 )
} order by desc(?perc)
Avec cette requête SPARQL
Pourquoi les données ouvertes/pourquoi en linked data.
Exemple entre l’Open University et la BBC
data.open.ac.uk
Semantic
Indexing
Semantic Index
Named Entity
Recognition
Podcasts, OpenLearn
Units and Articles
Semantic Entities
(Dbpedia)
Indexes
BBC Programme or iPlayer page
Synopsis
Similarity-
Based Search
Indexes
Interface
Resource
descriptions
Resources URIs +
common topics
d'Aquin, M., Allocca, C. and Collins, T. (2012) DiscOU: A Flexible Discovery Engine for Open
Educational Resources Using Semantic Indexing and Relationship Summaries, Demo ISWC 2012
API/Service
Interface
(Javascript)
Injected with bookmarklet
Named Entity
Recognition Indexing
Similarity
Search
Common Topic
Extraction
Programme
URI
Scored
semantic
entities
Prg. URI &
Res. URI
Common Sem. Entity
Scored sem.
Entities & Prg
URI
Prg. URI
Resource
URIS
La même chose, avec juste du texte
(discou.info/alfa)
Et encore, avec du matériel de cours
propriétaire (ouvert + fermé)
Amener plus d’intelligence Learning Analytics avec des connaissances du domaine
Web logs or
application
logs
Web logs or
application
logs
Web logs or
application
logs
Generic
Ontology of
events,
resources
and actions
Domain
specific
extension
ontology (=
background
knowledge)
Analytics
with
domain
specific
filters,
views and
reasoning
Moodle analytics a la NHS
Amener plus d’intelligence Learning Analytics avec de la fouille de données (ouvertes/web)
d'Aquin, M. and Jay, N. (2013) Interpreting Data Mining Results with Linked Data for Learning
Analytics: Motivation, Case Study and Direction, LAK 2013
Un autre exemple: Données publiques/privées/personnelles, besoin de pus de données,
besoin de connaissances
Classification des
régions du royaume
uni en accord avec les
sujets d’intérêts
d’après l’inscription
aux cours des
étudiants de l’Open
University
Comment expliquer
ces groupes?
Solution actuellement explorée : La programmation logique inductive combinée
avec le parcours du linked open data graph
Tiddi, I., d'Aquin, M. and Motta, E.Explaining Clusters with Inductive Logic Programming and Linked Data, Poster at ISWC 2013,
De l’analyse intelligente de données ouvertes a la
gestion de l’information personnelle
L’information personnelle a une place particulière
Rarement données ouverte
Utiliser pour améliorer les processus de l’organisation
Rarement disponible pour les utilisateurs
Et si les données personnelles était ouvertes au utilisateurs qui les génèrent
Exemple: UCIAD personal analytics dashboard
Tableaux de bord de mes (étudiants, enseignants, etc.) activités sur les sites de l’Open University
Implication pour la gestion des données privées
Implication pour l’intégration de données
d'Aquin, Elahi, Motta. Semantic technologies to support the user-centric analysis of activity data. SDoW 2011 at ISWC 2011
Thomas and d'Aquin. On the privacy implications of releasing consumer activity data. KMi Tech. Report kmi-13-02, 2013.
http://uciad.info
Des situations de plus en plus complexes qui nécessitent des
raisonnements de plus en plus complexes
graph API
Basic
linked data
Ontology
Ontological
inference
(types,
relations)
Epistemic
logic theory
of Facebook
Epistemic
inference
(who knows
what)
Facebook Ontology (extract)
Person Post
Photo
Video
Status
update Comment
Agent
App
subclass
author
likes
includes
subclass
author on
Place
in
{Everyone, Friends_of_Friends, All_Friends, Custom}
scope
Example epistemic rules
Ka Post(X) :- author(X, a)
Ka Post(X) :- scope(X, All_Friends), author(X, Y), friend(Y, a)
Ka Post(X) :- includes(X,Y), friend(Y, a)
Ka wasIn(P, Y) :- includes(X,Y), in(X,P), Ka Post(X)
Ka wasWith (Y,Z) :- includes(X, Y), include(X,Z), Ka Post(X)
d'Aquin, Thomas. Modeling and reasoning upon facebook privacy settings. Demo at ISWC 2013
Conclusion
Un retour au web sémantique?
Besoin en traitement intelligent de l’information de plus en plus présent
Réconcilier les approches “raw data” avec la modélisation, l’extraction et le manipulation de la connaissance.
Check out:
Linkeduniversities.org
Linkedup-project.eu
linkedup-challenge.org
data.linkededucation.org/linkedup/catalog
data.linkededucation.org/linkedup/devtalk semprivacy.com
mksmart.org
Un peu d’intégration
Ref privon
Trust in
websites
Sensitivity
of data
d'Aquin, Elahi, Motta. Semantic monitoring of personal web activity to support the management of trust and
privacy. SPOT 2010 at ESWC 2010
Un peu d’intelligence