Upload
eudo-blin
View
109
Download
1
Embed Size (px)
Citation preview
Projet ORI-OAIOutil de Référencement et d’IndexationRéseau de portails OAI
Réunion techniqueParis, 20 et 21 juin 2007
Paris, 20 et 21 juin 2007 Réunion technique 2
Fonctionnalités de la version 2 (et autres …)Fonctionnalités de la version 2 (et autres …)
A étudier rapidement pour éventuelle mise en place en V2
Poids pour la V2: plus fort au plus faible
On est capable, mais à voir selon les besoins
Pas dans la V2 car pas mûr à ce jour
Paris, 20 et 21 juin 2007 Réunion technique 3
Moteur de workflow: ori-oai-workflow
Workflow-spring Formulaire spécifique aux versions/relations LOM
(et autres formats ?). Idée de METS / FRBR ? Gestion de plusieurs fiches de MD. Ex: une fiche
TEF initialise une fiche LOM avec les champs communs, et ensuite il faut compléter les critères pédagogiques
Dépôt et saisie des droits sur les ressources (WebDAV)
Droits informés dans les MD (METS ?) Côté ORI-OAI :
étude/modifications/documentation d'un protocole de communication avec Moodle, Scenari, Hal, Chainedit, Claroline, et autres ... (suivant les besoins exprimés) WS du frontal
Paris, 20 et 21 juin 2007 Réunion technique 4
Moteur de workflow: ori-oai-workflow
Workflow-spring Migration des fiches de MD dans un autre format /
Possibilité de décliner la description d'une même ressource en plusieurs formats. Ex: passer de LOM à LOM-fr quand il sera disponible
Interface d’administration des utilisateurs, rôles, permissions. On ne gère que les membres des rôles
Faire de la recherche de fiches depuis le Workflow Suivant la faisabilité : intégration du workflow dans l'IHM
du Search ( un seul et même outil ...) Plus d'ergonomie, plus rapide car basé sur un index, tri, etc. Intégration technique, technologies différentes
Paris, 20 et 21 juin 2007 Réunion technique 5
Moteur de workflow: ori-oai-workflow
Workflow-spring Plusieurs modèles de templates par format
Au moment de la création d’une fiche, on choisit ou non un de ces templates
Support d’un LDAP autre que supann (AD par ex.)
Dans la partie profil, ajouter des propriétés Langue par défaut de tous les champs Le champ auteur est rempli automatiquement car identifié Etc. à spécifier clairement
Afficher en parallèle le formulaire et le rendu de cette fiche de MD
Ajout de conditions et fonctions suivant les besoins exprimés
Paris, 20 et 21 juin 2007 Réunion technique 6
Moteur de workflow: ori-oai-workflow
MD-editor Amélioration de la signalisation des erreurs Amélioration des champs obligatoires Quand champs répétables, ne pas proposer un
champ déjà sélectionné. Ex.: la langue: ne pas montrer “français” si déjà sélectionné
Auto-complétion (modifier widget créé par Orbéon ?)
Défilement sans se limiter à 10 Sélection avec la souris dans la liste
Paris, 20 et 21 juin 2007 Réunion technique 7
Moteur de workflow: ori-oai-workflow
MD-editor LOM-fr (suivant sa disponibilité) Déclinaison des Xforms LOM en lom-bib et autres
lom-bib: tout le LOM avec des “plier-déplier” Nouveaux formats supportés suivant les
demandes du groupe fonctionnel Autre financement ?
Classification UNIT limitée à 2 niveaux Ne la limiter à aucun nombre de niveaux
Traduction des mots en auto-complétion
Paris, 20 et 21 juin 2007 Réunion technique 8
Indexeur: ori-oai-indexing
Généraliser à Spring Indexation plein texte
PDF, PPT, DOC, etc. Problème des documents non publics
Crawler web (ou établissement fournit son plein texte) Trouver le bon lien vers le document visé Crawler intelligent
Définir plusieurs cas d’utilisation et de paramétrage (en fonction de l’entrepôt)
Est-ce que l’on indexe que les documents locaux en plein texte ou aussi les moissonnés ?
Renforcer la disponibilité du module indexing Se rendre indépendant des autres modules: mettre les
fiches aussi dans le module ?
Paris, 20 et 21 juin 2007 Réunion technique 9
Indexeur: ori-oai-indexing
Indexation des documents en différentes langues Utilisation d’un Analyzer à la fois Comment
indexer en anglais les documents en ? indexer en français les documents fr ?
Configuration des noms de MD encodés dans liusConfig.xml Ou on enlève de la config et le module calcule lui-même le
nom de MD Ou on a une interface graphique
Répartir les accès à l’index pour la montée en charge
Highlighting sur MD Highlighting sur document
Paris, 20 et 21 juin 2007 Réunion technique 10
Indexeur: ori-oai-indexing
Voir pour l’analyzer à utiliser Veut-on un analyzer qui retrouve « cheval » alors
qu’on a cherché sur « chevaux » ? Gestion de plusieurs indexes: le search dit
quel index il veut utiliser Ex: Gestion des langues: 1 index par langue et
repository ou workflow envoie la fiche et dit dans quelle langue elle est
On peut gérer plusieurs indexes, les sauvegarder indépendamment pour les refusionner en cas de problème
Paris, 20 et 21 juin 2007 Réunion technique 11
Indexeur: ori-oai-indexing
Remarques fonctionnelles: Indexation en texte intégral
Problèmes Lien vers la ressource disséminé dans une fiche de présentation
dans l’établissement PDF protégé non « indexable » PDF qui a des liens vers d’autres PDF Pas de droits en lecture
Solution peu évidente à étudier L’entrepôt OAI fournit en plus de la fiche de MD l’index plein
texte Permettrait de gérer les documents protégés Mettre en place un protocole d’échange TOUS les entrepôts OAI doivent être modifiés
Un index sur les MD et un index sur texte intégral ou fusion des 2 ?
Paris, 20 et 21 juin 2007 Réunion technique 12
Entrepôt OAI: ori-oai-repository
Requêtes Lucene diverses pour paramétrer les fiches à exposer en OAI
Documenter comment limiter des entrepôts à certains moissonneurs Filtrage IP Authentification
Interface d’administration
Paris, 20 et 21 juin 2007 Réunion technique 13
Moissonneur OAI: ori-oai-harvesting
Documenter comment protéger l’interface d’administration
Amélioration de l’interface d’administration Gérer ou bien documenter le bouton
« rafraîchir » Date à mettre à zéro lors de suppression d’une
récolte Spécifications à spécifier par les
spécificateurs
Paris, 20 et 21 juin 2007 Réunion technique 14
Moteur de recherche: ori-oai-search
Traduction des fichiers de messages RSS Problème de référencement dans Google
Enlever le jsessionid La première page est un forward
Créer le client XFire avec Spring et donner en paramètre l’URL du WS avec « ?WSDL »
Personnalisation des interfaces de recherche en portlet
Boutons radio, cases à cocher, etc. Autre mode de recherche thématique
(cases à cocher)
Paris, 20 et 21 juin 2007 Réunion technique 15
Moteur de recherche: ori-oai-search
Internationalisation des champs de recherche Ex: si on est en mode « en », on cherche sur le titre
LOM en anglais, et on affiche le titre anglais Rebond sur une nouvelle recherche par clic
sur un champ de résultat Montrer la requête dans la page de résultats
de la recherche avancée Enregistrement des recherches en portlet Internationalisation en portlet Highlighting sur MD
Voir les champs à afficher de cette façon
Paris, 20 et 21 juin 2007 Réunion technique 16
Moteur de recherche: ori-oai-search
Désactiver la remontée à la racine dans la recherche thématique dans certains cas quand on arrive dans la rech. Thématique depuis rebond d’une fiche de MD
Garder à court terme (session) les requêtes jouées pour les rejouer rapidement
Highlighting sur document Dans les résultats, quand on passe la souris sur un
nom d’auteur, afficher dans une bulle le rôle de cette personne dans la fiche LOM
Version PDF de la fiche imprimable Ajouter une config pour masquer des branches de
vocabulaires
Paris, 20 et 21 juin 2007 Réunion technique 17
Moteur de recherche: ori-oai-search
Opérateur booléen (à expliquer à Yohan !!!!!), etc. Ne proposer que les valeurs réellement indexées
dans les listes déroulantes de la recherche avancée Post-catégorisation des résultats
Affine les résultats Utiliser l’approximation (utilisation du ~ de Lucene)
Ou proposer comme Google les résultats plus retrouvés. Ex. je cherche chereux, le moteur de recherche me propose de plutôt prendre cheveux
Connexion et vision uniquement des documents auxquels j’ai droit
Interface d’administration ?
Paris, 20 et 21 juin 2007 Réunion technique 18
Gestionnaire de vocabulaires: ori-oai-vocabulary
VDEX (plat, hiérarchique) Optimiser le chargement de gros
vocabulaires Certains sont chargés au lancement du module et
sont cachés même après redémarrage. Ex: on ne recharge le vocabulaire LDAP que tous les 2 mois; etc.
Contrainte si le vocabulaire lance la génération depuis indexing au démarrage: indexing doit être lancé avant vocabulary
Proposer une solution d’éditeurs de vocabulaires locaux. Ex: XXE
Support du multilingue pour les vocabulaires récupérés via le moteur d'indexation
Paris, 20 et 21 juin 2007 Réunion technique 19
Gestionnaire de vocabulaires: ori-oai-vocabulary
Fonctionnalités globales Nouveaux référentiels suivant les nouveaux
formats supportés et besoins exprimés (Harpege ? Thésaurus de mots-clés ? etc.)
Interface d’administration générale
Paris, 20 et 21 juin 2007 Réunion technique 20
Serveur de stockage: ESUP-serveur-WebDAV
Consolidation du serveur Docs, tests, etc.
Amélioration des procédures d’installation Interface d’administration
Espaces persos Espaces spécifiques Groupes Règles de définition des groupes shibboleth
Possibilité de brancher les groupes LDAP par simple config
Passage à supann 2 Version quick-start
Paris, 20 et 21 juin 2007 Réunion technique 21
Généralités
Identifiants uniques Système ARK ? On référence une URL sous forme d’identifiant
unique Ex. ARK:http://foobar.zaf.org/ark:/12025/654xz321/s3/f8.05v.tiff\_______________/ \__/ \____/ \______/ \_________/
URL d’accès au document pérenne On référence une URL pérenne qui « pointe » vers
un document WebDAV ou autre Au moment du dépôt de la ressource, on fait le lien entre
l’URL pérenne et notre document WebDAV ou externe On peut lancer des routines toutes les nuits pour identifier
les liens morts Lors d’un renommage du document depuis le worflow, on
met à jour la correspondance entre l’URL pérenne et le lien réel
FRBR et EAP
Paris, 20 et 21 juin 2007 Réunion technique 22
Généralités
Mise à jour du site ori-oai-commons
Avec docs d’infos sur architecture, install globale ORI-OAI, doc. de Gilles, FAQ
Documenter comment protéger les accès à tous les WS
Cache intelligent sur tous les modules: si l’information distante n’est pas dispo, on garde le cache même expiré
Amélioration du packaging Uniformiser: incohérence entre les modules dans
Targets de déploiement ANT (deploy, all, all-servlet, …) Chemins deploy.home
Paris, 20 et 21 juin 2007 Réunion technique 23
Généralités
Statistiques De recherche
Côté ori-oai-search ? D’accès aux documents
Côté ESUP-serveur-WebDAV ou gestionnaire d’URL pérennes D’accès à l’application
Tous les modules ?
Gestion des commentaires pédagogiques dans le LOM Annotation des MD et des documents personnels et
partagés (plugin Firefox annozilla ? ) Gérer des références bibliographiques et les partager
Je crée ma liste que je diffuse avec informations et commentaires sur la ressource et la liste
Paris, 20 et 21 juin 2007 Réunion technique 24
Généralités
Favoris TOP 10 des ressources les plus demandées Enregistrer des propres favoris
Rendu cocoon inJAC JCR / Jackrabbit Connexion avec LMS
Moodle, etc. Projet CEPIA ?