30
La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad Complutense de Madrid Becario FPI Comunidad de Madrid

La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Embed Size (px)

Citation preview

Page 1: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

La Internet científica de libre acceso:

nuevos canales e iniciativas de publicación científica en archivos abiertos

José Ramón Pérez Agüera

Universidad Complutense de Madrid

Becario FPI Comunidad de Madrid

Page 2: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Sumario

1. Evolución de la publicación científica en Internet

2. La necesidad de una Web Semántica

3. La publicación científica en Internet y la Web Semántica

Page 3: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

1- Evolución de la publicación científica en

Internet

Page 4: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

La prensa científica

• La validez del conocimiento científico es inversamente proporcional al tiempo que tarda en difundirse y directamente proporcional al número de científicos que reciben este conocimiento.

• No se hace Ciencia si no se difunde ... rápidamente.

• Necesidad de difundir y de hacerlo lo antes posible

Page 5: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Internet: Herramienta de difusión científica I

• Desde finales de los 80 ya existe una infraestructura tecnológica usada para el intercambio de información científica entre universidades y centros de investigación

Page 6: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Internet: Herramienta de difusión científica II

• El Protocolo de transferencia de hipertexto (HTTP) fue creado en 1990 en el CERN (Laboratorio Europeo de Física de las Partículas), como un medio para compartir los datos científicos a nivel internacional, instantáneamente y a bajo costo.

Page 7: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Los archivos de e-prints

• En 1991 Paul Ginsparg, del Laboratorio Nacional de Los Alamos, Estados Unidos, funda el primer archivo de e-prints reconocido como tal, llamado arXiv.org y centrado en el campo de la Física.

Page 8: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

El concepto de pre-publicación

• Los repositorios de e-prints se establecen con el objetivo de comunicar a la comunidad científica los resultados de una investigación antes de su publicación en una revista.

• Se busca un menor tiempo de publicación

Page 9: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Algunos ejemplos de e-prints

• ArXiv.org: – http://www.arxiv.org/

• CogPrints: – http://cogprints.soton.ac.uk/

• NCSTRL: – http://www.ncstrl.org/

• NDLTD: – http://www.ndltd.org/

• RePEc: – http://netec.mcc.ac.uk/RePEc/

• Para ver más ejemplos:– http://www.osti.gov/eprints/ppnbrowse.html

Page 10: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

2- La necesidad de una Web Semántica

Page 11: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

El contexto en la Red

• Problemas de recuperación de información científica:– Entre el silencio y el ruido documental

• Del caos al orden• De la Web a la Web Semántica

Page 12: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

XML y los lenguajes de marcado

• Un sintaxis para la estructuración de documentos

• La información es analizable por el hombre y por la máquina

• Se trata de un esfuerzo global de la industria

Page 13: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Metadatos: Uso y necesidades

• Intercambio

• Distribución

• Interoperabilidad entre aplicaciones

Page 14: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

3- Publicación científica en Internet y Web Semántica

Page 15: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Archivos abiertos

• De los archivos abiertos a los archivos distribuidos

• De z39.50 a OAI-PMH:– complejidad frente a simplicidad– obsolescencia frente tecnologías punta– fuerte inversión frente a bajo coste

Page 16: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Algunos conceptos previos

• Archivo como repositorio de artículos científicos

• Harvesting como recolección de metadatos

• Proveedor de Datos (Data Provider) • Proveedor de Servicios (Services

Provider)• Interoperabilidad

Page 17: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Open Archives Initiative (OAI)

• El principal objetivo de OAI es facilitar un entorno de interoperabilidad entre los archivos de e-prints.

Page 18: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

OAI- Protocol Metadata Harvesting

• El protocolo OAI (OAI-PMH) define un mecanismo para recolectar metadatos contenidos en los distintos archivos o repositorios

Page 19: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Funcionamiento básico de OAI-PMH

•imagen extraída de http://www.oaforum.org

Page 20: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Estructura de OAI-PMH

•imagen extraída de http://www.oaforum.org

Page 21: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Arquitectura básica de OAI-PMH

SGBD 1

SCRIPTS SCRIPTS

SGBD 2

SQL

SQL

Data Provider Service Provider

OAI-PMH (XML) sobre HTTP

Petición por HTTP

Page 22: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Elementos a identificar

•imagen extraída de http://www.oaforum.org

Page 23: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Ejemplo I

•imagen extraída de http://www.oaforum.org

Page 24: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Ejemplo II

•imagen extraída de http://www.oaforum.org

Page 25: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

¿Como creamos un sistema basado en OAI-PMH?

• Existen múltiples implementaciones del protocolo

• Data Providers y Services Providers (Harvesters) ya implementados y de libre acceso GNU/GPL

• Multiples Tecnología: Java, PHP, Perl, ASP, etc

Page 26: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Software

• CDSware del CERN• DSpace MIT• GNU E-prints • Greenstone Universidad de Waikato • OAICat, OAIHarvester OCLC • Para saber más:

http://www.oaforum.org/oaf_db/list_db/list_software.php

Page 27: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

¿Que más necesito?

• Servidor Web (Apache)

• Servidor BBDD (MySql, PosgresSQL)

• Una implementación de OAI-PMH

• Requerimientos específicos de cada implementación: Máquina Virtual Java, módulos Perl, PHP, etc

Page 28: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Mi experiencia

• Plataforma: Linux (Debian)• SGBD MySQL• Servidores Apache 1.3.. TomCat (Para Java)• Implementaciones Services y Data Providers:• OAICat, OAIHarvester, OJS, implementación

propia PHP

=• COSTE 0

Page 29: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Otros campos de aplicación

• Bibliotecas digitales• Cualquier tipo de colección de

documentos electrónicos

Page 30: La Internet científica de libre acceso: nuevos canales e iniciativas de publicación científica en archivos abiertos José Ramón Pérez Agüera Universidad

Conclusiones y cuestiones para el debate

• OAI surge de la necesidad de los científicos de optimizar el proceso de publicación de sus investigaciones, lo que garantiza su continuidad, ya que no es una necesidad creada a priori

• OAI-PMH es aplicable más allá de los depósitos de e-prints

• ¿Como encajan las editoriales en este entorno?