ESTUDIO DE LA WEB SEMÁNTICA

0

2014

Universidad Católica de Pereira

Dairo Alexander Toro López

ESTUDIO DE LA WEB SEMÁNTICA

El momento en que se toma la iniciativa de desarrollar un proyecto de esta magnitud aparece un problema común a otros trabajos: la tarea ardua de encontrar información veraz en la herramienta por excelencia de estos días INTERNET. Este problema es objeto de estudio en altos círculos académicos mundiales y Tim Berners-Lee ha planteado como solución la web semántica.

1


DAIRO ALEXANDER TORO LÓPEZ

UNIVERSIDAD CATÓLICA DE PEREIRA

INGENIERIA DE SISTEMAS Y TELECOMUNICACIONES

2014

2


Ing. ALEXANDER TORO LÓPEZ

Presentado a:

Magister, Ing. Álvaro Morales

UNIVERSIDAD CATÓLICA DE PEREIRA

INGENIERIA DE SISTEMAS Y TELECOMUNICACIONES

2014

3

DECLARACION DERECHOS DE AUTOR

Yo Dairo Alexander Toro López declaro que el trabajo presentado es de mi propia autoría, hasta el momento no ha sido presentado para ninguna acción hacia un grado o calificación profesional, he hecho citas que están debidamente referenciadas, respetando los derechos de autor de las fuentes, incluidas en este documento.

La Universidad Católica de Pereira –UCP- puede hacer uso de lo consignado en este documento, como lo expresa la legislación, en torno al uso libre de este documento con carácter académico, haciendo las debidas referencias bibliográficas.

4

AGRADECIMIENTOS

A mi madre, Emirgen, a su esposo José Fernando y a Carlos Botero quienes apoyaron con su constante trabajo, la realización de este proyecto académico, que da inicio a la vida profesional. Un etapa más que se logra conquistar de metas propuestas, para como profesional éticamente capacitado ayudar en la construcción de una nueva sociedad, justa y espiritual.

A luisa Vargas que con sus dedos mágicos aportó el trabajo arduo de digitalizar citas importantes que fundamentan los argumentos propuestos en este proyecto, páginas enteras de este informe llevan su sello personal.

Un profesor es un espécimen formado por el conductismo mutilador de utopías, un maestro es aquel que con la luz del conocimiento brinda faros para alumbrar el camino, haciendo a un lado los fardos que complican el avanzar, especiales agradecimientos al director de proyecto: MSc. Álvaro Morales.

A Wilson Marín R., por su orientación, metodológica al anunciar los pasos a seguir en la realización de las dos (2) tareas fundamentales de este trabajo, leer y escribir, y en su momento dándole un toque especial a su más eterna amada “La Palabra".

Agradecimientos eternos a todos los héroes cotidianos, a todos aquellos que realizan el sutil trabajo de hormiga, aquellos aportes con poco reconocimiento, es este el momento para ofrecerles un especial altar por su contribución en esta tenaz proyección.

5

DEDICATORIA

Dedico este trabajo a aquellas personas que anhelan ver realizada esta meta profesional, también es su meta, ellos igualmente se han esforzado de una u otra manera para animar el culmen de esta carrera universitaria.

Principalmente ofrezco este trabajo a la Suprema personalidad de Dios, que es Krishna mismo, a quien ofrezco reverencias a sus pies de loto, con la más sincera humildad le ofrezco estos, los frutos de mi trabajo, que este proyecto sirva para la labor del devoto y la sociedad en el mundo.

A los hombres y mujeres de todas las edades, principalmente los niños y niñas quienes en los últimos días me han hecho confrontar la teoría y la práctica como alfabetizador digital, ellos me llevan siempre a encontrar otros caminos, de ellos un sector especial, los campesinos porque desde el alba hasta al anochecer, le hacen el amor a la tierra entregando con pasión y esperanza la semilla, hasta hacer parir el fruto, el alimento, la prasada.

6

PALABRAS CLAVE

Web, web 1.0, web 2.0, web 3.0, web semántica, ontología, OWL, RDF, HTML, buscadores web, linked data, URI, Unicode, XML, Tim Berners-Lee, inteligencia artificial, software, programación, estudio, www y tesauros documentales.

RESUMEN

Los recursos que se encuentran en la web, son archivos que proporcionan información; en el tránsito de la web 1.0 a la web 2.0 no se logró llenar el vacío dejado por la ausencia de estructuración de la información, para su recuperación independientemente del motor de búsqueda utilizado. Tan solo la comunicación se hizo más dinámica y participativa, esto debido a que los motores no alcanzan a indexar los datos, bases de datos y demás que se puede hallar en las profundidades de internet.

La web profunda es mucho más colosal que la web superficial, donde la primera hace referencia a todos aquellos archivos que se encuentran en internet, pero no hacen parte de la web, la segunda, es decir, la web conocida por la inmensa mayoría de los usuarios es una pequeña parte de todo lo que yace en internet. Con el objeto de solucionar los problemas de indización, la web 3.0 intenta aplicar la web semántica, o metaweb, esta utiliza las ventajas que ofrecen los metadatos dotando de una especie de inteligencia artificial a las aplicaciones web, con el objeto de aumentar el grado de razonamiento de las máquinas para poder orientar la búsqueda de los usuarios con mayor éxito, es decir, incrementar la tasa de satisfacción de los usuarios en la ejecución de las búsquedas en la web.

Este trabajo de investigación es un progreso en recolectar información de diversas fuentes, primarias y secundarias, para determinar los avances y las limitantes de la web semántica, en el uso contextual académico, es decir, realizar una revisión de las tecnologías halladas, un paso más en torno a la web 3.0. Se espera que los recursos informáticos estén asociados entre ellos con la intención de utilizar, copartamentalizar y compartir la información automatizando los procesos de gestión de información. Para lo cual se planteó como objetivo el realizar una revisión bibliográfica de las teorías y conceptos que abarcan la arquitectura propuesta por Tim Berners-Lee de la web semántica.

La WS debe posibilitar información relacionada en formatos y lenguajes comprensibles por las máquinas. Los esfuerzos que la Web Semántica demanda podrán sobrepasar las expectativas, apenas se está inventado, trabajando de la mano con el desarrollo de los buscadores, para lo cual se pretende hacer una relación entre los datos, la información y el significado. La solución consiste en dotar los contenidos de la web con cierta información que solo competerá a las máquinas, brindar una especie de “razonamiento” a estas, llevando la automatización de la

7

Web a otro nivel, donde buscar información no será un problema tan complejo como lo es hoy en día. Dejando como producto de este esfuerzo investigativo una aplicación usable en torno al tema propuesto, esto es el diseño y puesta en funcionamiento de un portal web que contenga información referenciada.

KEYWORDS

Web, web 1.0, web 2.0, web 3.0, semantic web, ontology, OWL, RDF, HTML, web search engine, linked data, URI, Unicode, XML, Tim Berners-Lee, artificial intelligence, software, programming, www y thesauri documentaries.

ABSTRAC

The resources located on the web are files that provide information. The vacuum caused by absent structuring of information for its recovery was not filled during the development of the Web 1.0 and the Web 2.0, regardless of the search engine used. Due to the fact that the motors are not able to index the data and the databases, only communication became more dynamic and participative.

The deep web is much more colossal than the superficial web, the first one refers to all those files that are located on the web, and, which are not part of the web itself; and, the second one, which is the best known by most of the internet users, represents just a little part of the whole that lies on internet. The web 3.0 applies the semantic web, or metaweb, with the purpose of solving indexation problems; this web utilizes the advantages offered by the metadata, by endowing the web applications with a kind of artificial intelligence; the aim of this is to increase the degree of reasoning of the machines, with the purpose of guiding a successful search of the users, it means an increase in the satisfaction rate of the users in the perform of searches on the web.

This research represents a progress in the collection of data from various sources, primary and secondary, in order to determine the advances and limitations of the semantic web in the academic context use; it means, to make a revision of the found technologies, another step towards the web 3.0. What is expected is that the computing resources are associated between them, with the purpose of use, compartmentalize, and share the information, automating the management processes of information. Due to that fact, the objective of conducting a literature review, around the theories and concepts included in the architecture proposed by Tim Berners-Lee about semantic web, was raised.

The SW should enable related information in comprehensible formats and languages for the machines. The efforts demanded by the Semantic Web could exceed expectations; it is just being invented, working hand to hand with the development of the searchers, for which is intended to create a relationship between data, information, and meaning. The solution is to provide the contents of the web

8

with certain information that will only behoove to the machines, to offer them a kind of “reasoning”, this will take the automation of the web to another level, where the fact of searching for information will not be such a complex problem as it is today. The final result of this research will be a useful application around the proposed topic, which is the design and startup of a portal web with referenced information.

9

TABLA DE CONTENIDO

INTRODUCCIÓN ............................................................................................................... 12

1. FORMULACION DEL PROYECTO ..................................................................... 15

1.1. Descripción y formulación del problema ......................................................... 15

1.2. Objetivos .............................................................................................................. 19

1.2.1. General ............................................................................................................. 19

1.2.2. Específicos ...................................................................................................... 19

1.3. Justificación ......................................................................................................... 19

2. MARCO CONTEXTUAL ........................................................................................ 23

2.1. Generalidades ..................................................................................................... 23

2.2. La Sociedad de la información, preámbulo a la sociedad del conocimiento ............................................................................................................................... 30

3. MARCO TEORICO ................................................................................................. 40

3.1. ANTECEDENTES .............................................................................................. 40

3.2. MARCO CONCEPTUAL .................................................................................... 48

3.2.1. La Web ............................................................................................................. 48

3.2.2. Tendencias ...................................................................................................... 55

3.2.3. Linke Data ........................................................................................................ 56

3.3. TEORIAS Y TECNOLOGIAS ............................................................................ 57

3.3.1. Arquitectura de la información ...................................................................... 58

3.3.2. Web Semántica ............................................................................................... 59

3.3.3. URI .................................................................................................................... 65

3.3.4. Unicode ............................................................................................................ 66

3.3.5. Digital Signature (Firma Digital) ................................................................... 67

3.3.6. XML ................................................................................................................... 67

3.3.7. NameSpace ..................................................................................................... 69

3.3.8. RDF Model & Sytax ........................................................................................ 69

3.3.9. RDFSchema .................................................................................................... 71

4. MODELO TEÓRICO .............................................................................................. 73

4.1. ONTOLOGÍAS .................................................................................................... 73

4.1.1. CLASES DE ONTOLOGÍAS ......................................................................... 76

4.1.2. OWL .................................................................................................................. 77

10

4.1.3. Rules ................................................................................................................. 78

4.2. Herramientas para el desarrollo de ontologías .............................................. 78

4.2.1. Logic Framework ............................................................................................ 80

4.2.2. Prooff (Pruebas) .............................................................................................. 80

4.2.3. Trusted SW (confianza en la web semántica)............................................ 80

4.2.4. Encryption ........................................................................................................ 81

4.2.5. HTML ................................................................................................................ 81

4.2.6. Metadatos ........................................................................................................ 82

4.2.7. Sistemas de búsqueda de información S ................................................... 85

5. CONCRECIÓN DE APLICATIVO ........................................................................ 87

6. CONCLUSIONES ................................................................................................... 88

7. RECOMENDACIONES .......................................................................................... 93

8. REFERENCIAS BIBLIOGRAFICAS .................................................................... 94

9. GLOSARIO .............................................................................................................. 97

11

INDICE DE ILUSTRACIONES

Ilustración 1 La Web Actual .................................................................................................. 16

Ilustración 2 Web Actual (Vs) Web Semántica ..................................................................... 18

Ilustración 3 La mitad de los colombianos usa internet todos los días ................................ 24

Ilustración 4 Usuarios de Internet por cada 100 habitantes ................................................ 25

Ilustración 5 Uso de Internet en Colombia .......................................................................... 26

Ilustración 6 CORRELACIÓN ENTRE EL NETWORK READINESS INDEX [WEF2010] Y EL GLOBAL COMPETITIVENESS INDEX [WB2010]. .................................................................... 27

Ilustración 7 La Web en 1989 ............................................................................................... 49

Ilustración 8 Estructura de la web 1.0 .................................................................................. 51

Ilustración 9 Esquema de la Web 2.0 ................................................................................... 52

Ilustración 10 Cuadro comparativo web actual y semántica ............................................... 56

Ilustración 11 Relaciones de las principales tecnologías de la web semántica .................... 59

Ilustración 12 ARQUITECTURA DE WEB SEMÁNTICA EN FORMA DE PASTEL SEGÚN EL W3C (BERNERS-LEE 2003) ............................................................................................................. 61

Ilustración 13 Representación de las diferentes versiones de la web semántica ................ 62

Ilustración 14 Representación de la versión de Status de la Web Semántica ..................... 63

Ilustración 15 Web de Objetos ............................................................................................. 68

Ilustración 16 Logo de HTML 5 ............................................................................................. 82

Ilustración 17 Web actual y web semántica ......................................................................... 84

Ilustración 18 Pantallazo de interfaz de Google ................................................................... 85

Ilustración 19 Resultados con un buscador actual ............................................................... 86

Ilustración 20 Resultados con un buscador semántico ........................................................ 87

Ilustración 21 Pantallazo de inicio de websememanticaucp.tk ........................................... 88

12

INTRODUCCIÓN

Si miramos al cielo solo una noche estrellada tan solo alcanzaremos a ver algunos de los infinitos astros que pueblan el universo.

Pero si utilizamos un potente telescopio un campo de visión nuevo se abrirá ante nuestros ojos y se vislumbrarán entes que hasta entonces parecían “invisibles”…

Esto es lo que hay que encontrar en la Web semántica. Las ontologías a encontrar…

Idoia Salazar

La sociedad moderna, la del tercer milenio, se caracteriza por el incremento acelerado y vertiginoso de bits, la web está abarrotada de información, es decir, constantemente ingresan nuevas fichas a la red, en otras palabras, esto es lo que se conoce como la era de la información, en la cual ésta se encuentra dispersa, desorganizada, no estructurada, la desconfianza de los usuarios aumenta respecto a los contenidos accesados; los usuarios se pierden en la red, en ese mar de información, creyendo erróneamente que el problema del contenido está en la autopista. De esta manera los usuarios logran accesar a la red.1

Aquella sociedad del consumo, hija de las continuas crisis del sistema económico, las cuales obligan a la sociedad misma a desarrollarse2, van marcando el camino desde la Sociedad de la Información hacia la Sociedad del conocimiento en la que la información ya es decantada, seleccionada, sintetizada, es decir, se ha desechado la cáscara para quedarse con la pulpa, entendiendo que la pulpa

1 Es claro cómo se demostrará más adelante que el acceso a internet en países como Colombia, que aún no es un servicio de primera necesidad, aunque los gobiernos hacen esfuerzos en ampliar y masificar el acceso y la cobertura de las Tics, y el internet, a través de programas como Computadores Para Educar y Vive Digital, solo se espera que ello no vaya en detrimento de la calidad como generalmente sucede, en otras palabras tras la masificación en cuestión de calidad viene la pauperización.

2 Se entiende desarrollo como avance, lo cual no significa que la sociedad no pueda ir en otra dirección, lo cual significa que desarrollo es también sinónimo de cambio, de transformación.

13

representa la información con criterio de validez. En este sentido, los profesionales de sistemas de información, deben estar en capacidad de dar soluciones a problemas de esta índole3.

Muy lejos de llegar a su fin creativo y transformador, internet y las tecnologías de la información y la comunicación a ella asociadas están transformando la sociedad. Fue evidente en las recientes revoluciones democráticas en el mundo, las manifestaciones de los indignados en el viejo continente, entre otros, fueron influenciadas e incluso dirigidas a través de la red. En la reciente catástrofe en el extremo oriente, el terremoto y consecuente tsunami de Japón, donde lo único que se mantuvo, a la vez un puntal importante para los procesos de rescate, fue la internet.

Son las tecnologías de la información y la comunicación Tics, las que van a cambiar muchos aspectos de la vida cotidiana, social, cultural, económica y política, cuando la web como el reloj o el teléfono móvil será omnipresente y la humanidad ni siquiera se podrá dar cuenta del cambio.

Los recursos que se encuentran en la red pública de la Internet son documentos, objetos, en fin, archivos que proporcionan información, pero el éxito de su recuperación radica en cómo estén estructurados para que den el carácter de relevancia y pertinencia para el usuario, independientemente de los motores de búsqueda utilizados. (SALAZAR, 2005) Pero es una realidad que los motores de búsqueda no alcanzan a indizar en sus bases de datos la totalidad de páginas web que existen.

Es entonces en este momento cuando la web y principalmente el W3C4 traza el camino que la web recorrerá en un futuro no muy lejano. Se pudo ver que la web 1.0 brindó la posibilidad de compartir información, esta era dirigida a la entidad que los suministraba, sin la posibilidad de que los usuarios de la web modelaran, personalizar e incluso opinaran sobre los contenidos. Podría decirse que la web era una ventana en la que tan solo se podía observar, bajo textos planos. Después surge la web 2.0, en donde los contenidos brindaron múltiples opciones de interacción entre los usuarios. Ya no era solo una ventana para observar, era una

3 Sin embargo se encuentra que la educación en países al servicio del capital internacional como Colombia es un ejemplo palpable de como la educación está centrada en servir a los intereses de la producción del momento, tipo cumplir acuerdos como el dogal del Tratado de Libre Comercio TLC con USA, en este sentido la preparación académica no es en función del conocimiento, el desarrollo educativo y de amplia cobertura a nivel nacional, sino que es una educación en función del capitalismo salvaje, preparar mano de obra barata.

4 World Wide Web Consortion, es este el consorcio fundado por Tim Berners Lee, es una comunidad internacional donde sus miembros de tiempo completo se dedican al desarrollo y sustento dela web, velando por constantemente seguimiento y potencialización de los estándares, llevando la web hasta su máximo potencial.

14

ventana para opinar y personalizar entre las muchas características que esta versión trajo al mundo de la web.

La información contenida en la internet está en un momento crítico, los usuarios y la información que interactúan en ella, podrían compararse con la inmensidad del universo, las estrellas y constelaciones representan la enormidad de fuentes de información en crecimiento constante, además del número de usuarios, es decir, los navegantes del ciberespacio, el cual también crece exponencialmente. Esta información no está estructurada, en otras palabras, es un caos de datos. Tim B. Lee en la búsqueda de una solución a este problema ha planteado la web semántica, (SALAZAR, 2005) un megaproyecto, evolucionado de las hasta entonces versiones las 1.0 y 2.0 de la web, todas han ido evolucionando equitativamente con las tecnologías de conexión a internet, hacia la web 3.0. Es notable que a mayor velocidad de transmisión de datos, mayores sean las posibilidades de prestación de servicios5.

En el año de 1991 el W3C planteó la web semántica como metodología de estructuración de los contenidos que se comparten en la web, para brindar servicios con mayor rango de automatización, dotando a la web de “inteligencia artificial”6, algunos autores la llaman la web de los metadatos, porque es la esencia de esta versión. La solución consiste en dotar los contenidos de la web con cierta información que solo competerá a las maquinas, utilizada para brindar una especie de “razonamiento” a la máquina, llevando la automatización de la web a otro nivel, donde buscar información no será un problema tan complejo como lo es hoy en día.

5 En el momento actual, es decir, durante la elaboración de este documento donde la tecnología 4G de tecnologías móviles está apenas entrando en Colombia, y poco a poco va ganando espacio, la infraestructura instalada va a ser optimizada, hoy en día hay operadores móviles que prestan el servicio, los Smartphone son masivos por tanto más baratos, lo cual implica un incremento en la demanda de servicios.

6 Entendida esta como la capacidad de razonar de un agente no vivo.

15

1. FORMULACION DEL PROYECTO

1.1. Descripción y formulación del problema

La web se ha convertido en la herramienta por excelencia para buscar información en internet, con un éxito palpable, este proyecto registra un incremento exponencial de usuarios en muy poco tiempo. De esta situación debe tenerse claro que a mayor cantidad de usuarios mayor cantidad de información se maneja, en este sentido la web es un gran universo de información no estructurada y con gran nivel de heterogeneidad.

Los documentos de la web actual, la web 2.07, están escritos fundamentalmente en HTML, con un problema notable: la indiferencia de las maquinas entre un documento y otro. En otras palabras la maquina no diferencia la información de una gran compañía o una página web personal de algún usuario.

De acuerdo al principal problema que enfrenta la Web actual8: la heterogeneidad de la información, donde los usuarios y contenidos crecen exponencialmente, con la desventaja de no estar clasificados. Es imposible para las aplicaciones diferenciar entre el contenido de una página web y otra, limitados solo a la diferencia que presentan las URLs9.en la ilustración 1 se puede visualizar como se representan las páginas web, con sus respectivos saltos hipertextuales:

7 Es pertinente aclarar que hay autores que afirman que la web 2.0 no está completamente implementada y que más bien es una idea que guía el gran proyecto llamado WEB, de hecho hay quienes niegan la segmentación numérica, argumentando que ninguna tiene especificaciones claras de lo que debe cumplirse, sin embargo en este trabajo se toma esta segmentación para facilitar su entendimiento.

8 La web 2.0

9 Uniform Resource Identifier - Identificador Uniforme de Recurso. Ejemplo:

www.ejecafeterovirtual.org, www.google.com, www.ucp.edu.co.

http://www.ejecafeterovirtual.org/

http://www.google.com/

http://www.ucp.edu.co/

16

… La Web del presente: una gran recopilación de información desordenada con mucha basura, por lo que encontrar en este cúmulo la información que uno busca termina resultando un trabajo arduo y costoso. (Baquero, 2013)

Si bien los actuales documentos de HTML (HyperText Markup Language) poseen cierta cantidad de metadatos que permite su indexación en buscadores, ésta hoy no alcanza porque re refiere al documento en general y no a cada uno de sus componentes. Se prevé que en el futuro los documentos poseen mayor información sobre sí mismos en un lenguaje entendible por las computadoras que lo almacenan y también aquellas que interactúan con éstas. (Baquero, 2013)

En la Web actual se encuentra ante un crecimiento caótico de recursos, es decir, un incremento inusitado de datos, fuentes de información dada vez arrojando más datos, esto hace que la información se pierda como una aguja en un pajar, lo cual hace que quede fuera del alcance de una persona, la semántica es implícita, falta orden y organización. (Baquero, 2013) Ya con la puesta en marcha de la Web semántica la información es procesable por programas, se tiene una clasificación, gracias a los metadatos, también se forma una estructura y una anotación, la semántica es explícita (metadatos, procesables por máquinas) ello se logra por los vocabularios o metadatos: ontologías consensuadas y posee Orden y flexibilidad.

Es claro que la web actual cuenta con una serie de limitaciones, las cuales llevan a una serie de frustraciones entre los usuarios de la red, para el caso concreto una búsqueda relacionada con yeguas, posiblemente no arroje resultados con

Fuente: (Infotecarios, 2012).

Ilustración 1 La Web Actual

17

caballos, o en la web actual no hay solución entre un tema planteado como evitar la guerra, pero entonces este documento no está asociado con una búsqueda para obtener la paz.

La web semántica quiere solucionar esto. Esto suena a inteligencia artificial. Por tanto, aunque no quieran llamarlo así, con la web semántica se está buscando el mismo objetivo, a saber, que los ordenadores entiendan que un documento sobre "yeguas" puede ser muy relevante para una necesidad de información sobre "caballos", y que la semántica de la pregunta "¿es posible evitar la guerra?" es la misma que la de la pregunta "¿es posible conseguir la paz?". (Codina, Internet invisible y web semántica: ¿el futuro de los sistemas de información en línea?, 2003)

Ante esta situación El científico Tim Berners-Lee planea llevar la web a una tercera versión, llamada la Web Semántica, la Web 3.0 busca clasificar la información compartida en la web, similar a la clasificación de los productos en un supermercado, donde con un código de barras, cada producto tiene un numero identificador que le permite diferenciarlo de los demás. En la web semántica se utilizan los metadatos10 para diferenciar dicha información. La diferencia entre la web actual y la web semántica se evidencia en la Ilustración 2. Donde las interfaces vistas ya no son planas, sino que son dinámicas, ya solo no hay necesidad de enlazar cuestiones de la misma relación, sino también, de relación distinta, con conceptos indizados, es decir, estructurados, relacionando los metadatos o conceptos indizados, para hacer nuevas relaciones, lo cual dota de otros significados la información contenida en la red.

10 Datos incrustados en el código de la aplicación, que pueden ser compartidos y entendidos por las mismas maquinas, con el objetivo de identificar el contenido de un determinado archivo.

18

Ilustración 2 Web Actual (Vs) Web Semántica

Fuente: (Infotecarios, 2012)

De acuerdo al problema planteado y al objetivo de este proyecto, se plantea las tecnologías de la web semántica como una solución viable a dicho problema de investigación. Este trabajo de grado responde a la necesidad de que la humanidad, concretamente el sector académico, disponga de información sobre los alcances de esta tecnología. Los progresos que se tienen en la región son muy reducidos, por ello es importante desarrollar contenidos sobre esta tecnología, y los campus universitarios son un excelente punto de partida.

Es de resaltar que los sectores académicos, investigativos, empresariales, entre otros, demandan información veraz y validad, donde la imposibilidad de las máquinas para comprender los contenidos de la web, representa el problema fundamental para buscar, encontrar y compartir información de semejantes características.

19

1.2. Objetivos

1.2.1. General

Establecer el estado del arte de las teorías y conceptos que abarcan la arquitectura propuesta por Tim Berners-Lee de la web semántica.

1.2.2. Específicos

Consultar autores que han escrito sobre la web semántica.

Indagar que están haciendo las empresas entorno a la web semántica.

Identificar proyectos existentes en otras universidades colombianas e internacionales, sobre implementación de web semántica.

Diseñar e implementar un material multimedia en el que se evidencie la utilidad de la Web Semántica.

1.3. Justificación

La web semántica constituye tecnológicamente para el día de mañana, la web del conocimiento, donde la información será estructurada para que las maquinas tengan mayor entendimiento sobre los contenidos que se publican en la gran autopista virtual, facilitando a los usuarios automatización en las búsquedas de información, debido a la mecanización de procesos (que hoy en día el humano realiza a mano), gracias a metadatos que le permitirán a los buscadores entender con mayor certeza lo que está publicado en la web, dando la posibilidad a una nueva generación de buscadores más potentes; todo debido al modelo propuesto por Tim Berners-Lee.

Compañías de sistemas de cómputo tales como Microsoft, Apple, Yahoo y Google, tienen como uno de sus problemas dar validación a la información, por ejemplo el problema de Google es que al buscar con palabras clave, en una búsqueda de cualquier usuario los resultados pueden no ser los mejores debido a que de acuerdo al contexto de una palabra puede cambiar todo el significado o toda la búsqueda, ofreciendo al usuario una cantidad de resultados realmente inservibles. Para lo cual se ha planteado la Web Semántica, la cual tiene entre sus tareas modificar de manera estructurada la información de la web, esto con el objeto que las máquinas tengan mayor facilidad en el procesamiento de la información, la consecuente integración o estructuración, reutilizando y decantando información contenida en la web.

20

Además de lo que se ha dicho, la web semántica, puede aplicarse a cualquier sistema de información que se enlace con la web, logrando que el sistema, haga las cosas más “fáciles” o automatizadas para el usuario, logrando como tal una mejor experiencia de usuario en la web, como en su trabajo lo expresa Álvarez.

Dado que la Web Semántica es un área que apenas comienza a mostrar sus potencialidades, es fácil inferir que la conjunción de esta tecnología con otras áreas disciplinares puede llevar a trabajos interesantes. La educación no escapa de esto, y es por ello que consideramos que la Web Semántica puede contribuir de manera significativa para los procesos de negocio en las organizaciones, y se pueden integrar actividades educativas en ese proceso. (Alvarez Yupa, 2013)

Las funcionalidades de la web semántica abarcan prácticamente todos los aspectos de la vida humana, entendiendo que la web forma parte de la vida cotidiana de un porcentaje significativo de la población mundial. La educación es una de las ramas más beneficiada con la implementación de esta tecnología, y por esta razón es posible hablar de la necesidad que tiene la Universidad Católica de Pereira de realizar un estudio de las teorías y conceptos que abarcan la arquitectura propuesta por Tim Berners-Lee, para desarrollar un criterio valido y certero, con el fin de establecer un posible plan de acción en la integración de esta nueva tecnología en el ámbito académico de la entidad.

Estas nuevas tecnologías trabajan con bases de datos para entregar al usuario esa información en determinados formatos, su información es estructurada para que ésta pueda ser legible e interpretable por software y máquinas.

La web semántica ofrece una serie de servicios que la diferencia de las anteriores versiones, según (Alvarez Yupa, 2013) estas son:

• Promociona las mejoras respecto a la Web 2.0.

• La Web construye una Base de Conocimiento sobre sus usuarios.

• La Web tiene relacionados los datos y la información con su significado.

La Web es capaz de entender de manera exacta lo que se le pide que busque.

La Web semántica está especialmente diseñada para dotar de significado a su contenido, de tal manera que cuando el buscador trata de localizarlo, no se fija en las palabras que contiene, sino precisamente en el significado, en lo que el usuario de verdad está buscando. (Alvarez Yupa, 2013)

21

La Web Semántica está dotada de un mayor significado, es decir, las relaciones entre los metadatos que tienen sentido, ya no son sólo hipervínculos entre datos o sitios web. Su función es imprescindible en la recuperación, filtración y procesamiento de la información que se encuentra almacenada en la web.

En este sentido se pretende llegar, de manera teórica, a una línea de acción, que logre una extensión de la web existente, para que parte de la información adquiera significado para las máquinas a través del uso de metadatos. La cuestión que subyace a la propuesta es que los datos contenidos en la web deben ser definidos, indexados, estructurados y enlazados de manera tal que puedan ser usados con mayor certidumbre en torno a descubrimientos, automatización y reutilización entre múltiples aplicaciones. En otras palabras, la web semántica debe posibilitar información en formatos y lenguajes comprensibles por las máquinas, con cierto nivel de relación.

Como una herramienta para dar solución a ello se plantean las ontologías, entendidas estas como “una especificación de lo que existe en un dominio, convirtiéndose éstas en una pieza fundamental de las tecnologías orientadas a la Web Semántica” (Alvarez Yupa, 2013)

Hoy los seres humanos viven en lo que se ha llamado la sociedad de la información, apenas la sociedad va por los primeros pasos de esta larga marcha que es la tecnología, los medios en general y las universidades deben aprovechar ese ámbito académico para fomentar el desarrollo regional e incluso nacional, actividad en la que la institución como tal también se ve beneficiada debido al estudio y desarrollo de proyectos que atienden problemas reales, por esta razón es indispensable que la Universidad de un vistazo a la web semántica y evalúe la utilidad que en pocos años podría representar en torno al ámbito laboral y educativo que representa su cultura-institucional, la automatización de procesos que la educación demanda como institución dedicada a la investigación e implementación de protocolos de estandarización.

Además los beneficios que presenta la web 3.0 para las instituciones educativas es un punto clave para la representación de procesos en la web “inteligente”, donde el surgimiento de nuevas herramientas, permitirán solucionar problemas con métodos nuevos y mejorados, dando a la Universidad la posibilidad de optimar el tiempo en el desarrollo cotidiano que demanda su cultura.

La Universidad Católica de Pereira debido a su ámbito universitario o académico debe implementar nuevas tecnologías vanguardistas y futuristas, donde se aprovechen las herramientas que harán posible la era del conocimiento, permitiendo la implementación de estándares web en los procesos institucionales y avanzando en los conceptos de la web 3.0 que poco a poco logra su objetivo principal, generar una web inteligente con estándares que posibilitan la comunicación entre entes virtuales o software diseñados con propósitos específicos

22

y que necesitan compartir información para brindar a los usuarios una experiencia automatizada y certera gracias a la estructuración de contenidos que hacen posible una representación avanzada de la institución en el mundo virtual.

La web semántica representa para el momento, la web del conocimiento, donde los contenidos serán estructurados para que de alguna manera las maquinas tengan más entendimiento sobre los contenidos que se publican en la gran autopista virtual, facilitando a los usuarios automatización en las búsquedas de información, además de automatizar procesos cotidianos, como pedir una cita médica desde un buscador personalizado que se comunique con la clínica u hospital donde se pretende realizar la diligencia médica, interactuando con los horarios disponibles tanto del doctor como del paciente, y asignando la fecha más indicada para dicha cita. La Universidad Católica de Pereira como cualquier institución universitaria debe estudiar e implementar teorías y conceptos que proponen el desarrollo tecnológico del mundo, beneficiando a la región con avances en la implementación de dichas teorías. Por esta razón se debe realizar un estudio que visualice a profundidad lo que la arquitectura propuesta por Tim Berners-Lee, representa para el desarrollo tecnológico, además de brindar un concepto académico y regional de la propuesta denominada web semántica, captando criterio certero en el tema de estudio, con el fin de establecer plan de acción en la integración de esta nueva tecnología en el ámbito académico de la entidad.

23

2. MARCO CONTEXTUAL

2.1. Generalidades

El uso de la internet se ha globalizado de manera exponencial, los usuarios de la red se multiplican por miles cada día, constantemente se abren nuevos portales web, la necesidad de acceder a la información de manera directa por cada uno de los usuarios es apremiante, es decir, es una tendencia actual de los medios de comunicación, entendiendo que la internet es un medio de comunicación que ha superado con creces a los otros medios de información, uno de sus aspectos sobresalientes es el uso exponencial de la internet y el uso de las extensiones punto com.

Durante 2002, año en el que se produjo la explosión de la burbuja tecnológica y en el que comenzó la llamada crisis de las puntocom. El número de hosts creció de nuevo de una manera considerable, superando los 170 millones… (SALAZAR, 2005)

El usuario generalmente cumple el papel de simple receptor, sin embargo, hoy en día reclama un rol más protagónico, desea ejercer un patrón proactivo, desea ser parte ejecutante y directa del medio que está utilizando, para el caso concreto el uso del Twitter y los canales de YouTube, los cuales le posibilitan al usuario a través de una cuenta, controlar, dirigir, diseñar y orientar los contenidos, en estos casos el usuario crea sus propios discursos, siendo este un discurso que se configura en múltiples discursos, incluso formando parte de otros discursos, es decir, un meta discurso, para el caso de la propuesta meta-noticia, meta-cultura.

Las posibilidades que trae la web semántica abarcan gran cantidad de servicios, entre ellos, las búsquedas y gestión de información en la web son altamente beneficiadas, no es un secreto que el industria de las búsquedas en internet es un negocio redondo. Solo para citar un significativo ejemplo, el negocio de las búsquedas, impulsado por la venta de publicidad contextual (con palabras clave), es muy rentable: Google facturó el trimestre pasado 4.000 millones de dólares.

Se tiene que para el 2005 había más de 11 millones de páginas, (SALAZAR, 2005). Más de la mitad de la población colombiana según el estudio de Ipsos11, accede a internet todos los días, mientras que tan solo el 14% de los encuestados declaró conectarse ocasionalmente a internet. (Ver Ilustración 1)

La web (WWW) no es sinónimo de Internet sino, apenas, uno de sus servicios, con 12 mil millones de páginas web y cerca de dos millones

11 Es un estudio trianual de representatividad nacional que mide la nuevas tendencias y desarrollos en tecnologías.

24

de páginas creadas o actualizadas diariamente, encontrar información relevante en Internet es una tarea cada vez más dificultosa (http://www.sociedadelainformacion.com/20011103/invisible/internetprofundo.htm). Existen dos grupos de contenidos en la web. El primero es la web visible o superficial y se corresponde con la versión tradicional de la web. Se trata de las páginas estáticas, disponibles de forma pública y abierta y es, en rigor, la parte más pequeña de la web conocida. (Curti, 2006)

Distintos estudios han encontrado que existe una correlación directa entre la penetración y el uso de Internet, la apropiación de las TIC, la generación de empleo y la reducción de la pobreza. Por ejemplo, un estudio de las Naciones Unidas [UNCTAD2010] muestra como existe una clara correlación entre el número de usuarios de Internet y la tasa de pobreza de los países.

Fuente: (Tecnology Tracker Colombia, 2012)

Distintos estudios han encontrado que existe una correlación directa entre la penetración y el uso de Internet, la apropiación de las TIC, la generación de empleo

Ilustración 3 La mitad de los colombianos usa internet todos los días

25

y la reducción de la pobreza. Por ejemplo, un estudio de las Naciones Unidas [UNCTAD2010] muestra como existe una clara correlación entre el número de usuarios de Internet y la tasa de pobreza de los países

Ilustración 4 Usuarios de Internet por cada 100 habitantes

Fuente: [UNCTAD2010]

De la misma manera estudios del Banco Mundial revelan que un aumento en la penetración de Internet del 10% aumenta el Producto Interno Bruto de manera importante en países de bajo y mediano ingresos [WB2009]. En éstos países, el crecimiento es de hasta en un 1,38% adicional. Otro estudio, de la firma consultora McKinsey, calcula el aumento en el crecimiento del PIB en un rango de 0,1 a 1,4% [MCKINSEY2009] para el mismo aumento en la penetración. De todos estos y otros estudios [QIANG2009], es claro que aumentar la penetración de Internet es una manera clara de generar empleos, disminuir la pobreza, aumentar la competitividad y la productividad del país. Por esto es tan importante tener y ejecutar un plan sólido que aumente la penetración de Internet en Colombia.

26

Ilustración 5 Uso de Internet en Colombia

Fuente: (Tecnology Tracker Colombia, 2012)

La ilustración anterior es significativa en cuanto a la información suministrada, ya que es importante saber que en las tres poblaciones etáreas, es decir, entre los quince y treinta y cuatro años, el porcentaje de uso de internet es muy alto, siendo el minino ente los 35-34 años, con un 86% , lo cual indica que es muy alto el uso, solo descendiendo un poco en el grupo etáreo siguiente, igualmente por estrato se observa un alto uso de los estratos 3 a 6 donde la inmensa mayoría de la población encuestada usa internet.

Como se observa en las gráficas anotadas el uso de internet ha crecido exponencialmente, la masividad en el uso también genera desorden, caos, por ello es necesario ir dotando a la red de sentido, de contenido comprensible para las máquinas para hacer la labor que no hacen los humanos, indizar, organizar, estructurar, dotar de significado las palabras halladas por los buscadores, para organizar este mar de información, datos y datos, sobre datos y mas datos. En este sentido los resultados referenciados son correspondientes con la tendencia al alza en el uso masivo de la internet como medio de información, abriendo nuevas preguntas, el cual tal vez se pueda hallar en I. Salazar

27

Los estudios realizados responden a la pregunta de que contiene la World Wide Web con la respuesta: infinidad de información. Además, el despliegue de la banda ancha y el éxito de las redes P2P han supuesto un gran impulso para el desarrollo de nuevos servicios y contenidos, como música, videos […] Un mar de información en el que el usuario tiene que aprender a buscar […] (SALAZAR, 2005)

Ilustración 6 CORRELACIÓN ENTRE EL NETWORK READINESS INDEX [WEF2010] Y EL GLOBAL COMPETITIVENESS INDEX [WB2010].

Fuente: [UNCTAD2010]

Para contextualizar mejor el panorama se hace necesario ahora hablar de la web profunda o web invisible

"Se denomina Web invisible o deep Web a la falta de cobertura de una parte de Internet por los motores de búsqueda convencionales. Está compuesta por la información almacenada en bases de datos en Internet, siendo accesible únicamente interrogando los formularios de búsqueda de cada base de datos." (comunicacioninvisible.net, 2013)

Definición: Información accesible a través de la red Internet que por diversas razones no puede ser indizada por los motores de búsqueda.

Tamaño infravalorado: Puede ser de 2 a 50 veces superior a la de la Internet visible. (Aguillo, 2004)

28

Archipiélago de calidad: Recursos que debido a procesos de control suelen presentar contenidos de elevada calidad Incluye información volátil, dinámica, en formatos especiales, todos aquellos recursos que solo son accesibles a través de una pasarela a una base de datos. (Aguillo, 2004)

Es significativo hablar de los usos de la internet, teniendo en cuenta que la red profunda es mucho mas grande que la web superficial, por ejemplo Idohia dice en su libro que Más de 11 000 millones de páginas en 2005 fueron encontradas en la llamada Web superficial, es decir, aquella a la que pueden acceder fácilmente los motores de listas generalistas como Google o Yahoo!... (SALAZAR, 2005)

La información pública en el Web es hoy entre 400 y 550 veces mayor que la que abarca el WWW. Internet invisible contiene 91 850 terabytes de información, mientras el WWW – o Internet superficial- contiene sólo 167 terabytes. La primera contiene 12650 0001000 000 de documentos mientras que la segunda sólo 3 3001000 000. El total de los 60 sitios web profundos más grandes contienen 750 terabytes; esta cifra supera en 40 veces el tamaño del WWW. Los sitios situados en Internet invisible soportan un 50% más de tráfico que los sitios ubicados en el WWW. Estos sitios, como regla, se conocen poco entre el público general. Es aquí donde crece más información en Internet. Los sitios de Internet invisible son con frecuencia más estrechos pero mucho más profundos. Más de la mitad de la información contenida en éstos, reside en bases de datos específicas. El 95 % de la información disponible en Internet profunda es accesible públicamente y de forma gratuita, sin suscripciones o tasas. La calidad de la información contenida en el Internet invisible es de 1 000 a 2 000 veces mayor que la información publicada en el WWW. (How much Information 2003 y propia).2 Isidro Agullo denomina los contenidos disponibles en Internet invisible como un “archipiélago de calidad”. ( Brocos Fernández & Salinas Pardo, 2006)

En cuanto a los idiomas predominantes en los sitios Web12 Más sitios con idioma asiático Respecto a los idiomas de los sitios webs, el chino ha pasado a ocupar el segundo lugar, por delante del español. La producción de contenido en ingles sigue siendo muy alta. Sin embargo hay que tener en cuenta que no solo los países anglohablantes incluyen contenidos en este idioma, sino que cada vez mas las opciones para incluir nuevos idiomas a la red se hacen visibles, para recordar solo el ejemplo de la revolución virtual, que Salió a las calles y en Egipto derrocó un régimen de más de treinta años, y esto se hizo con las redes como principal

12 En una lectura rápida se ha encontrado que la palabra Web escrita con W mayúscula, se refiere al conjunto general de la web, es decir, a la Web global, la Web como tal, y no en el sentido vulgarizado de las aplicaciones diseñadas con objetivos específicos, es diferenciar el contenedor de lo contenido, la Web contiene todo, pero cuando se va a referir todo lo que la web tiene por dentro como páginas, aplicaciones y/o servicios encontrados en ella, se habla en el sentido de sustantivo común.

29

herramienta; o en el caso del tsunami japonés, donde muchas familias se reencontraron usando la red, prácticamente el único servicio público sobreviviente.

La mayoría de estos sitios se encuentran en inglés, aunque cada vez más comienzan a verse sitios bilingües que incluyen su idioma local… (SALAZAR, 2005)

Esto es lo que se puede observar en cuanto al contexto mundial y nacional, ahora para mayor claridad, además de contextualizar aún más el trabajo, se expondrá, la cuestión del Eje Cafetero como eco-región de importancia geoestratégica en el escenario nacional y de la región de la América meridional. El Eje Cafetero es conformado principalmente por los departamentos de Caldas, Quindío, Risaralda, sin embargo a su economía y su cultura se pueden también sumar los municipios del norte del Valle y los del nororiente tolimense.

La Región tiene una extensión total de 13.871 Km2 que representa cerca del 1,2% de la superficie total del país y está conformado por 53 municipios de los 1.098 con los que cuenta el país. [...] La pobreza en la Región Eje Cafetero, según el índice NBI1 ha disminuido y para el año 2000 se ubicó por debajo del dato nacional. El departamento con mayor porcentaje de personas con NBI durante el período 1985-1997 fue Caldas y a partir de 1998 y hasta el 2000 es superado por el departamento de Quindío. (Hurtado, 2007)

De lo comentado y citado anteriormente se puede entonces inferir que estas cifras son aún mayores. En cuanto a la observación regional en torno a la generación de empleo, y como sector importante en la economía nacional el mismo estudio plantea:

Entre 1996 y 2000, la tasa de desempleo para la Región aumentó en cerca de 6.31 puntos siguiendo la tendencia nacional que para el año 2000 alcanzó el 16.63%. El departamento de Risaralda presentó la mayor tasa de desempleo (19.11%) seguido por Quindío (17.10%) y Caldas (14.91%).[...] La Región del eje cafetero (sic) mantiene un tendencia exportadora e importadora. Durante el período exportó cerca de US$ 1.676 millones. Desde 1998 a 2004 las exportaciones crecieron el 68% y las importaciones el 8%. (Hurtado, 2007)

Las cifras económicas, muestran la tendencia y las necesidades de la población, de la misma manera, en el estudio realizado por Hurtado se hace mención al programa nacional coordinado por el ministerio de las TICs, sin olvidar que en esta cuestión el Programa de Computadores para Educar jugó un papel importante en cuanto al uso de las tecnologías, por ello con respecto a infraestructura de tele-comunicaciones el mismo estudio plantea:

30

A 31 de diciembre de 2001, la Región contaba con 470.204 líneas en servicio equivalente a una densidad de 17.61, ubicándose por encima de la densidad nacional (17.11). En cuanto a la densidad de teléfonos públicos, en la Región por cada 100 habitantes había disponibilidad de 0.14 teléfonos para su uso. [...]En desarrollo del programa Computadores Para Educar, se han beneficiado a nivel nacional 6.736 instituciones educativas y se han asignado 72.970 computadores y 6.391 impresoras. En la Región se han beneficiado 407 instituciones que corresponde al 6% del total nacional. El Número de equipos asignados fue de 3.890 y de impresoras de 390 lo que corresponde al 5% y 6%, respectivamente. El departamento de Risaralda contó con el mayor número de instituciones beneficiadas e impresoras asignadas y Quindío con el mayor número de equipos asignados. (Hurtado, 2007)

De esta manera se observa que a nivel mundial el uso de nuevas tecnologías, el acceso a internet, los usos que de ellas hacen las empresas y las personas, y más concretamente del contexto regional del Eje Cafetero, han aumentado, es decir, que el asunto de las telecomunicaciones, las TICs, además de los servicios a ellos relacionados son un factor importante en la economía, es por esto que la web semántica como la web del futuro inmediato debe estar como eje en las políticas, programas y proyectos gubernamentales, educativos y organizacionales, de la misma manera que debe estar presente en la visión de la Universidad Católica de Pereira.

2.2. La Sociedad de la información, preámbulo a la sociedad del conocimiento

Como se ha visto a lo largo de la evolución del hombre su desarrollo viene dado por el uso cada vez más especializado de las manos, esto hoy tiene su máxima aplicación en la digitalización de las herramientas, a saber los aparatos de comunicación y sistematización, a saber, teléfonos, tabletas, computadores portátiles, entre otros. Esto hace que se conjuguen diferentes elementos sociales que se interrelacionan mutuamente, algunos fundamentales son los conceptos de ciencia y sociedad están ligados por la comunicación. Es la comunicación, por antonomasia el medio de difusión del conocimiento y el instrumento natural de circulación.

Solo a través de la eficiente comunicación será posible conocer de la innovación, de la investigación, que dan sentido a los avances de la ciencia. Todas estas manifestaciones culturales llegan a la sociedad por medio de la comunicación. (Jaramillo A., 2000)

Los medios de comunicación son un puntal importante en el desarrollo de una sociedad, incluso se ha planteado ya que pueden ser considerados como el

31

cuarto poder13, es decir, es tanta su influencia en la toma de decisiones, que pueden considerarse como poder, es por esto que adquieren importancia14, y en ese mismo sentido el mismo estudio plantea:

Todos los medios o canales están comprometidos en dicho proceso. La prensa, con sus veloces métodos de impresión; la radio, con el empleo de los satélites, la reducción de sus equipos de transmisión y la sustitución de los tubos electrónicos de Forest por la miniaturización electrónica; la telefonía, portátil e inalámbrica, lo mismo que la televisión con todo su complejo tecnológico, constituyen elementos de expresión cultural. Son, en conjunto, la instrumentación física de la información, que nos permite llegar al pleno conocimiento de todo cuanto contribuye al desarrollo, sobre todo si se trata de información científica, entregada con claridad, oportunidad y condiciones de una buena recepción. (Jaramillo A., 2000)

La noción de sociedad del Conocimiento, no es un concepto inventado15, fue utilizada por primera vez en 1969 por Peter Drucker, ya en la década noventa fue una categoría profundizada en una serie de estudios detallados publicados por investigadores como Robin Mansel o Nico Stehr, en esta sociedad también como lo menciona (Sánchez Jiménez, 2007) cada país debe tener en su futuro inmediato el objetivo de encaminar los recursos a masificar los usos de las tecnologías,

13 Sin embargo, recordando artículos leídos, documentos frente al papel de los medios de comunicación en las decisiones fundamentales de poder a través del modelamiento de la voluntad, es decir, los experimentos conductistas a escala siniestra, o lo que en algún lado de las cosas leídas –sin memoria para hacer la debida referencia- denominó, “mercenarios de la comunicación”.

14 Las recientes conmociones sociales en países que han osado salir de la esfera de influencia norteamericana, se han visto abocados a soportar un tipo de guerra diferente, lo que los académicos del ramo han optado por llamar, las Guerras de Cuarta Generación, El concepto de guerras asimétricas o de cuarta generación, surgió por primera vez en el año 1995 en la publicación estadounidense Joint Warfare of the Armed Forces en referencia a contiendas armadas en las cuales se enfrentan fuerzas disímiles, Fuente especificada no válida., donde los medios de comunicación, principalmente los medios electrónicos, juegan un papel importante como armas de desestabilización, esto es evidente en los sucesos de Libia, Siria, Ucrania y Venezuela. En ese mismo sentido se puede citar a Fuente especificada no válida. al plantear las definición de guerras asimétricas o de cuarta generación “Hoy se entiende que en los conflictos asimétricos la respuesta de uno los protagonistas frente a su oponente no enfatiza la búsqueda de una paridad de fuerzas, sino el empleo de tácticas no convencionales; desde el punto de vista de las Fuerzas Armadas, esa forma de operar es percibida como profundamente diferente a la que orientó su organización y el desarrollo de sus sistemas de armas.” Fuente especificada no válida.

15 ARTÍCULO 3º de la Ley 1341 de 2009: SOCIEDAD DE LA INFORMACIÓN Y DEL CONOCIMIENTO. El Estado reconoce que el acceso y uso de las Tecnologías de la Información y las Comunicaciones, el despliegue y uso eficiente de la infraestructura, el desarrollo de contenidos y aplicaciones, la protección a los usuarios, la formación de talento humano en estas tecnologías y su carácter transversal, son pilares para la consolidación de las sociedades de la información y del conocimiento.Fuente especificada no válida.

32

colocándolas al servicio del mayor número de usuarios, igualmente plantea la necesidad de inversiones, “considerables en educación y formación para lograr esa conexión íntima entre la sociedad de la información y las sociedades del conocimiento”. (Sánchez Jiménez, 2007) En contraste la práctica de algunos sectores de la población es a minimizar el uso de los aparatos tecnológicos16, dos visiones contrarias en un mismo escenario.

Para la sociedad del futuro la que se está gestando, el manejo de la información es su gran problema, por ello se hace una distinción ya entre sociedades de la información y sociedades del conocimiento.

Las sociedades de la información surgen con el uso e innovaciones intensivas de las tecnologías de la información y las comunicaciones, donde el incremento en la transferencia de información, modificó en muchos sentidos la forma en que se desarrollan muchas actividades en la sociedad moderna. Sin embargo, la información no es lo mismo que el conocimiento, ya que la información es efectivamente un instrumento del conocimiento, pero no es el conocimiento en sí, el conocimiento obedece a aquellos elementos que pueden ser comprendidos por cualquier mente humana razonable, mientras que la información son aquellos elementos que a la fecha obedecen principalmente a intereses comerciales, retrasando lo que para muchos en un futuro será la sociedad del conocimiento. (Panameños hacia una sociedad del conocimiento, 2007)

En otro sentido se puede decir, que las tecnologías de la información y la comunicación han estado presentes en la selección y desarrollo de nuevos medios, los que a su vez establecen nuevas relaciones, y nuevas formas de ver la realidad y los acontecimientos que se van presentando.

Las TIC desencadenaron una mayor velocidad en los avances científico-técnicos, revalorizaron las relaciones entre espacio y tiempo y aceleraron los procesos de globalización en todos los campos. Por eso, algunos autores no dudan en afirmar que la sociedad está frente a una nueva revolución tecno-científica, mucho más profunda que aquella que dio inicio a la sociedad industrial. La diferencia radica en que, mientras la sociedad industrial basó sus avances en la invención de nuevas máquinas, la sociedad del conocimiento actual, se fundamenta en la producción de información y conocimiento

16 En este sentido puede enlazarse este punto con el auge inusitado de las ecoaldeas o comunidades autosostenbles, es decir, aquellas que optimizan el uso de la energía, a través, de fuentes alternativas.

33

Pero esto da paso a otro proceso que realmente hace el cambio en el dominio de sus aplicaciones útiles en la sociedad y es la capacidad para identificar, producir, tratar, transformar, difundir y utilizar la información con vistas a crear y aplicar los conocimientos necesarios para el desarrollo humano. (Sánchez Jiménez, 2007)

La sociedad actual, como la vemos hoy en día no siempre ha sido de esta manera, en las últimas décadas ha sufrido cambios vertiginosos, desde el vapor en la revolución industrial, los cambios tecnológicos y ahora el uso de las tecnologías de la información y la comunicación, esta nueva sociedad es la que se conoce como la sociedad del conocimiento. En cualquier segmento de los negocios es muy importante la implementación de tecnologías que van a la vanguardia, el nivel de desarrollo va a pasos agigantados, y todos se preocupan en este mundo globalizado por incrementar la rentabilidad.

Se dice que la Sociedad del Conocimiento surge de la tercera revolución tecnológica del capitalismo. Las dos primeras habrían tenido lugar en la Sociedad Industrial, expresadas en los cambios tecnológicos. La primera, con el descubrimiento del vapor y la generalización del uso del carbón como recurso energético; la segunda, con el uso y apropiación de nuevas fuentes de energía, tales como la electricidad y los hidrocarburos. La revolución actual tendría su sustento en las llamadas TIC, tales como la microelectrónica, la biotecnología, las telecomunicaciones, el láser, la aeronáutica, etc. Esa nueva sociedad del conocimiento tiene su sustento en la generación y procesamiento estratégico de información como factores esenciales de la productividad y la competitividad en la nueva economía. (Acebedo R., 2010)

El manejo de la información en el mundo se está dando de manera acelerada y en volúmenes insospechados, todo ello fruto del avance tecnológico que tiene su influencia en todos los ambientes de la vida, las tecnologías de la información y la comunicación. Todo este cúmulo de información como conocimiento a través de las Tics se relaciona con el desarrollo económico y cultural de una región.

El Conocimiento como tal se incorpora a las redes del mercado y adquiere el valor que le imprime su estrecha relación con el uso y apropiación de las TIC. El grado de relación que tengan los territorios con este paradigma tecno-científico le permite estar dentro de la categoría de “ganadores” o “perdedores” y pertenecer o no al exclusivo sistema global de comando desde donde se trazan las líneas generales para la selección de los medios innovadores o se reciben sus beneficios. (Acebedo R., 2010)

34

La sociedad no se queda estática, cada nuevo elemento contribuye al avance, el alto volumen de información, como suma cuantitativa, conlleva necesariamente a cambios o transformaciones cualitativas, en este sentido se plantea las transformaciones de las sociedades de la información a las sociedades del conocimiento que son cualitativamente superiores, hay un vínculo profundo entre la generación del conocimiento, para lo cual los claustros universitarios son la cuna de tales fuentes generadoras de conocimiento, vinculado a la apropiación y el uso de las Tics

Las industrias no han dejado de ser el sector más productivo y la base material de las economías, lo que sucede es que hay sectores de esas industrias que transformaron la economía al incorporar en sus máquinas la microelectrónica o producir TIC, lo cual las colocó en un nivel de dinamismo superior con respecto a sus antecesoras. (Acebedo R., 2010)

Es esta sociedad del conocimiento la que lleva al desarrollo de una nueva forma de vida, nunca antes vista en la humanidad, la sociedad del microchip, la fibra óptica, donde el flujo de información, incluso de la moneda ya poco se hace real, sino que hay la posibilidad de hacerlo virtual, en relaciones de tiempo y espacio, es decir, con un simple click, millones de dólares pueden estar hoy aquí y después de un segundo al otro lado del mundo, esto establece una diferencia substancial entre lo que es un mundo web de otro.

La gran diferencia entre un sitio web y los medios tradicionales de comunicación es la unión entre el proceso de adquisición y el mensaje de promoción del producto o servicio. (Flores Vivar, 2005)

Aunque se planteen cuestiones generales es importante destacar que para el caso concreto de las regiones y las localidades, se deben tener en cuenta las condiciones concretas de tales localidades o regiones, como agentes potencializadores y posibilitadores del desarrollo.

Esto quiere decir que en cada país, región o localidad se definen las características de los procesos de innovación de acuerdo a sus particulares condiciones de desarrollo de las fuerzas productivas; a las posibilidades y potencialidades que tengan según las características de tiempo, espacio y técnicas; y a las dinámicas propias que le imprimen los actores sociales en términos de la velocidad y dirección de tales cambios. El territorio del conocimiento por lo tanto es heterogéneo como lo es la sociedad y se define a partir del conflicto de intereses que se desarrollan sobre él. (Acebedo R., 2010)

Tales agentes posibilitadores de cambios y desarrollos en la sociedad, son los que van llevando a la sociedad del conocimiento, llevando la sociedad a un ritmo

35

nunca antes visto en la historia de la humanidad, lo que a su vez transforma la economía, haciéndola más universal, como es el caso de las tecnologías GSM, es decir, ingresar a la peligrosa guerra de mercados globales.

Estamos viendo surgir un verdadero mercado digital universal. Su origen se halla en el considerable crecimiento que se ha producido en las dos últimas décadas en los ámbitos de las llamadas telefónicas y más recientemente de las comunicaciones móviles GSM, crecimiento acompañado de fuertes reducciones de precios, generadas por una reducción de los costes y una mayor competencia, así como por el considerable desarrollo de las redes de datos, en particular, Internet, que está destinado a acoger una proporción cada vez mayor del tráfico internacional en los próximos años. (Flores Vivar, 2005)

La Red es un medio fundamentalmente cognitivo, ya es conocido el principio que dice una imagen vale mas que mil palabras, esto requiere de procesamiento de información, a diferencia de la televisión, donde predomina el componente emocional. El hipertexto requiere un estilo de escritura diferente del de los medios impresos. La gran diferencia entre un sitio web y los medios tradicionales de comunicación es la unión entre el proceso de adquisición y el mensaje de promoción del producto o servicio. (Torres, 2011)

Está claro que Internet representa un desafío en muchos aspectos de la vida social y profesional de las personas, y los medios de comunicación es uno de los sectores más problemáticas (sic) para afrontar estos desafíos. Durante los últimos años, ha habido predicciones como el final de las corporaciones de los medios a gran escala, la muerte de los periódicos y el diluvio de la piratería en línea, primero, con la música y ahora, cada vez más, con el material audiovisual. (Flores Vivar, 2005)

De acuerdo a esta definición, esa relación espacio-temporal se genera en torno a los flujos de una red inmaterial como expresión del movimiento en la nueva sociedad del conocimiento. Y el soporte fundamental de ese movimiento lo garantizan las TIC, quienes generan una nueva concepción del espacio a través de un sistema en red y unos flujos de información en tiempo real. En efecto, el perfeccionamiento tecnológico en torno a la velocidad de las comunicaciones a través de la fibra óptica y otros recursos técnicos ha logrado romper el concepto de distancia medido en unidades métricas o cronológicas para reemplazarlo por la velocidad de transmisión de los bits. (Acebedo R., 2010)

36

En este contexto, se están produciendo varios cambios en la base de la cultura, dentro de los cuales se destacan por lo menos cinco (tomado de (Acebedo R., 2010)):

La relación cada vez más generalizada entre la internet con la aparición de nuevas dinámicas y comportamientos culturales que se expresan en comunidades virtuales de diferente naturaleza (Tecno-cultura). Ligado a lo anterior, la aparición de una cultura digital en los medios de comunicación y en los sistemas de transmisión de valores en general (aparato educativo, radio, televisión, lengua, etc.).

La conformación de comunidades con intereses específicos, algunas apoyadas en internet y otras en su contra, que generan resistencias a los procesos de homogenización y reivindican sus propias expresiones culturales (Contracultura). Se trata, por ejemplo, de las llamadas tribus urbanas, grupos de interés (los ecologistas, por ejemplo), o expresiones organizativas de proyectos alternativos que buscan imponer nuevos sistemas de valores – en algunos casos totalmente opuestos a los aceptados universalmente- como los grupos armados, partidos políticos de oposición, movimientos sociales, e inclusive, narcotraficantes, bandas criminales, entre otros.

Las diferentes etnias con sus cosmogonías, cosmovisiones y prácticas ancestrales (Etnocultura) que reivindican sus propios sistemas de valores, generalmente diferentes a la llamada cultura occidental. No siempre se encuentran en condición minoritaria como aparentemente se cree, y desarrollan innovaciones sociales, culturales y técnicas que no están asociadas a TICs o a la alta tecnología en general, pero que constituyen aportes muy significativos a una visión multicultural de los territorios del conocimiento.

Las llamadas Minorías, entendidas aquí como grupos sociales excluidos por diferentes circunstancias como las guerras, los conflictos, la pobreza, o incluso, los migrantes a causa de la búsqueda de opciones laborares más prósperas en otros países, lo cual genera situaciones de desarraigo. Los territorios del conocimiento deben generar respuestas inteligentes de educación, inclusión social y productiva a estos grupos.

Y finalmente, la Educación como una de las expresiones más importantes de la cultura y de la sociedad. Los territorios del conocimiento depositan en la educación una gran expectativa para lograr vencer el círculo vicioso de la pobreza y consolidar el círculo virtuoso de la innovación social y productiva. Esto implica garantizar el acceso universal a la educación en todos los niveles pero también un sólido sistema de Ciencia, Tecnología e Innovación que permita identificar las áreas prioritarias de actuación y acceder a recursos

37

crecientes del PIB nacional y regional para financiar las investigaciones y el cambio cultural, tecnológico y productivo. (Acebedo R., 2010)

En este orden de ideas es pertinente hablar de la sociedad de la información, donde las Tecnologías de la investigación y las comunicaciones17, es importante para el mundo actual tener su reflejo en el ciber-espacio, incluso a manera de chiste se dice que quien no este en la internet no existe, en este sentido es importante desarrollar un trabajo concienzudo y planificado para hacer ese reflejo de la sociedad real, en la autopista de la información.18

La investigación realizada por (Flores Vivar, 2005) tiene un doble valor: por un lado, se trata de una de las primeras investigaciones a escala internacional sobre Internet como medio de comunicación y, por otro, quiere ser la primera radiografía sobre las transformaciones de los medios de comunicación en Europa debido a la implantación de la Red y el uso de las tecnologías de la información y la comunicación. (Flores Vivar, 2005) Brinda herramienta especiales de como se está desarrollando el consumo.

La revolución de Internet, que en la última década ha transformado de manera radical el mundo de la comunicación y del consumo, no ha hecho más que empezar. Los verdaderos cambios, para bien y para mal, están aún por llegar. La sociedad nunca volverá a ser la misma. (Flores Vivar, 2005)

Sin embargo esto no es solo para la última década, el mismo autor hace una comparación con otra transformación en la sociedad

Durante las dos últimas décadas, la profesión del periodismo y el sector de los medios de comunicación han sufrido más avances tecnológicos que en cualquier otra época desde la aparición de las máquinas automáticas de fotocomposición y las rotativas rápidas a finales del siglo XIX. (Flores Vivar, 2005)

No obstante, el autor no solo se queda en hacer la observación del pasado, sino de hacer una visión hacia el futuro en los medios de información, a partir del avance vertiginoso de los medios como la internet entre otras tecnologías de información y la comunicación, en este sentido plantea:

17 Concretamente expresándolo el programa Ingeniería de sistemas y telecomunicaciones de la UCP

18 Por ejemplo en respuesta a la pregunta de cómo encontrar información veraz y válida en la internet, la maestra Idoia Salazar responde: “Tan solo hay que saber la técnica adecuada en cada caso, y no conformarse con usar únicamente las herramientas y métodos más conocidos…”

38

Algunos profesionales y personas expertas defienden que el periódico del futuro no será impreso, sino un servicio electrónico de información disponible de forma instantánea en los hogares europeos. Muchos editores ya incluyen una versión online de su periódico en Internet, con acceso a todo aquel que disponga de un ordenador personal con conexión a la Red. De hecho, ningún medio de prensa europeo que se precie de ser un periódico serio, deja de tener presencia más o menos abundante en Internet (Flores Vivar, 2005)

En este sentido el autor hace un llamado de atención frente a los múltiples peligros que encarna el uso de internet, frente a la vigilancia sobre los mismos contenidos web.

Sin embargo, todo este despliegue entraña un peligro evidente porque cada vez más datos de millones de ciudadanos circulan por la Red y los expertos de Pew Internet prevén que se incrementarán en los próximos años las detenciones a través de una vigilancia constante de la misma, que será ejercida tanto por los gobiernos democráticos como por los regímenes autoritarios. Y no sólo esto. Además de estar interrelacionados por múltiples ingenios, algunos científicos especulan con que muy pronto todos, seres humanos y animales domésticos, llevaremos bajo la piel chips de identificación por radiofrecuencia (RFID), una especie de DNI digital del tamaño de una pegatina en el que podrá grabarse, por ejemplo, la historia clínica de un sujeto. (Flores Vivar, 2005)

La Red es un medio fundamentalmente operativo que requiere de procesamiento de información, a diferencia de la televisión, donde predomina el componente emocional. El hipertexto requiere un estilo de escritura diferente del de los medios impresos.

La exclusión de la información no sólo es una cuestión de acceso y conexión, sino también de contenidos. Tiene que ver tanto con la brecha digital como con la brecha cognitiva, y guarda relación con los obstáculos educativos, culturales y lingüísticos que hacen de Internet un objeto extraño e inaccesible para las poblaciones que han quedado confinadas en los márgenes de la mundialización. (Sánchez Jiménez, 2007)

Las diferencias fundamentales entre distintos sectores de la sociedad vienen aumentando, y contrario a lo que se cree, que por su masificación los medios masivos de comunicación están democratizando la sociedad, por el contrario la brecha continua ampliándose, es decir, los pobres siguen siendo muchos más y la pobreza se profundiza y los ricos, muy ricos, siguen siendo cada vez menos.

La sociedad del conocimiento se halla en estos momentos en el inicio de una revolución que indefectiblemente producirá la

39

implantación generalizada de las nuevas tecnologías de la información y de la comunicación que regirán el futuro de los sistemas económicos, la innovación cultural, las interacciones humanas y evidentemente los procesos y circunstancias del aprendizaje y de la educación. (Sánchez Asín, Boix Peinado, & Jurado de los Santos, 2009)

40

3. MARCO TEORICO

3.1. ANTECEDENTES

Existe gran cantidad de artículos, libros y documentos científicos en los que se mencionan las buenas nuevas de la Web Semántica (WS), resaltando que este es un proyecto abalado y motivado por la W3C, también es de destacar que profesionales en el sector en países como España ven con ansia el ser protagónicos en el desarrollo y aplicación de técnicas y herramientas que día a día dan vida a la WS. En Colombia ya ha sido tema de estudio esta tecnología incluso hay proyectos con el objetivo de adaptar ontologías a entornos específicos, entre los que se mencionan avances para el desarrollo de aplicaciones en bibliotecas. A continuación se da mención a aquellos trabajos cuyos contenidos orientados a la investigación de los autores, han sido los que han ordenado la producción de esta monografía.

Debe tenerse en cuenta que La Web Semántica es una tecnología emergente, donde el desarrollo e implementación, es hasta ahora solo unos cuantos pasos de los que se deben dar para llegar a un estado de consumación casi total. Como lo dice Codina:

Puede decirse que se han desarrollado: URI/IRI, XML y RDF. A grandes rasgos, se trata de la infraestructura de la Web actual, salvo por lo que hace a RDF que es un sistema muy sofisticado de codificación de metadatos todavía muy poco implantado, precisamente por su complejidad. (Codina, Internet invisible y web semántica: ¿el futuro de los sistemas de información en línea?, 2003)

i) En la revisión se encontró un Artículo publicado en la revista científica Avances en Sistemas e Informática derivado de la investigación: “Desarrollo de un Sistema de Recuperación de Información Semántico” Especializado en Artes Plásticas y Hábitat, Proyecto financiado por la DIME de la Universidad Nacional de Colombia, Sede Medellín. Cuyo título es: “SABIOS: una aplicación de la Web semántica para la gestión de documentos digitales” de los autores Jaime A. Guzmán Luna, Durley Torres Pardo, Demetrio A. Ovalle, donde plantean como resumen que:

La Web semántica, pretende convertir la información en conocimiento. Para ello, se basa fundamentalmente en el marcado semántico y descriptivo no sólo de los documentos, sino también de los datos, por medio de información estructurada y legible automáticamente, que proporciona a las máquinas una mayor capacidad para gestionar y recuperar esos datos. SABIOS, se propone precisamente, la introducción de las tecnologías emergentes basadas

41

en semántica, combinadas con sistemas Multiagentes y técnicas de recuperación información para permitir mejorar los procesos de inserción, catalogación y recuperación de documentos digitales, implementando para ello un sistema compuesto por tres módulos: un módulo de conocimiento, un módulo de búsqueda semántica y finalmente un módulo de visualización y navegación de resultados. (Giraldo, Guzmán, & Ceballos, 2006)

ii) De la misma manera se ha encontrado el Artículo derivado de la investigación: Desarrollo de un sistema de recuperación de información semántico especializado en artes plásticas y hábitat. Universidad Nacional de Colombia sede Medellín. Facultad de Arquitectura. Inicio: noviembre de 2005, finalización: noviembre de 2006. Artículo recibido el 22 de agosto, evaluado el 31 de octubre y aceptado con modificaciones el 8 de noviembre de 2006, con el título. "DESARROLLO DE UNA ONTOLOGÍA EN EL CONTEXTO DE LA WEB SEMÁNTICA A PARTIR DE UN TESAURO DOCUMENTAL TRADICIONAL" y cuyos autores son: Jaime A. Guzmán Luna, Durley Torres Pardo, Alba Nubia López García, y cuyo RESUMEN es:

Un tesauro es una herramienta documental que se emplea para catalogar y recuperar información en entornos especializados. En la búsqueda de mejores alternativas para la representación de los recursos de información, las Ontologías en el contexto de la web semántica están siendo vistas como una nueva opción para representar el conocimiento existente en los tesauros, ya que se ha demostrado que permiten mejorar la precisión y reutilización de todo tipo de conocimiento. El objetivo de este trabajo es presentar una opción para la migración de un tesauro documental tradicional a una ontología en el entorno de la web semántica, con el fin de permitir su uso en la recuperación de documentos

iii) En otro sentido en la Universidad Tecnológica de Pereira se adelantó el trabajo de investigación con título: “LA WEB SOCIAL PARA LA ADMINISTRACIÓN POR PROYECTOS Y COMPETENCIAS EN LAS PYMES DEL EJE CAFETERO”, de los autores: Marcelo López Trujillo, Luis Joyanes Aguilar, Jairo Pineda A., el cual tiene como resumen:

Las pequeñas y medianas empresas (PyMEs) de la zona denominada el Eje Cafetero (Colombia), tienen un gran potencial de generar progreso y bienestar social por su naturaleza dinamizadora de la economía, en la medida que cada vez vayan siendo más protagonistas de la economía del conocimiento y puedan desarrollar su razón y responsabilidad social. Se presenta en este artículo una arquitectura web social para incorporar la administración por proyectos y competencias en las pymes utilizando el poder la web social para la

42

inteligencia colectiva, la participación, la comunicación y el trabajo colaborativo.

iv) Con el título "Prototipo de buscador semántico aplicado a la búsqueda de libros de ingeniería de sistemas y computación en la biblioteca Jorge Roa Martínez de la Universidad Tecnológica de Pereira” de los autores : Moreno Agudelo, Carlos Arturo y Sánchez Reyes, Yakeline, con el resumen:

A través de los últimos años se ha evidenciado la necesidad de dar mayor sentido a los resultados obtenidos en las búsquedas en la web, debido al crecimiento vertiginoso de la información disponible en internet y que a la hora de realizar una búsqueda, la cantidad de resultados obtenidos se empieza a medir en millones. Muchos de los buscadores actuales realizan una búsqueda basada en estadísticas, ilustrando una lista de páginas web que pueden contener la respuesta, dejando el trabajo al usuario de filtrar todos estos resultados de tal forma que pueda encontrar lo que busca, lo cual se configura en una tarea bastante compleja dado la cantidad de resultados obtenidos. El gigante de los buscadores, Google, cambia ahora su política de privacidad, de donde se destaca el hecho de que con esta nueva política los diferentes servicios de Google como Youtube, Gmail, Picasa, etc, compartirán la información de los usuarios, es decir, como ya es tradicional en estos portales, almacenan la información de lo que se busca para poder enfocar las sugerencias que se muestra, por ejemplo si se busca un video de perros en Youtube las sugerencias que se muestre serán referente a mascotas, pero con la nueva política al buscar el video, posteriormente en los demás servicios como Google+ aparecerán sugerencias basadas en los videos que se buscaron. Por lo que se puede ver que este sistema de búsqueda es de igual forma basado en estadísticas. Los buscadores semánticos en cambio, encuentran resultados en función del contexto, información más exacta acerca de lo que se busca, ofreciendo una cantidad de resultados mas sesgada, facilitando la labor de filtrar los resultados por parte del usuario. Desde el punto de vista investigativo, la semántica aplicada a sistemas de búsqueda de información es un tema que a nivel mundial ha madurado, debido a la cantidad de beneficios que promete y a su creciente acogida en las funcionalidades de la web, considerándose pues el estudio de esta temática de gran interés y utilidad por parte de las nuevas generaciones de ingenieros que en gran medida se postulan como los desarrolladores de las tecnologías venideras.

v) Requiere especial mención el trabajo de bello y sonoro título “Ontologías, web semántica, metadatos para ver con los oídos, oír con los ojos, hablar para todos” un especial trabajo realizado por la investigadora Ana

43

María López Echeverry, y sus compañeros Juan de Jesús Veloza Mora, Saulo de Jesús Torres R. con el Resumen:

Investigación Reflexiva de Web Semántica para el Doctorado en Ingeniería del Software con la UPSAM, basándose en la demanda de personas discapacitadas que requieren acceder a la Web. Los diseñadores de ontologías en la Web Semántica deben construir páginas universales, evitando volver a ésta muda, sorda, inaccesible. Investigando definiciones formales sobre: Sistema de Información, Calidad, Estándares de WAI, WCAG, W3C, directrices para WEB 1,0 y WEB 2.0, investigaciones de SIDAR y normas legales sobre diseño de sistemas accesibles. Se observa la carencia en la Ingeniería WEB de: sensibilidad, conocimiento de directrices, legislaciones precisas sobre diseños con Calidad y accesibilidad.

vi) En la universidad Autónoma de Madrid se abre un grupo de investigación liderado por Pablo Castell entorno a la web semántica con un enfoque especial en las interfaces de usuario de aplicaciones de web semántica. En un documento escrito por Castell “Aplicación de técnicas de la web semántica” describe su proyecto de la siguiente manera:

En nuestro grupo de la Universidad Autónoma de Madrid hemos puesto en marcha una línea de investigación dedicada a la web semántica. En particular, y en el contexto de los temas de interés para AIPO, nos hemos preocupado por la interacción del usuario con la web semántica [Castells 2002b]. La web semántica plantea problemas de construcción, manipulación, consumo, intercambio y aprovechamiento del conocimiento y las estructuras que lo soportan. Surgen nuevas necesidades que resolver a la vez que nuevas posibilidades para mejorar la interacción con el usuario, o facilitar el desarrollo de interfaces. Hemos observado un cierto vacío en cuanto a herramientas para la interfaz de usuario específicamente orientadas a la manipulación de conocimiento basado en ontologías. Se han desarrollado herramientas de autor interactivas para la construcción de ontologías como Protégé [Noy 2001] y OilEd [Bechhofer 2001], pero en nuestro conocimiento no se ha producido aún una tecnología de soporte genérica para dotar de interfaz de usuario a las aplicaciones de la web semántica.

vii) En el curso de Doctorado: INGENIERÍA WEB, Jose Luis Arceiz Baquero desarrolla el documento “LA WEB SEMÁNTICA” en el cual aborda las tecnologías que rodean y conforman la web semántica. Se presenta a continuación el resumen del documento:

44

La web semántica es un área pujante nacida en la confluencia de la inteligencia artificial y las tecnologías web, que propone nuevas técnicas y paradigmas para la representación del conocimiento que faciliten la localización, compartición e integración de recursos a través de la web [Berners Lee 2001]. Estas nuevas técnicas se basan en la introducción de conocimiento semántico explícito que describa y/o estructure la información y servicios disponibles, de forma susceptible de ser procesada automáticamente por un programa. La web semántica mantiene los principios que han hecho un éxito de la web actual, como son los principios de descentralización, compartición, compatibilidad, y la apertura al crecimiento. En este contexto un problema clave es alcanzar un entendimiento entre usuarios, desarrolladores y programas de muy diverso perfil. Uno de los ejes principales de esta visión es la noción de ontología, rescatada del campo de la Inteligencia artificial, como herramienta clave para alcanzar dicho entendimiento o entre las partes que participan de este conocimiento común.

viii) La universidad Pompeu Fabra desarrollo el libro “Tendencias en documentación digital”, en el que se dedica un capítulo a la explicación de la web semántica, los autores de dicho capitulo son: Lluís Codina y Cristófol Rovira. Cuyo resumen es:

La Web semántica es un proyecto a corto, medio y largo plazo del organismo de regulación más importante del mundo en relación a Internet: el World Wide Web Consortium (W3C a partir de ahora). El proyecto de la Web semántica incluye transformaciones que ya están afectando a los ámbitos de la creación, edición y publicación de páginas y sitios Web2 y que seguirán teniendo una importancia creciente en el futuro.

Este capítulo expondrá los conceptos e ideas más importantes relacionadas con la Web semántica, siempre con el telón de fondo de los intereses de la Biblioteconomía- Documentación.

iX) El libro “WEB SEMANTICA Y SISTEMAS DE INFORMACION DOCUMENTAL” desarrollado por 14 autores cuyos coordinadores fueron: Luís Codina, Mari Carmen Marcos y Rafael Pedraza, aborda la web semántica desde el manejo de la información, a continuación la presentación del ejemplar:

El proyecto de la web semántica, desarrollado e impulsado por el W3 Consortium, el consorcio internacional que guía el desarrollo de la web, parte de una idea genial: ¿Qué pasaría si las páginas web pudieran ser procesadas como datos de entrada de programas de ordenador y no solamente como algo destinado a ser mostrado en

45

pantallas para que los vean los seres humanos? Podrían pasar cosas magníficas. La actual Web 2.0 no es, ciertamente, la web semántica, pero casi todo el mundo reconoce que ha aportado cambios espectaculares y podría ser un buen ejemplo de lo que podríamos esperar.

Lo que necesitamos para pasar de la Web como documentos (la Web actual) a la Web como datos (la Web semántica) es que en primer lugar, las páginas incluyan, además de contenidos para los seres humanos (información), contenidos para los ordenadores (metainformación). Ahora bien, la Web tiene alcance universal, así que necesitamos sistemas de metadatos (o meta informaciones) susceptibles de uso universal e interpretables por ordenadores. En segundo lugar, necesitamos una especie de superclasificaciones o supertesauros formales (ontologías) que ayuden a los ordenadores a realizar inferencias validas sobre los datos. Eventualmente, agentes de software, en representación de los usuarios, podría llevar a buen término tareas para las cuales ahora se requiere inteligencia, o sea, tareas que solo las personas hoy pueden llevar con éxito.

En esta obra presentamos una visión panorámica sobre el proyecto de la Web semántica y sus diversos componentes. En los primeros capítulos se presenta una visión global que aspira a mostrar las distintas visiones de la Web semántica. En el resto de la obra los autores han procurado ceñirse a las posibilidades actuales y futuras de la Web semántica, entendida sobre todo en relación con su impacto en los sistemas de información documental. Como background general de la obra, se ha intentado considerar las clases de necesidades, tareas y objetivos que suelen tener los profesionales, estudiosos e investigadores de los sistemas de información documental.

Si los autores y los editores de este libro comparten algunas ideas comunes, estas consisten en la convicción de que el colectivo de profesionales de la biblioteconomía-documentación no solo debe conocer el proyecto del Word Wide Web Consortium, sino que tiene que formar parte de sus protagonistas, y que el conjunto de las nuevas ideas, modelos conceptuales, normas, recomendaciones o lenguajes de la Web semántica está llamando a tener una influencia duradera en muchos aspectos de la biblioteconomía-documentación, lo cual nos lleva de nuevo a la primera idea: al protagonismo que nuestro colectivo puede y debe tener en el proyecto de la Web semántica. Esa es, con toda modestia, pero sin complejos, la aspiración de esta obra.

x) La Web Semántica como apoyo a la Gestión del Conocimiento y al Modelado Organizacional

46

Mario Barceló Valenzuela, Guzmán Gerardo Alfonso Sánchez Schmitz, Alonso Pérez Soltero. Investigadores del Grupo de Investigación en Tecnologías de la Información de la Universidad de Sonora, México, actualmente en el Doctorado en Nuevas Tecnologías de la Información y las Comunicaciones en la Universidad de Murcia, España

Resumen

El presente artículo muestra parte del contexto actual de la Web Semántica, orientada hacia la Gestión del conocimiento y al modelado en las organizaciones, donde prácticamente se centra el interés particular de nuestro grupo en la Universidad de Sonora en el Noroeste de México. Se plasma una visión general de la gestión del conocimiento empresarial, de sus diferentes elementos relacionados a sus activos de conocimiento y al modelado, para después dar un breve bosquejo de Web Semántica, donde se exponen algunas herramientas, tecnologías y software relacionados a la misma. Posteriormente se exponen algunas de las principales tendencias y desarrollos actuales, finalmente concluimos que la integración de las tecnologías de Web Semántica con los Sistemas de Información de la Empresa permitirán desarrollar de manera más natural sistemas basados en conocimiento, pero para potenciar su uso será importante darle mayor integración hacia las técnicas y herramientas que ofrece la Web Semántica. (Barceló Valenzuela, Sanchez Schmitz, & Perez Soltero, La Web Semántica como apoyo a la Gestión del Conocimiento y al Modelado Organizacional, 2006)

Si la web semántica no existe, ¿qué es en estos momentos? De momento, es el nombre de una aspiración; el nombre de un objetivo muy ambicioso que, de cumplirse, cambiaría de forma radical la Web tal como la conocemos hoy. ¿En qué consiste esta aspiración? Ni más ni menos que en conseguir que las páginas que forman la Web dejen de ser simples cadenas de caracteres para los ordenadores y se conviertan en textos con sentido, es decir, texto provisto de semántica, tal como, de hecho, lo es para los seres humanos. (Codina, Internet invisible y web semántica: ¿el futuro de los sistemas de información en línea?, 2003)

Por tanto, las posibilidades de que la web semántica sea una realidad tal como la presenta el W3 Consortium, sin que se produzca antes, al menos un cambio de paradigma de gran calado en las ciencias de la computación, son ridículas. Además, necesitaremos en paralelo cambios no menos importantes en otras áreas, incluyendo, por supuesto, en las ciencias de la documentación. (Codina, Internet invisible y web semántica: ¿el futuro de los sistemas de información en línea?, 2003)

47

XI) DESARROLLO DE UN AGENTE BUSCADOR INTELIGENTE DE METADATOS GEOGRAFICOS PARA LA UNISIG, por: Edison Leonardo Naranjo Diaz y Juan Pablo Tandazo Rodriguez. Como proyecto previo a la obtención del título de Ingeniero en Sistemas Informáticos y de Computación. Para la Escuela Politécnica Nacional con el siguiente resumen.

Este trabajo básicamente se resume en un sistema de agentes inteligentes de búsqueda de metadatos geográficos, denominado con el nombre ABIMETAGIS, construido para la Unidad de Inteligencia Artificial y Sistemas de Información Geográfica (UNISIG) de la Escuela Politécnica Nacional. En la construcción de este sistema se implanta la arquitectura de la Web Semántica, demostrando su utilidad junto a la inteligencia artificial representada en un motor de razonamiento empotrado a los agentes de software. Esta mezcla de tecnologías es considerada como una futura versión de la Web actual, haciendo que la información sea mejor definida y comprensible para las computadoras, representándola en un leguaje ontológico permitiendo que los computadores puedan desarrollar actividades más complejas y útiles para los usuarios mediante la comunicación realizada entre agentes inteligentes. La Web semántica es propuesta por varios autores, entre los que se le destaca a Tim Berners-Lee, quien la ideó.

En el primer capítulo se expone el marco teórico acerca de la estructura de la Web Semántica y sus tecnologías desarrolladas y emergentes, Ontologías y lenguajes ontológicos, metadatos geográficos, sistemas basados en conocimientos, agentes inteligentes, metodologías, tecnologías y herramientas utilizadas para el desarrollo de ABIMETAGIS.

En los siguientes tres capítulos se desarrolla el análisis, diseño, implementación y pruebas del sistema.

El capítulo final contiene las conclusiones y recomendaciones del trabajo realizado. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

48

3.2. MARCO CONCEPTUAL

3.2.1. La Web

Las tecnologías de la información se están desarrollando vertiginosamente, posibilitando el acceso a más y más sectores de la población. Con la intención de dejar claro lo que es la web como protocolo que facilita el acceso a Internet Idoia Salazar menciona “La World Wide Web o Red de redes es uno de los muchos protocolos que permiten el acceso a internet y facilita a los usuarios internautas el acceso a los archivos que allí residen”. (SALAZAR, 2005)

Como lo confirma también Álvarez en su estudio:

La evolución de nuevas tecnologías en el mundo de lo que es el internet permitiéndonos tener acceso a la mayoría de información que nosotros necesitemos, también podemos enterarnos de lo que sucede en el resto del mundo, permitiendo una difusión sin precedentes, facilidad de acceso, inmediatez, economía de medios, extensión ilimitada, e información a la carta, eliminando las restricciones de tiempo y espacio. (Alvarez Yupa, 2013)

La World Wide Web ("telaraña de alcance mundial") o simplemente la Web, tuvo sus orígenes en 1989 en el CERN (Centro Europeo para la Investigación Nuclear) ubicado en Ginebra (Suiza), en circunstancias en que el investigador británico Tim Berners-Lee se dedicaba a “encontrar una solución efectiva al problema de la proliferación y la heterogeneidad de la información disponible en la Red”, (Portal Educativo de las Américas ), como línea de investigación, aún se encuentra latente, en presentes y futuros círculos científicos.

Internet inicia en 1990 cuando el hasta entonces ARPAnet, el proyecto militar que consistía en transferencia de información por paquetes (contenían información sobre la ruta que debían seguir) en una red de ordenadores, se divide en MILNET e INTERNET; el primero para uso militar e INTERNET con carácter público y orientado al ámbito científico e industrial, logrando tanto éxito que su desarrollo al día de hoy impacta directamente el ámbito social de la humanidad. Internet inicia prestando servicios de correo electrónico (E-Mail), World Wide web (WWW), transferencia de archivos (FTP), buscadores entre otros.

La web, es descrita por su creador Tim Berners-Lee como:

“[U]na forma de ver toda la información disponible en Internet como un continuo, sin rupturas. Utilizando saltos hipertextuales y búsquedas, el usuario navega a través de un mundo de información parcialmente creado a mano, parcialmente generado por computadoras de las bases de datos existentes y de los sistemas de información”.

49

Por estos momentos gran parte del contenido que se encuentra en la Web, en términos generales, está diseñado para seres humanos, de lo cual ha resultado una enorme y confusa cantidad de información, con dimensiones cada vez mayores, en este marasmo, hallar, indizar y extraer información, resulta ser complexo y hasta costoso, es decir, obtener alguna clase de conocimiento incluso permitir que parte de ese conocimiento pueda ser comprendido por las máquinas.

La primera versión es presentada a finales de los 80´s e inicios de los 90´s, la web 1.0, como primer paso en la búsqueda de Lee por encontrar una “solución efectiva al problema de la proliferación y la heterogeneidad de la información disponible en la Red” (Portal Educativo de las Américas ). Inicialmente se caracterizó por proponer un nuevo sistema de hipertexto para compartir documentos en internet llamado HTML, mucho mejor que el sistema utilizado hasta entonces por internet. (Portal Educativo de las Américas )

Ilustración 7 La Web en 1989

FUENTE: ( Gutiérrez & Hurtado, 2006)

50

La esencia de la web 1.0 fue la implementación de HyperText Markup Language (HTML), en “español Lenguaje de marcas de hipertexto”, esta tecnología, innovadora para la época, es el estándar que aceleró el proceso de aceptación de internet, por parte de los hasta entonces ingenuos usuarios.

Es pertinente diferenciar lo que representa la web para internet, como dice Idoia Salazar en su libro Las Profundidades de Internet:

“[A]ntes de entrar en este aspecto y para comprender realmente su importancia, merece una atención especial recordar la verdadera dimensión de internet. De internet y no de la World Wide Web o red de redes. Son muchos los que utilizan indistintamente ambos términos cuando, en realidad, su significado preciso dista mucho de parecerse. Bien puede decirse que la web es internet. Eso es cierto. Es internet, pero muchas cosas más también”. (SALAZAR, 2005)

Es importante tener en claro que antes de existir la web, encontrar y acceder a la información en internet era algo tedioso y era una tarea realizada por personas especializadas en el asunto. En este sentido hoy en día se puede afirmar que los buscadores de la web facilitan el acceso a archivos con contenidos de texto, imágenes, audio, video, entre otras tantas alternativas de comunicación, con la facilidad de movilidad entre un pantallazo y otro, que ofrece el hipertexto. Según (Baquero, 2013) El éxito de la Web reside en:

- Facilidad de acceso y contribución: mínimos requisitos.

- Descentralización.

- Compartición.

- Compatibilidad.

- Apertura al crecimiento y usos no previstos de antemano. (Baquero, 2013)

La web semántica busca dar solución al lenguaje natural para publicar datos que serán procesables por las máquinas, esto es publicar información para que sea entendible por los ordenadores, para que estos tengan datos contextuales y descriptivos del archivo, permitiendo una mejor posibilidad de búsqueda, reutilización y posibilidad de compartir información con otras aplicaciones. Esto es posible al utilizar ontologías que representan conceptos relacionados entre sí, dando forma a un sistema de información que represente conocimiento. Puede decirse que la Web semántica es un proyecto con metas anhelantes en cuanto a la clasificación de la información.

51

“the idea of having data on the Web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications” [W3C Semantic Web Activity (http://www.w3.org/2001/sw/)]

Como lo plantea el W3C en la idea de introducir datos a la web es buscar utilizar, automatizar, integrar y reutilizar la información en diversas aplicaciones. Como se observa en la siguiente ilustración en la web 1.0 las páginas eran estáticas, unidireccionales, con un usuario pasivo.

Ilustración 8 Estructura de la web 1.0

Fuente: http://maureeninternet.blogspot.com/2011/06/mapa-web-10.html

Ahora bien la web 2.0 es mas compleja y viene evolucionando, es notable el avance dado al diseño gráfico de las aplicaciones, desarrollando la arquitectura de la información, la cual permite llevar los niveles de automatización, como redifusión de contenidos, protocolo de mensajes, (Alvarez Yupa, 2013) buscadores basados en semántica mas que en sintáctica, y diversas aplicaciones para clientes. Debido a este enfoque y a los grandes volúmenes de información involucrados en el proceso, se hace evidente un embrollo, que cada vez tiene proporciones mayúsculas, tanto que el impacto generado en los medios masivos no se ha hecho esperar.

La Web 2.0 ha tenido un considerable impacto en los cibermedios, y todo apunta que se trata de una tendencia en alza,

http://maureeninternet.blogspot.com/2011/06/mapa-web-10.html

52

aunque hemos visto que la adaptación no es completa. Puede predecirse, dada la fuerza de la Web 2.0, que se acabarán añadiendo los elementos que ahora no están disponibles o no están demasiado bien integrados. (Codina, Internet invisible y web semántica: ¿el futuro de los sistemas de información en línea?, 2003)

Según (Baquero, 2013); Las características más reseñables de la Web actual:

- Biblioteca Digital con hipertexto: Enorme biblioteca con documentos (llamados páginas Web) conectados entre sí mediante enlaces

- Una base de datos (o plataforma común de aplicaciones): Un portal común de aplicaciones accesibles a través de páginas Web y que muestran sus resultados como páginas Web (Baquero, 2013)

Fuente: http://maureeninternet.blogspot.com/2011/06/mapa-web-10.html

Es necesario entender que el paso de una versión a otra de la web no es instantáneo o espontáneo, por el contrario, una es puente de desarrollo frente a la otra, esto lo confirma el mismo autor.

En este sentido, parece haber un consenso factual (no necesariamente expresado de forma explícita, al menos que nosotros sepamos) sobre la idea de que la Web 2.0 se puede representar mediante los siguientes componentes principales: i) Contenidos

Ilustración 9 Esquema de la Web 2.0

http://maureeninternet.blogspot.com/2011/06/mapa-web-10.html

53

creados por los usuarios (prosumidores19), ii) Redes sociales, iii) Aplicaciones en línea, iv) Herramientas de colaboración. (Codina, Internet invisible y web semántica: ¿el futuro de los sistemas de información en línea?, 2003)

A pesar de los problemas de la Web 2.0 en cuanto a la falta de estructuración de la información es importante resaltar la gran acogida que ha tenido por parte de los usuarios, ya que como se ha visto las nuevas versiones de la web deben acoplarse a la integración de estas cualidades a las nuevas versiones en el desarrollo de la www. En este sentido lo que ésta versión puede aportar al desarrollo de la siguiente versión la Web 3.0 es la “aplicación de web hibrida” (Alvarez Yupa, 2013), esto es una remezcla, llamada mashup, esto es una combinación de varias aplicaciones en una sola, para hallar una localización exacta.

En este sentido se espera un desarrollo, un avance, por ejemplo, el hecho que las búsquedas ya no son sintácticas, sino que son semánticas. En otras palabras, los buscadores no se enfocaran en las palabras claves contenidas en el archivo, sino en el significado de estas. (España, 2011)

Lo que se espera de la próxima versión de la web es el integrar datos y aplicaciones de variada índole, en cuestión de prestación de servicios informáticos ya se vislumbran especiales aplicaciones.

Por ejemplo, mediante la combinación de informaciones periodísticas con mapas interactivos; o con aplicaciones de minería de datos sobre la actividad de los políticos o de las grandes corporaciones. (Codina, Internet invisible y web semántica: ¿el futuro de los sistemas de información en línea?, 2003)

Entrar a definir la web 3.0 es arar en un terreno escabroso, ya que no es algo existente, sino de una especulación, o si se quiere una proyección de cómo va a evolucionar la web hacia el futuro.

Una forma de solucionar el problema (en falso) es lo que hacen algunos analistas y que consiste en identificar Web 3.0 con Web Semántica, por tanto, todo lo dicho sobre la Web Semántica le sería aplicable sin más. (Codina, Internet invisible y web semántica: ¿el futuro de los sistemas de información en línea?, 2003)

La web actual trae un problema, sobre información, ésta carga de información trae su problema de una baja en la calidad de lo accesado, sin la calidad ni el rigor necesarios, hace que el usuario a menudo se vea saturado de

19 El término prosumidor es un acrónimo formado por la contracción de las palabras “productor” y “consumidor”. Fue acuñado por Alvin Toffler en su obra La Tercera Ola (1980).

54

información y colmado de dudas. (España, 2011) Analizando estos problemas en el año de 1998 T. Berners-Lee propone la Web Semántica con una publicación en “Overview of the future of the Web”. Posteriormente publica dos documentos denominados “Semantic Web Road Map” y “What the Semantic Web can represent”. Sin embargo la propuesta formal se elaboró en el artículo "The Semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities", de la revista “Scientific American” en mayo del 2001, donde se explica su idea de la Web Semántica y los primeros pasos que hay que dar para llevarla a cabo. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

La invención de la web semántica es la evolución de la web esencial o inicial. Es importante en este punto recordar las circunstancias en las que se creó la web, en donde el investigador británico Tim Berners-Lee se dedicaba a encontrar una solución efectiva al problema de la proliferación y la heterogeneidad de los datos disponible en la Red, (Portal Educativo de las Américas ), es posible ahora hablar que la web ha tenido una evolución notable que continua en la actualidad y porque no decirlo, todo en aras de un sistema que haga las cosas mas fáciles para los usuarios de internet, especialmente búsqueda de la información.

Las “antiguas” y las nuevas tecnologías de la información no se sustituyen sino que se complementan, porque las primeras contribuyen eficazmente a la difusión de los conocimientos y facilitan así el acceso a las segundas. (Sánchez Jiménez, 2007) Es decir a la web del conocimiento.

El problema no es la información sino la no estructuración de contenidos que se suben a internet, una de las ventajas de la web que conocemos hoy día es la descentralización de información que de alguna manera es su esencia. La web semántica busca dar una estructura a todos o por lo menos a una parte significativa de los contenidos que contiene internet. Idoia Salazar en su libro las profundidades de internet utiliza la expresión “del caos al orden” para referirse a la gran cantidad de contenidos que alberga hoy la web, en forma de un gran universo caótico, dicho universo caótico de información es el que la web 3.0 pretende estructurar u ordenar con la intención de ofrecer mejores servicios, aprovechando además las ventajas que la cuarta generación de telefonía móvil trae consigo, como son, mayor movilidad, banda ancha, velocidad de navegación entre los muchos beneficios que esta tecnología aporta al desarrollo tecnológico de web.

Sin embargo para llegar a ese estado ideal de web semántica, o una web con la aplicación de ontologías adecuadas, aplicando mas la inteligencia artificial en la racionalización, o aplicaciones lógicas, de los contenidos a hallar en el insondable mundo de la internet.

La semántica implícita en la Web actual se refleja en las respuestas que recibe un usuario a sus peticiones en los buscadores,

55

ya que éstas van más allá del estado en el que los usuarios simplemente realizaban una pregunta y recibían un conjunto ordenado por prioridad de páginas web. Las respuestas deberían contener información de fuentes autorizadas, términos con el mismo significado a los usados en la pregunta, enlaces relevantes. En este contexto en el que la mayoría de los contenidos de la Web están pensados para que los lea un ser humano y no para que los manipule un sistema informático de forma significativa. (Alvarez Yupa, 2013)

3.2.2. Tendencias

Existe un gran interés desde el entorno corporativo, el sector público y el mundo académico por hacer de la web semántica una realidad, ya que se piensa que puede ser una pieza importante para el progreso de la sociedad de la información. Para ello se está invirtiendo un gran esfuerzo en desarrollar:

a) la infraestructura necesaria para su despliegue,

b) aplicaciones que demuestren la viabilidad y el beneficio de la web semántica y a la vez motiven el desarrollo y consumo de infraestructura y

c) nuevas soluciones para resolver problemas específicos, e ideas que mejoren, amplíen y/o exploten las posibilidades de la web semántica.

Entre las principales líneas de trabajo que están siendo objeto de atención cabe citar: Lenguajes de definición de ontologías, Metodologías de desarrollo de ontologías, Integración de ontologías, Aprendizaje de ontologías, Desarrollo de vocabularios en dominios concretos, Agentes y Servicios web. (Castells)

Como se observa en la siguiente ilustración, se presenta un cambio significativo, cualitativamente diferente entre la web actual y la web semántica, a partir de la relación con diferentes características tales como la semántica, editabilidad, lenguaje, interactividad, entre otros aspectos, permitiendo información con archivos estructurados, dinámicos, bidireccional, organizada para humanos y ordenadores, siendo descentralizada a la postre siendo un bricolaje de contenidos etiquetados.

56

Ilustración 10 Cuadro comparativo web actual y semántica

Fuente: (Baquero, 2013)

3.2.3. Linke Data

Para plantearlo clara y directamente linked data es la base de la web semántica, son los datos vinculados, haciendo referencia a que estos datos deben estar siempre vinculados, esto se espera lograr con un formato estándar RDF. La linked data se encuentra en el corazón mismo de la web semántica.

The Semantic Web is a Web of Data — of dates and titles and part numbers and chemical properties and any other data one might conceive of. The collection of Semantic Web technologies (RDF, OWL, SKOS, SPARQL, etc.) provides an environment where application can query that data, draw inferences using vocabularies, etc. (W3C, 2013)

En otras palabras, todo documento está etiquetado con autor fecha, titulo, entre otra serie de propiedades, en ese sentido las tecnologías de la web semántica,

57

van a permitir consultar los datos y realizar inferencias, relaciones, utilizando los datos.

La web semántica no solo necesita accesos a los datos, sino también vincularlos, esto es linked data. Para lograrlo es necesario que las tecnologías estén disponibles para un formato común RDF, (W3C, 2013) haciendo la conversión a las bases de datos existentes, para tener acceso a los datos a partir de una gran variedad de tecnologías.

3.3. TEORIAS Y TECNOLOGIAS

Según (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007) los requerimientos tecnológicos para realizar la web semántica, están básicamente encaminados a la implementación y desarrollo de:

Lenguajes de marcado.- Lenguajes apropiados para representar, el contenido semántico y los conocimientos que contienen las ontologías (XML, XML Schema).

Metadatos.- Recursos que proveen información acerca de sí mismos, en formato común y procesable por las máquinas (RDF, RDF Schema).

Ontologías.- Utilizadas para representar el conocimiento (OIL, DAML, DAML+OIL, OWL).

Agentes y aplicaciones Web.- Software que funciona dentro del ambiente de Web Semántica.

Sin embargo en este aspecto se podría también entonces plantear otro elemento a los tres arriba mencionados, este es la Arquitectura de la información.20 La Web Semántica es una tecnología ligada a la documentación, tal y como se ha planteado en los antecedentes, la Información se ha convertido en un elemento muy importante en esta época. Es importante anotar aquí, como contribución a este trabajo que la web semántica además está ligado enlaza a la arquitectura de la información, a esta nuevo enfoque que trabajando de la mano con los arquitectos del software como dos manos en un cuerpo, como máquina perfecta, realiza doble labor y complementaria, es decir, mientras la arquitectura de la información organiza, ubica, cataloga, la arquitectura del software funcionando dentro un

20 Así mismo como en el desarrollo del software se requiere una arquitectura, pasar de la tara de los desarrolladores colombianos, que realizan artesanía del software, mientras que la arquitectura planea, diseña, está preparada, se anticipa en los detalles, con objetivos claros que solucionen esos problemas, no es un asunto de creer o suponer, casi que imaginar las soluciones como lo hace el artesano, sino estar preparado como lo hace el arquitecto

58

ambiente de web semántica va evolucionando, agilizando, enlazando, desarrollando.

3.3.1. Arquitectura de la información

Las empresas, las entidades académicas, el gobierno nacional, todos estos han hecho evidente el problema que representa tener una documentación ordenada y de fácil acceso. Hay una disciplina que ayuda al desarrollo de esta tecnología, “la arquitectura de la información”, ésta viene como salvadora, en un momento donde la información contenida en la web se encuentra en un caos total, contando con grandes cantidades de datos, mientras se hace evidente la falta de estructuración de estos contenidos.

Podemos convenir que la Arquitectura de la Información debe ser entendida como la disciplina (arte y ciencia) que proporciona métodos y herramientas para estructurar, organizar y etiquetar los componentes que conforman los entornos informacionales. En este sentido, persigue el objetivo de facilitar el acceso a la información contenida en esos entornos y mejorar, así, su utilidad y aprovechamiento por parte de sus usuarios. (Pérez-Montoro, Sotfware de prototipado para la arquitectura de la información: funcionalidad y evaluación, 2010)

Es posible encontrar variedad de autores que tienen como objetivo en sus obras dar una acercamiento a esta disciplina, es mucho lo que ofrece, sobretodo entendiendo que como el arquitecto se dedicaba a diseñar edificios, los cuales se planean de tal manera que no se escape ni el más mínimo detalle, el edificio es reemplazado por un entorno digital repleto de información, que demanda organización en contenidos informativos, sin dejar a un lado el entorno en el que este se mueve y diseñando escenarios de navegación adecuados para el usuario. Este punto lo trata Jesús Tramullas Saz en el Informe “Arquitectura de la información: más que diseño, hacia la findability”.

59

Ilustración 11 Relaciones de las principales tecnologías de la web semántica

FUENTE: (Barceló Valenzuela, Guzmán Sánchez , & Pérez Soltero, La Web Semántica como apoyo a la Gestión del Conocimiento y al Modelado Organizacional, 2006)

3.3.2. Web Semántica

La web semántica mantiene los principios que han hecho un éxito de la web actual, como son los principios de descentralización, compartición, compatibilidad, o la apertura al crecimiento y uso no previstos de antemano. En este contexto un problema clave es alcanzar un entendimiento entre las partes: usuarios, desarrolladores y programas de muy diverso perfil. La web semántica rescata la noción de ontología del campo de la Inteligencia Artificial como vehículo para cumplir este objetivo. (Castells)

Uno de los ejes principales de esta visión es la noción de ontología, rescatada del campo de la Inteligencia artificial, como herramienta clave para alcanzar dicho entendimiento entre las partes que participan de este conocimiento común. (Baquero, 2013)

Es más dudoso el impacto de la Web Semántica, en parte porque puede acabar diluyéndose en el Web 3.0 y de este modo, acabar siendo invisible; y en parte porque el programa máximo de la Web Semántica está

60

demasiado vinculado con tecnologías de inteligencia artificial que hasta ahora no han dado resultados en entornos heterogéneos y abiertos; mucho menos es previsible que lo tengan en entornos extremadamente heterogéneos y de la enorme escala de la Web. (Codina, ¿Web 2.0, Web 3.0 o Web Semántica?: El impacto en los sistemas de información de la Web, 2009)

COMPONENTES DE LA WEB SEMANTICA

En cambio, ha desarrollado una enorme cantidad de normas, lenguajes y tecnologías; algunas de ellas están teniendo una favorable influencia en la Web actual, aunque a primera vista pasen mucho más desapercibidas que la famosa Web 2.0. Otro efecto favorable del proyecto de la Web Semántica ha consistido, por supuesto, en lograr que una gran cantidad de científicos, ingenieros y profesionales de todo el mundo se hayan puesto a trabajar en el objetivo de cómo hacer una Web más fácil de utilizar. Entre sus componentes más importantes, podemos señalar los siguientes: i) La Web considerada como una gran base de datos, ii) Metadatos y lógica formal, iii) Ontologías y iv) Agente de usuario y sistemas informáticos capaces de efectuar inferencias o razonamientos. (Codina, Internet invisible y web semántica: ¿el futuro de los sistemas de información en línea?, 2003)

Beneficios al crear la Web Semántica. Según Castell: (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Se busca establecer un sentido a los contenidos. Facilitar a las máquinas la comprensión de lo que se quiere representar.

Ayudará a resolver problemas actuales de la Web como sobrecarga de información y heterogeneidad de fuentes de información, y el problema de interoperabilidad semántica, permitiendo a los usuarios delegar tareas en software. El software será capaz de procesar su contenido, razonar con este, combinarlo y realizar deducciones lógicas para resolver problemas cotidianos automáticamente.

Gestión "inteligente" de los recursos de información: Búsquedas de información, extracción de contenidos, integración de recursos heterogéneos. Se podrá generar conocimiento de forma automática ya que los computadores podrán entender los datos que están leyendo.

El comercio electrónico mejorará ya que se podrán satisfacer necesidades específicas de los clientes.

Permitir una conexión entre los recursos de la Web. Extender los hiperenlaces a relaciones semánticas.

La aparición de tecnologías nuevas.

Servicios remotos.

61

Capacidad de intercambio rápido y prácticamente sin coste asociado.

Almacenamiento distribuido.

Compartir recursos documentales.

Gran importancia en los sistemas de educación en la Web (e-learning).

Otra justificación de la Web Semántica es que está diseñada para obtener el retorno de una pequeña inversión de forma progresiva.

Aunque la Web Semántica no es un campo de investigación de la inteligencia artificial si aplica inteligencia artificial en ella, muchas visiones de inteligencia artificial han requerido mucha inversión antes de obtener alguna recompensa. La visión de la Web Semántica sigue una estructura en capas, en la que pequeñas inversiones en cada capa retornan mucho de esa inversión, así como un progreso hacia metas más grandes. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Ilustración 12 ARQUITECTURA DE WEB SEMÁNTICA EN FORMA DE PASTEL SEGÚN EL W3C (BERNERS-LEE 2003)

FUENTE: W3C

Para el año 2009 se presenta un nuevo modelo de capas de la web semántica:

62

“…RDF, RDFS, y OWL harán que la Web se asemeje en una gran Base de Datos…” Tim Berners-Lee.

Ilustración 13 Representación de las diferentes versiones de la web semántica

FUENTE: (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Con el tiempo, el proyecto de la Web Semántica ha ido modificando, de facto, sus objetivos y se centra en aspecto mucho más realistas, como podrían ser los que representa la incipiente Web 3.0 de la que nos ocupamos a continuación, hasta el punto que, en algunos contextos se están utilizando como términos sinónimos. (Codina, Internet invisible y web semántica: ¿el futuro de los sistemas de información en línea?, 2003)

Otro modelo de la arquitectura de web semántica encontrado es:

63

En el trabajo realizado para la ESCUELA POLITÉCNICA NACIONAL por Edison Leonardo Naranjo Diaz y Juan Pablo Tandazo Rodriguez. Se presenta la siguiente Ilustración:

Ilustración 14 Representación de la versión de Status de la Web Semántica

Fuente: (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

En la realización del trabajo en particular se clasificaron las capas de forma numérica con la intención de explicar de una forma ordenada las tecnologías que abarcan la web semántica, además separan las capas encargadas de clasificar, relacionar, agrupar, interconectar los conceptos que engloba la información que se halla en la web, y separa las habilidades o características que el sistema de información, al es realizado con una estructuración acorde al estándar Web Semántica adquirirá, como las deducciones posibles del sistema de acuerdo a los metadatos, donde estos identificarán la información de los archivos identificables y procesables para la máquina.

De acuerdo al modelo separado por capas, las inferiores y las superiores se puede dar inicio a la explicación detallada de cada una de estas tecnologías, que de acuerdo al plan propuesto por Tim Berners-Lee, harán posible la concesión de una web dotada de relaciones semánticas, donde buscar y encontrar serán posibles igual que hoy en día, pero sin odisea, sin conocimientos especiales para buscar, sin la complejidad que demandan hoy en día los buscadores para encontrar documentación certera y con conceptos de búsqueda con un mayor grado de

64

lenguaje natural, al que están acostumbrados los humanos y no un lenguaje técnico y especializado, como el requieren los sistemas de búsqueda actuales.

Capa 1: UNICODE y URI.

Esta capa tiene como el mecanismo para la identificación única de recursos específicos de metadatos. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Capa 2: XML y NS.

Esta capa provee el lenguaje para la descripción de la sintaxis. Esto implica que un documento XML y un par de especificaciones describen entidades contenidas, pero esto no especifica ningún significado. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Capa 3: Capas 3a y 3b: RDF M&S y RDF Schema. La capa 3 se ha divido en dos partes, 3a contiene a RDF M&S (Model and Syntax), y 3b contiene a RDF Schema. En la última versión la capa 3a realiza el intercambio de datos mediante RDF (Data interchange: RDF). (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Esta capa no sólo ofrece descripción de los datos, sino también permite definir clases y propiedades que pueden ser usadas para describir otras clases, propiedades y recursos. Tanto esta capa como la anterior corresponden a la descripción de la información (metadatos).

Capa 4: Capas 4a y 4b: OWL y Rules. La capa 4 también se divide en dos partes, 4a contienen el lenguaje OWL, y 4b que contiene las reglas de inferencia. En la versión que se está analizando las capas 3b y 4a son las que comprenden las ontologías. En la última versión la capa cuatro es una sola, y está compuesta por la ontología OWL, las reglas en RIF (Rule Interchange Format), y las consultas en SPARQL. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Sin olvidar el gran problema al que se enfrentan las organizaciones en Colombia, donde los sistemas de información han sido desarrollados en gran medida, sin organización o arquitectura definida; donde se busca satisfacer al cliente de acuerdo a lo que el pide, sin tener en cuenta, que los ingenieros deben tomar las riendas, en cuanto a la organización automatización de la información, claro teniendo en cuenta las necesidades del cliente, pero generando cultura, en el sentido que modelar un sistema de información, es mucho mas que ver un programa funcionando. Debe comprenderse que las aplicaciones deben desarrollarse con características estandarizadas, buscando lograr llevar el SI a niveles extravagantes de sistematización, con la intención de simplificar la cantidad de procesos que

65

pueden ser automatizados en relación a la capacidad de razonamiento de los seres humanos con la idea de acelerar gran cantidad

La arquitectura propuesta por Lee presenta los protocolos que hacen posible la evolución de la web, es pertinente entonces, la explicación de cada estándar que hace parte de la arquitectura de esta tecnología, con la intención de adentrarnos en el concepto de web semántica que el W3C pretende materializar.

Se puede afirmar que la información que ha sido modelada con RDF (Resource Description Framework) por medio de ontologías y etiquetada con XML, esto permite que los contenidos de la red tengan una semántica descifrable por las máquinas, trabajando de la mano con el desarrollo de los buscadores semánticos (los buscadores del futuro), los nuevos algoritmos le ofrecen a la máquina nuevas opciones o recursos para la búsqueda, permitiendo acceso a la información con principios de inteligencia artificial; para que se pueda hacer una búsqueda rápida y eficiente en la gran web, donde la información día a día es enterrada en sus profundidades debido a una no estructuración de los contenidos.

Es importante aclarar que las definiciones de cada uno de los estándares hacen parte de la investigación que se ha realizado para el desarrollo de esta indagación.

3.3.3. URI

URI es la sigla de Uniform Resource Identifer ‘identificador uniforme de recursos’. Su subconjunto más conocido son los URL (Uniform Resource Locator ‘localizador uniforme de recursos’), un recurso que permite localizar cualquier cosa de forma inequívoca, ya sea una página web, un fichero o una imagen. Con la Web semántica, los URI tendrán también la función de identificar objetos del mundo real. Cualquier objeto podrá ser identificado mediante un URI. Por ejemplo, un microondas tendrá un URI asociado; también habrá un URI para la página personal de un usuario o para su dirección de correo electrónico.

Las dos capas siguientes son quizá las más técnicas de la Web semántica. En ellas se agrupa las diferentes tecnologías que hacen posible que los agentes puedan entenderse entre ellos. (Salazar, 2005)

Una URI siempre define o especifica una entidad, las cuales pueden ser cualquier cosa, pueden ser un documento, un dispositivo físico, una película, un concepto abstracto (por ej: "autor") o incluso un ciudadano de un país. Una analogía interesante de las URIs es el uso de números de carnet (RUT) de alguna persona, el cual es único para alguna entidad persona y persiste durante toda su existencia, esto sin importar donde se encuentre o cómo haya cambiado a lo largo del tiempo. (Vásquez Paulus)

66

Un subconjunto de URI hacer compartir una sintaxis común para que representa las relaciones jerárquicas dentro del espacio de nombres. Esta Sintaxis "URI genérico" consiste en una secuencia de cuatro componentes principales:

<query> <scheme> :/ / <authority> <ruta>?

Cada uno de los cuales, excepto <scheme>, puede estar ausente de un URI en particular. Por ejemplo, algunos esquemas de URI no permiten un componente <authority>, y otros no utilizan un componente <query>. (Red Grupo de Trabajo T. Berners-Lee, 1998)

Normalmente una URI tiene la apariencia de una URL de Internet y la gente cree que tienen que ser direcciones de algo que realmente existe en Internet. La realidad no es así, y el estándar no indica nada sobre que tenga que existir la URL indicada. El W3C decidió emplear URLs como espacios de nombre porque contienen los nombres de dominio que son únicos en Internet. (Luján Mora )

3.3.4. Unicode

Unicode Soporta caracteres multilingües de un conjunto de 40,000 caracteres. Se trata de una codificación del texto que permite utilizar los símbolos de diferentes idiomas y que no aparezcan caracteres extraños. De esta forma, se puede expresar información en la Web Semántica en cualquier idioma. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Es una codificación del texto que permite utilizar los símbolos de diferentes idiomas sin observar caracteres extraños como eñes, caracteres chinos, cirílicos, árabes, etcétera. Esto permite expresar información en la Web semántica en cualquier idioma. (Salazar, 2005)

Unicode proporciona un número único para cada carácter, sin importar la plataforma, sin importar el programa, sin importar el idioma. Líderes de la industria tales como Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys y muchos otros han adoptado la norma Unicode. Unicode es un requisito para los estándares modernos tales como XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML, etc., y es la manera oficial de aplicar la norma ISO/IEC 1064621. Es compatible con muchos sistemas operativos, con todos los exploradores actuales y con muchos otros productos. La aparición de la norma Unicode y la disponibilidad de herramientas que la respaldan, se encuentran entre las más recientes e importantes tendencias en tecnología de software. (Unicode)

21 Conjunto Universal de Caracteres, por sus (denominado también en inglés como: Universal Character Set - UCS)

67

3.3.5. Digital Signature (Firma Digital)

Una firma digital puede entenderse como el mecanismo criptográfico con el objeto de permitirle al receptor determinar la entidad originador a de dicha mensaje, para confirmar que el mensaje no ha sido alterado desde que fue firmado por que el autor. Es importante usarla en aquellas partes donde se aclare verificar la autenticidad e integridad de los datos accesados. Para desarrollar la firma digital se necesita un algoritmo de generación de firmas, un algoritmo de verificación de firma digital, un esquema o mecanismo de firma digital y un proceso o procedimiento de firma digital.

Digital Signature Determina la firma digital que se utiliza para autenticar identidades. En la última versión aparece la capa crypto la que tiene embebida a las capas Digital Signature y encryption. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

3.3.6. XML

Lenguajes de marcado.- Lenguajes apropiados para representar, el contenido semántico y los conocimientos que contienen las ontologías (XML, XML Schema). (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

XML ofrece un formato común para intercambio de documentos. La Web Semántica usa esta tecnología como un mecanismo de descripción de sintaxis para la interoperatividad de los datos. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

El XML (Extensible Markup Languaje ‘lenguaje de marcado extensible’) es el sistema de etiquetado universal que sirve de base para el resto de capas. Permite estructurar datos y documentos en forma de árboles de etiquetas con atributos. Aunque el etiquetado, por sí solo, no representa un mecanismo para expresar la semántica de los documentos, la migración progresiva del HTML a lenguajes de etiquetado XML supondría un gran avance. Este lenguaje permite utilizar los llamados XML namespaces para diferenciar entre contenido y presentación, y, fundamentalmente, para la Web pase de ser un espacio hiperdocumental a un espacio hiperconceptual. (Salazar, 2005)

Según (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007); XML Es un metalenguaje que permite describir lenguajes de marcas, tanto la definición de etiquetas como la relación estructural que existen entre ellas. Permite la codificación para la distribución de documentos complejos por Internet, mediante etiquetas ad hoc definidas por el autor. El XML es:

68

· Formal. Permite establecer la validez de los documentos.

· Estructurado. Es capaz de manejar documentos complejos.

· Ampliable. Facilita la gestión de grandes depósitos de información. El XML posee esquemas, que funcionan como la gramática necesaria para poder expresarse. Los esquemas definen si el contenido de un documento XML es válido o no. Los esquemas más conocidos para el XML son:

· DTD (Document Type Definition).

· XML Schema o Esquema XML.

XML provee la sintaxis para documentos estructurados, pero no pone restricciones semánticas al significado de los documentos. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Ilustración 15 Web de Objetos

Fuente: ( Gutiérrez & Hurtado, 2006)

XML es un conjunto de reglas (también se las podría pensar como líneas de guía o convenciones) para diseñar formatos de texto que permitan estructurar los datos… [U]sa etiquetas (palabras encerradas por '<' y '>')

69

y atributos (de la forma nombre="valor"). Etiquetas sólo para delimitar las piezas de datos, y deja la interpretación de los datos completamente a la aplicación que los lee. (Bos, 2003)

La especificación oficial de XML prohíbe a las aplicaciones que traten de adivinar las intenciones del creador de un archivo XML dañado; si el archivo está dañado, la aplicación debe detenerse allí mismo y reportar un error. (Bos, 2003)

3.3.7. NameSpace

Este término es más abstracto, pero se podría definir como la forma de poder acotar entornos para saber realmente de que se está hablando. Surge de la necesidad de combinar diferentes vocabularios en XML y es una forma de agrupar distintos elementos para poder ser utilizados en un mismo documento. Por ejemplo: Un comerciante, sus proveedores y sus clientes tienen desarrollado un programa para comunicarse entre ellos y pasarse información en XML. Debido a que pertenecen al mismo sector, es muy probable que utilicen elementos comunes como <lavadora>, <nevera> o <campana> (de cocina). Sin embargo, puede ser que para cada uno de ellos estas palabras no tengan el mismo significado preciso. El programa hará uso de los elementos comunes mediante namespaces, eliminando cualquier ambigüedad que pudiera surgir. (Salazar, 2005)

Un XML Namespace es una colección de nombres (nombres de elementos y atributos) identificados por una URI (Uniform Resource Identifer).

Los nombres de un XML Namespace pueden aparecer en forma de nombres cualificados, que contienen un prefijo de espacio de nombre, los dos puntos (:) y la parte local. El prefijo, que se mapea a una URI, selecciona el espacio de nombres. Si no se indica un prefijo, se emplea el espacio de nombres por defecto.

Como una URI puede contener caracteres no permitidos en los nombres de elementos y atributos (por ejemplo, / o ?), no se puede emplear directamente como prefijo de un espacio de nombres. Por ello, el prefijo definido en el espacio de nombre hace el papel de representante de la URI correspondiente. (Mora)

3.3.8. RDF Model & Sytax

RDF M&S. Define el lenguaje universal con el cual se puede expresar diferentes ideas en la Web Semántica. RDF es un lenguaje simple mediante el cual se definen sentencias en el formato de un 3-ple o triple (sujeto: el recurso al que se refiere; predicado: el recurso que indica qué es lo que se está definiendo; y objeto: puede ser el recurso o un literal que podría considerarse el valor de lo que se define). (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

70

El modelo RDF o Resource Description Framework es un modelo común (un Framework) basado en XML, que permite hacer afirmaciones sobre los recursos (Description) y que hace posible que estos recursos pueden ser nombrados por URIs (Resource). (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

En términos de la Web Semántica el modelo básico de datos objeto-atributo-valor es solo semántica preescrita en la especificación RDF. Para la interoperabilidad semántica RDF tiene ventajas significativas sobre XML, primeramente porque es un modelo de datos usado. RDF permite la definición de declaración acerca de recursos que una aplicación puede procesar pero la aplicación puede actualmente no entender las declaraciones. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

RDF (Resource Description Framework o Marco de Descripción de Recursos), el área en la que está enmarcado es la descripción de recursos de la red. Permite que las condiciones que se quieren “preguntar” sobre un recurso sean definidas como un conjunto de propiedades que componen el esquema. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Según (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007); RDF ofrece una estructura semántica no ambigua que permite codificación, intercambio y procesamiento automático de los metadatos estructurados y normalizados, es decir, todo lo que se describen son recursos identificados por URIs. Proporciona reglas para facilitar la manera de explicar conceptos técnicamente, para que los computadores puedan procesarlo rápidamente, y proporciona un medio que permite la edición de vocabularios con propiedades definidas para descripción de recursos. Este modelo de datos puede representarse en una sintaxis de XML para intercambio y procesamiento de metadatos, en si es un grafo definido como una tripleta:

· Sujeto - Recurso (http://dblinux.sis.epn.edu.ec/hbanda/).

· Predicado - Propiedad (creador).

· Objeto - Literal ("Hugo Banda").

(NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

"Una vez que se asigna un URI a los datos, pueden entonces ser referidos por cualquiera, y como tales, complejas e intrincadas relaciones pueden ser construidas, cuestionadas y procesadas. En la base de este plan está la esperanza que la gente comenzará a publicar sus datos en RDF (Resource Description Framework o Marco de Descripción de Recursos)... En general, XML RDF es el formato elegido para la Web semántica... suele haber una pequeña confusión sobre la diferencia entre RDF y la Web

71

Semántica. RDF es simplemente un modelo y formato de datos que permite a la gente crear datos legibles por la máquina. La Web Semántica será construida por encima de estos datos. Por lo tanto, cuando se publica algo en RDF, no se está creando necesariamente una parte de la Web semántica, sino que se está poniendo los datos a disposición los procesadores semánticos de la Web, si eso significa algo... El principio de la Web Semántica es realmente bastante básico - datos legibles por la máquina, base global. (Baquero, 2013)

"El esquema RDF y el DAML, el Darpa Agent Markup Language (+OIL. Ontology Interchange Language), son dos lenguajes RDF de nivel básico muy importantes. Entre los dos, permiten a la gente definir nuevas aplicaciones sobre el RDF de una manera estructurada e interoperable... (Baquero, 2013)

3.3.9. RDFSchema

La Web semántica es la idea de añadir metadatos semánticos a la World Wide Web. Esta información adicional (describiendo el contenido, el significado y la relación de los datos) debe ser dada en forma explícita, de manera que pueda ser evaluada automáticamente por máquinas. El destino es mejorar la World Wide Web como consecuencia de ampliar la interoperabilidad entre los sistemas informáticos y reducir la mediación de operadores humanos. (Alvarez Yupa, 2013)

XML Schema Es un lenguaje que permite restringir la estructura de documentos XML y también extiende XML con datatypes. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Según (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007); RDF Schema es un lenguaje de descripción de vocabularios para describir las propiedades y clases de recursos RDF, con una semántica para la generalización/jerarquización de esas propiedades y clases.

· Clases / subclases.

· Relaciones entre las clases y propiedades.

· Descripciones para los humanos (etiquetas, descripciones, etc.). Facilita la combinación de sentencias RDF, a través de los URIs y ofrece la base para poder realizar razonamientos o deducciones sobre nueva información. Presenta limitaciones como:

· No indica la cardinalidad.

· Tipos de datos.

72

· Restricciones de rangos simples para las propiedades.

· No se pueden derivar tipos por unión o intersección.

· Necesidad de relaciones de clases o propiedades más ricas. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

La web semántica está basada en la idea de definir y enlazar la información presente en la web (mediante metadatos procesables por los ordenadores) de modo que pueda utilizarse más efectivamente para descubrimiento, automatización, integración y reutilización entre varias aplicaciones. (Alvarez Yupa, 2013)

El proceso de evolución e investigación de la web semántica se rige por la siguiente pirámide, estructurada en varias capas. Berners-Lee la describe como un “mapa de carreteras”, una secuencia que va incrementando la introducción de esta tecnología y que nos lleva, paso a paso, de la web que conocemos hoy a una web caracterizada por el razonamiento de las maquinas. (SALAZAR, 2005)

73

4. MODELO TEÓRICO

4.1. ONTOLOGÍAS

Las ontologías normalmente se expresan en un lenguaje basado en lógica para detallar, para que puedan hacerse las distinciones exactas, consistentes, legítimas, y significantes entre las clases, propiedades, y relaciones. Algunas herramientas de ontologías pueden realizar razonamiento automatizado usando ontologías, y así proporcionar servicios avanzados para aplicaciones inteligentes como: investigación y recuperación conceptual y semántica, agentes de software, apoyo a la toma de decisiones, habla y entendimiento natural de idiomas, Administración de conocimiento, base de datos inteligentes, y el comercio electrónico. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Los lenguajes ontológicos e inferentes son un paso más allá, y proporcionan aún más potencia. Se pueden crear términos inversos, términos transitivos, equivalencias, tipos de datos, uniones, intersecciones, y así sucesivamente... (Baquero, 2013)

Ontologías.- Utilizadas para representar el conocimiento (OIL, DAML, DAML+OIL, OWL). (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Cuando se habla de ontologías en el contexto de la WS es preciso ubicarse en el plano en el que la información que nos rodea será clasificada y relacionada, en otras palabras lo que pretende una ontología es coger los conceptos del entorno de la aplicación, clasificarlos, relacionarlos además de perimir la interacción de los mismos. Esto brinda un dominio en el manejo de la información que trae gran cantidad de ventajas. Aunque no se debe tomar a la ligera esta clasificación de la información, hay que ser conscientes de la cantidad efímera de información que existe, Idoia al respecto menciona lo siguiente:

“La base de la Web semántica son las ontologías, que, en el campo de la inteligencia artificial, significa una jerarquía de conceptos, con atributos y relaciones, que definen una terminología consensuada para una determinada área del saber. Las ontologías son las que aportan “inteligencia artificial”: las que permiten que los ordenadores se entiendan entre sí. Y aquí en esta base teórica clara, en donde la práctica comienza a hacer agujas. La creación de ontologías para los millones de materias diferentes que existen es actualmente algo utópico, poco factible, ya que supondría un enorme costo económico y humano. Y no solo esto: consensuar ciertas terminologías a nivel internacional podría también resultar una tarea bastante ardua”.

74

Aunque es de importancia fijar atención a este problema también es notable que actualmente se inician investigaciones y proyectos en relación a la creación de ontologías, en este sentido Colombia ya presenta sus primeros pasos visibles en el proyecto respaldado por la Universidad Nacional de Colombia sede Medellín donde se desarrolló una ontología a partir de un tesauro documental tradicional22.

En general hemos observado que las técnicas basadas en la modelización ontológica de un dominio son más útiles allí donde la información presenta más riqueza y diversidad (p.e. materias científicas, arte, turismo), se presta a una clasificación profusa (teorema, definición, algoritmo, función; cuadro, escultura, pintor, técnica, escuela, museo; lugar, transporte, hotel, monumento), con gran variedad de relaciones entre las unidades de información. El tipo de técnicas sobre las que estamos trabajando son útiles para sistematizar la introducción del conocimiento y recursos, asegurar la coherencia necesaria para la compartición, flexibilizar la composición dinámica de documentos, multiplicar las posibilidades de navegación (a través de un mayor número de relaciones representadas), afinar la adaptación al usuario (selección de conocimiento, medio, estructura y estilo de presentación), y gestionar repositorios de conocimiento abiertos a la extensión. (Castells)

Es una jerarquía de conceptos con atributos y relaciones, que determina una terminología consensuada para definir redes semánticas de unida de información interrelacionadas. La ontología proporciona un vocabulario de clases y relaciones para describir un dominio. Por ejemplo una ontología sobre arte podría incluir clases como “pintor”, “cuadro”, “estilo” o “museo” y relaciones como “autor” de un cuadro, pintores “pertenecientes” a un estilo artístico u obras “localizadas” en un museo.

Una ontología es una taxonomía de conceptos con atributos y relaciones, que proporciona un vocabulario consensuado para definir redes semánticas de unidades de información interrelacionadas. Durante los últimos años se han desarrollado diversos lenguajes y estándares para la definición de ontologías, entre ellos XML [Bray 2000], RDF [Lasilla 1999], DAML+OIL [Connoly 2001], y más recientemente OWL [Dean 2002], respaldados por el consorcio W3C, uno de los principales promotores de la web semántica. (Castells)

Una taxonomía es un árbol jerárquico que permite organizar por categorías y mediante relaciones de similitud y diferencias un área de conocimiento. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

22 Son instrumentos de control terminológico utilizado para convertir a un lenguaje normalizado el idioma natural de los documentos.

75

Según Castell la idea es que la World Wide Web del futuro este formada (al menos en parte) por una red de nodos. Estos estarán interconectados y tipificados mediante clases y relaciones definidas por una ontología compartida por sus distintos autores. Por ejemplo, si se establece una ontología sobre arte, un museo virtual puede organizar sus contenidos definiendo instancias de pintores, cuadros, etc., interrelacionadas y publicándolas en la web semántica. Del mismo modo, variaos museos podrían adoptar eta ontología común para crear u gran museo virtual que integre los contenidos de todos. Esto permitirá a los usuarios realizar búsquedas razonadas y complejas y obtener respuestas concretas en lugar de un listado interminable de resultado. (SALAZAR, 2005)

“La base de la Web semántica son las ontologías, que, en el campo de la inteligencia artificial, significa una jerarquía de conceptos, con atributos y relaciones, que definen una terminología consensuada para una determinada área del saber. Las ontologías son las que aportan “inteligencia artificial”: las que permiten que los ordenadores se entiendan entre sí. Y aquí en esta base teórica clara, en donde la practica comienza a hacer agujas. La creación de ontologías para los millones de materias diferentes que existen es actualmente algo utópico, poco factible, ya que supondría un enorme costo económico y humano. Y no solo esto: consensuar ciertas terminologías a nivel internacional podría también resultar una tarea bastante ardua”. (Salazar, 2005)

Una ontología es una herramienta conceptual que define un vocabulario común para quien necesita compartir información dentro de un determinado dominio. Esto incluye definiciones de los conceptos básicos del dominio, así como sus relaciones, que tienen que ser interpretables por máquinas. Una ontología no es más que una especificación de lo que existe en un dominio, convirtiéndose éstas en una pieza fundamental de las tecnologías orientadas a la Web Semántica. (Alvarez Yupa, 2013)

Las ontologías son críticas para aplicaciones que se dedican investigar o fusionar la información de diversas comunidades. Aunque XML DTDs y XML Schemas son suficientes para intercambiar los datos entre partes que han aceptado las definiciones de antemano, su falta de semántica impide a las máquinas realizar esta tarea fiablemente dados los nuevos vocabularios de XML. El mismo término puede usarse con (a veces sutil) diferente significado en contextos diferentes, y pueden usarse las condiciones diferentes para artículos que tienen el mismo significado. RDF y RDF Schema empiezan a acercarse a este problema permitiendo asociar la semántica simple con los identificadores. Con RDF Schema, uno puede definir clases que pueden tener múltiples subclases y súper clases, y puede definir propiedades que pueden tener sub propiedades, dominios, y rangos. En este sentido, RDF Schema es un lenguaje simple de ontologías. Sin embargo, para lograr el interoperación entre esquemas numerosos, y autónomamente desarrollados y administrados, se necesita de semántica más rica. Por ejemplo, RDF Schema no puede especificar que Persona y automóvil son clases disjuntas, o que un cuarteto

76

tiene exactamente cuatro músicos como miembros. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

4.1.1. CLASES DE ONTOLOGÍAS

No es posible enmarcar una ontología en un tipo concreto pero se han tomado en cuenta dos tipos de clasificaciones.

En Función los Problemas que Resuelven. Según [Mizoguchi, 1995] se dividen en:

· Ontologías de contenido: Construidas para reutilizar su conocimiento, permiten reutilizar su vocabulario.

· Ontologías de Indización: Permiten la recuperación de casos cuando los agentes comparten conocimientos a través de los casos.

· Ontologías de comunicación: Usadas por agentes para obtener respuestas a preguntas concretas.

· Meta-ontologías: Utilizadas para representar ontologías.

Según el Ámbito de la Conceptualización. Según [van Heist] se dividen en:

· Ontologías de representación: Proporcionan el vocabulario necesario para modelar otras ontologías, utilizando un determinado paradigma de representación del conocimiento.

· Ontologías genéricas o meta-ontologías: Proporcionan términos genéricos reutilizables en diferentes dominios, como por ejemplo, los términos; estado, evento, acción, componente, etc.

· Ontologías de dominio: Expresan conceptos que son específicos de un dominio determinado. Los conceptos en este tipo de ontologías son definidos usualmente como especializaciones de conceptos existentes en ontologías genéricas.

· Ontologías de aplicación: Contienen todas las definiciones que son necesarias para modelar los conocimientos requeridos por una aplicación particular. Incluyen conceptos tomados de ontologías de dominio y genéricas, a menudo definidas utilizando el vocabulario indicado en ontologías de representación. Pueden contener extensiones de métodos y tareas específicas. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

77

4.1.2. OWL

Vocabulario de Ontologías OWL. Ofrece un vocabulario para catalogar y clasificar la información. El uso de ontologías permite describir objetos y sus relaciones con otros objetos ya que una ontología es una especificación formal de un concepto de un dominio concreto del conocimiento. Esta capa permite extender la funcionalidad de la Web Semántica, agregando nuevas clases y propiedades para describir los recursos. Las ontologías ayudan en la creación de un vocabulario común para la comunicación entre personas y aplicaciones de computadora. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

OWL (Web Ontology Language) añade mas vocabulario, para describir propiedades y clases, entre otras: relaciones entre clases, cardinalidad, igualdad, enriquecimiento de tipeo de propiedades, características de propiedades, y enumeración de clases. El OWL se diseña para ser usado por aplicaciones que necesitan procesar un volumen de información antes de y en lugar de simplemente presentar todo ese volumen de información a los humanos. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

OWL facilita más capacidad de interpretación a la computadora sobre contenido Web que lo que soportan lenguajes como XML, RDF, y RDF Schema proveyendo un vocabulario adicional junto con una semántica formal. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Según (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007); OWL tiene tres sub-lenguajes que incrementan su expresividad según el sublenguaje, cada uno de estos lenguajes tiene un uso específico para desarrolladores y usuarios:

- OWL Lite: Es para usuarios que principalmente necesitan una jerarquía de clasificación y restricciones simples. Es el de menor complejidad formal de los tres.

- OWL DL: Es para usuarios que quieren mas expresividad mientras conservan la integridad computacional (todas las conclusiones se garantiza son calculables) y la capacidad de tomar una decisión (todos los cálculos se terminarán en un tiempo finito). OWL DL incluye todas las sentencias del OWL, pero que se deben usar bajo ciertas restricciones, DL (Description Logics) se refiere a un campo de investigación que estudia las lógicas que forman las bases de OWL.

- OWL Full: Es para usuarios que quieren la máxima expresividad y la libertad sintáctica de RDF con garantías no computacionales. OWL Full permite una ontología para aumentar el significado del vocabulario

78

pre-definido (RDF u OWL). Los sub-lenguajes se basan en su inmediato predecesor, y las ontologías y conclusiones creadas con cada uno de ellos se pueden validar como sigue pero no en la dirección contraria:

· Toda ontología legal en OWL Lite es una ontología legal en OWL DL.

· Toda ontología legal en OWL DL es una ontología legal en OWL Full.

· Toda conclusión valida en OWL Lite es una conclusión valida en OWL DL.

· Toda conclusión valida en OWL DL es una conclusión valida en OWL Full. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

4.1.3. Rules

Las reglas agregan la funcionalidad necesaria a los procesos de inferencia de la información derivada de la capa antológica y podrían típicamente ser usadas para capturar reglas del proceso del negocio. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

4.2. Herramientas para el desarrollo de ontologías

En el campo de la Web Semántica se han desarrollado varias herramientas para el desarrollo.

- Editores Manuales y Semiautomáticos. Para construir y compilar ontologías.

· Protége, editor manual.

· Text-To-Onto, editor semiautomático.

· SMORE, es una herramienta de marcado que produce documentos OWL.

· cwm. n3 a rdf, produce documentos OWL completos.

- Herramientas de Anotación. Para asociar fuentes de información no estructurada y semi-estructurada a metadatos.

· Cualquier herramienta que trabaje con: XML, DAML, OIL, DAML+OIL, RDF Schema, XML Schema, etc.

79

- Servicios de Razonamiento. Los esquemas de inferencias e instancia hacen posible a los servicios avanzados de pregunta y repuesta, la creación de ontologías y ayuda al mapeo de diferentes terminologías.

· FaCT: “Fast classification of terminologies”, razonador DL.

· RACER, razonador DL.

· Pellet, es un razonador de OWL lite hecho en Java (un analizador de consistencia completo de OWL lite).

· Ontobroker.

· Jess, etc.

- Parser/Validadores.

· OWL species validator/parser, Un analizador sintáctico OWL.

· Jena, framework que también posee un parser.

· OWLP, analizador sintáctico.

- Reutilización y Fusión de Ontologías. Los sistemas de bibliotecas de ontologías (Ontology Library Systems) y los entornos ontológicos ayudan a crear nuevas ontologías y reutilizar las existentes.

· Ejemplos de sistemas de bibliotecas de ontologías: WebOnto, Ontolingua, DAML ontology library system, SHOE, Ontology Server, IEEE Standard Upper Ontology, Sesame, OntoServer, u ONIONS.

· Mas de 200 ontologías DAML pueden ser convertidas a OWL usando OwlConverter, la mayoría se las cuales están en OWL Full.

· UMBC: ontologías.

· Como ejemplos de entornos ontológicos están: Chimaera o PROMPT.

- LENGUAJES DE MARCADO. Los lenguajes de marcado de metadatos, en la Web Semántica, estructuran el conocimiento que van a manejar las ontologías que se utilizarán para interactuar. Para trabajar con motores de inferencia y ontologías es necesario trabajar con lenguajes de marcado semánticos. Existen una serie de leguajes de marcado basados en SGML que es un metalenguaje. Los más

80

importantes son los siguientes: XML, XML SCHEMA, OIL, DAML, DAML+OIL, OWL. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007) Toda esta información sobre herramientas para la creación de ontologías, puede ser organizada en una tabla, es solo una idea, se puede manejar como mejor se acomode a nosotros, además tener en cuenta que la cita esta muy larga, por esto recomiendo la tabla.

4.2.1. Logic Framework

Un framework lógico provee una semántica formal bien establecida asignándole significados ambiguos a declaraciones lógicas. Sin un framework lógico, la inferencia sobre la Web Semántica podría no ser posible. Aquí se especifican las los frameworks lógicos que se utilizarán en la capa anterior, que captura los formalismos de razonamiento y la integración de los lenguajes lógicos, para manipular los términos de modo mucho mas eficiente beneficiando la inteligibilidad humana. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

4.2.2. Prooff (Pruebas)

El escenario de pruebas de la Web Semántica es apoyado por la noción de lenguajes de prueba, los cuales determinan la validez de declaraciones específicas. Una instancia de un escenario de pruebas consiste en una lista de ítems de inferencia usados para determinar la validez de la información en cuestión, así como las afirmaciones asociadas a la información de cada ítem. Se trata del lenguaje que hace posible las inferencias lógicas hechas posibles a través del uso de reglas de inferencia tal como es especificado por las ontologías. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

4.2.3. Trusted SW (confianza en la web semántica)

El nivel de confianza, hace referencia al nivel de veraces que son los documentos encontrados en la Web, entendiendo que la Web Semántica el problema actual en las búsquedas virtuales, donde los resultados de búsqueda, en su mayor parte, son satisfactorios después de realizar búsquedas al tipo ensayo-error.

La confianza es provista por un mecanismo dedicado a establecer niveles de confianza de todos los involucrados e ítems de información sobre la Web Semántica. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

Los programas o agentes que trabajen sobre la Web Semántica no deberían confiar en todo lo que encuentren en la Web Semántica

81

hasta que hayan podido comprobar de forma exhaustiva las fuentes de información. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

4.2.4. Encryption

Dentro de las capas 3 a la 6 se encuentra embebida la encriptación que utiliza la funcionalidad inicial de la firma digital, que es un bloque encriptado de datos que serán utilizados por los computadores y los agentes para verificar que la información adjunta ha sido ofrecida por una fuente específica confiable. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

4.2.5. HTML

Es el lenguaje base de la web, el cual en su momento innovó, generando un dinamismo en la forma de navegar en internet, hasta entonces. La web actual se caracteriza por contener solo archivos HTML, los cuales admiten una cantidad limitada y básica de datos, solo utilizables por los buscadores. De este lenguaje se ha presentado la quinta versión, esperando sea este el lenguaje en el que sea implementada la web semántica.

The HyperText Markup Language (HTML) is the publishing language of the World Wide Web. It is one of the main components of the Open Web Platform. The first version of HTML was described by Tim Berners-Lee in late 1991. The current W3C Recommendation for HTML is HTML 4.01, published in December 1999. There is however intensive work to define its next version, HTML5. (W3C, 2013)

HTML 5 está diseñado para ofrecer casi todo lo que quieres hacer en línea sin necesidad de plugins adicionales. Lo hace todo, desde la animación de aplicaciones, música de películas, y también se puede utilizar para crear aplicaciones complejas que se ejecutan en su navegador. (W3C, 2013)

82

Ilustración 16 Logo de HTML 523

Fuente: http://www.w3.org/community/webed/wiki/HTML

4.2.6. Metadatos

Metadatos.- Recursos que proveen información acerca de sí mismos, en formato común y procesable por las máquinas (RDF, RDF Schema). (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

La información que en estos momentos copa las páginas de Internet está diseñada específicamente para consumo humano. Al carecer de una estructura preestablecida, las máquinas son incapaces de procesar la información como si se tratase de un ser humano, es decir, comprendiendo su significado. (España, 2011)

Los metadatos consisten de información que caracteriza otros datos, y están altamente estructurados, y son usados para proveer documentación para productos de datos. Es decir los metadatos responden a preguntas como: ¿quién?, ¿qué?, ¿cuándo?, ¿dónde?, ¿por qué?, y ¿cómo?, acerca

23 página recomendada para la capacitación en lenguajes de programación web:

www.w3schools.com

http://www.w3.org/community/webed/wiki/HTML

83

de cada aspecto del dato que está siendo documentado. (NARANJO DIAZ, JUAN PABLO , & BANDA GAMBOA, 2007)

84

Fuente: (Codina, ¿Web 2.0, Web 3.0 o Web Semántica?: El impacto en los sistemas de información de la Web, 2009)

La Web semántica es la idea de añadir metadatos semánticos a la World Wide Web. Esta información adicional (describiendo el contenido, el significado y la relación de los datos) debe ser dada en forma explícita, de manera que pueda ser evaluada automáticamente por máquinas. El destino es mejorar la World Wide Web como consecuencia de ampliar la interoperabilidad entre los sistemas informáticos y reducir la mediación de operadores humanos. (Alvarez Yupa, 2013)

La web semántica está basada en la idea de definir y enlazar la información presente en la web (mediante metadatos procesables por los ordenadores) de modo que pueda utilizarse más efectivamente para descubrimiento, automatización, integración y reutilización entre varias aplicaciones. (Alvarez Yupa, 2013)

El proceso de evolución e investigación de la web semántica se rige por la siguiente pirámide, estructurada en varias capas. Berners-Lee la describe como un “mapa de carreteras”, una secuencia que va incrementando la introducción de esta tecnología y que nos lleva, paso a paso, de la web que conocemos hoy a una web caracterizada por el razonamiento de las maquinas. (SALAZAR, 2005)

Ilustración 17 Web actual y web semántica

85

FUENTE: (Baquero, 2013)

4.2.7. Sistemas de búsqueda de información S

Ilustración 18 Pantallazo de interfaz de Google

FUENTE: Elaboración propia

Búsqueda realizada el 5 de diciembre de 2013 desde Santa Rosa de Cabal, Risaralda, Colombia. Se debe notar que nueve de los resultados de búsqueda son comerciales y no responden a la pregunta, solo ofertas comerciales de agencias de viajes y transportes; también es de notarse que ninguna de las búsquedas corresponde a un viaje desde el aeropuerto matecaña de Pereira, hasta el Aeropuerto el dorado de Bogotá, información de origen y del destino que en los sistemas de información existentes y debe ser posible deducir.

Estamos muy lejos del resultado deseado, que realmente satisfaga la necesidad del usuario, donde buscar información no necesite conocimientos

86

especializados, sino, que la maquina entienda certeramente lo que se está buscando y por ende, arroje respuestas satisfactorias.

En la siguientes dos figuras, se puede ver el paralelo entre la forma como es el buscador actual y como sería realizando la misma búsqueda en web semántica, como se observa los resultados se muestran mas precisos, contextuados, dotados de significado, cuando se va a buscar por ejemplo los vuelos para mañana por la mañana via a Praga.

Ilustración 19 Resultados con un buscador actual

Fuente: (W3C.ES, 2014)

87

Ilustración 20 Resultados con un buscador semántico

Fuente: (W3C.ES, 2014)

5. CONCRECIÓN DE APLICATIVO

Como requerimiento para completar este trabajo de investigación, es necesario realizar un aplicativo, en este caso, una página web con el objeto de presentar información y material multimedia que complemente la información presentada en este informe.

Para el desarrollo de la sitio www.websemanticaucp.tk se utilizó el alojamiento Web Gratuito, Hostinger el cual cuenta con 2000 MB de espacio en disco, 100 Gb (100.000 MB) de ancho de banda, Almacenamiento ilimitado de dominios, Panel de control basado en cPanel (http://www.hostinger.es/hosting-gratis)

Como editor de contenidos web se utilizó Joomla! (CMS o Content Management System) que permite crear sitios web elegantes, dinámicos e interactivos. Por su diseño, potencia, es usado por centros educativos y por millones de webmasters en todo el mundo para desarrollar su portal web.

Joomla! es una aplicación Open Source o de código abierto programada en lenguaje PHP bajo una licencia GPL y que utiliza una base de datos MySQL para almacenar el contenido y los parámetros de configuración del sitio.

De este editor de contenidos web se utilizó la versión 3.3, la cual introduce nuevas características en el CMS, tales como la mejora de hash de la clave y los

http://www.websemanticaucp.tk/

88

microdatos y optimiza el código con mejoras en el rendimiento del sistema de enrutamiento y la conversión continua de MooTools JavaScript en base a jQuery.

Ilustración 21 Pantallazo de inicio de websememanticaucp.tk

FUENTE: Elaboración propia

6. CONCLUSIONES

Debe tenerse en cuenta que La Web Semántica es una tecnología emergente, donde el desarrollo e implementación, es hasta ahora solo unos cuantos pasos de los que se deben dar para llegar a un estado de consumación casi total. Son las tecnologías de la información y la comunicación Tics, las que van a cambiar muchos aspectos de la vida cotidiana, social, cultural, económica y política, cuando la web como el reloj o el teléfono móvil será omnipresente y la humanidad ni siquiera se podrá dar cuenta del cambio.

Es necesario entender que para desarrollar la web semántica, la implementación de modelos arquitectónicos de información debe ser una práctica común para el desarrollo de cualquier aplicación web. Donde ese gran marasmo de datos que es la web, será controlado por un robot estructurado para manejar información y este contará con una descripción acertada de todos los archivos inmersos en su alcance, de esta manera recuperar y compartir información será una ventaja importante de la Web; con lo cual la arquitectura de la Información se convierte en una herramienta imprescindible para el desarrollo de la web semántica.

Entrar a definir la web 3.0 es arar en un terreno escabroso, ya que no es algo existente, sino una especulación científica, como algún día lo fue el bombillo, o si se quiere una proyección de cómo va a evolucionar la web hacia el futuro. Si bien

89

hay críticos que dicen que la web semántica no existe, y aún está lejos de serlo, debido a la complejidad de los lenguajes que promulga, entonces se debe tener en cuenta que se está avanzando con proyectos como la Linked Data considerada el corazón de la web semántica, con el sistema de relación o vinculación de datos y resaltando que algunas etapas para su desarrollo se están implementado con resultados asombrosos.

El núcleo que manipulará la información en la web contará con un sistema de datos vinculados algo similar a la Linked data, haciendo referencia a que los datos deben estar siempre enlazados y esto será posible con el estándar RDF. La linked data se encuentra en el corazón mismo de la Web 3.0.

Se coincide en el planteamiento de requerimientos tecnológicos para realizar la WS de Mario Pérez y Luis Codina quienes direccionan el desarrollo e implementación de esta tecnología en lenguajes de marcado como XML y XML Schema; Metadatos con etiquetas RDF, RDF Schema; Ontologías representadas en OIL, DAML, DAML+OIL, OWL y finalmente los agentes y aplicaciones Web que soporten la WS. Cada una de estas tecnologías es objetivo del W3C y por la seriedad del proyecto se puede hablar de trabajo duro y constante que están haciendo de esta visión algo con horizonte, cuando hace tan solo unos pocos años que se tenía la máquina de escribir como el invento de documentación más importante de la época

Las aplicaciones encargadas de controlar grandes volúmenes de información en entornos virtuales o digitales, tienden a consolidarse como sistemas cada vez más complejos y por esta razón la arquitectura de la información se debe considerar, la disciplina que colabora en la realización de la tercera versión de la Web.

La solución consiste en dotar los contenidos de la web con cierta información que solo competerá a las máquinas, que brindar una especie de “razonamiento” a estas, llevando la automatización de la Web a otro nivel, donde buscar información no será un problema tan complejo como lo es hoy en día. Tiene entre sus tareas modificar de manera estructurada de la información en la web, esto con el objeto que las máquinas tengan mayor facilidad en el procesamiento de la información, la consecuente integración o estructuración, reutilizando y decantando información. La WS debe posibilitar información relacionada en formatos y lenguajes comprensibles por las máquinas.

El objetivo de la WS es incrustar etiquetas con metadatos en el código, un trabajo arduo y "lento", el incrustar metadatos en los contenidos duplica el esfuerzo de la codificación, con lo cual también las competencias del programador deben aumentar, sin embargo se puede plantear sin ninguna ambigüedad que por organizar y optimizar la información es importante no desechar esta propuesta de la WS porque los esfuerzos que se dediquen a la organización y relación de la

90

información pueden sobrepasar las expectativas y abrir las puertas a un mundo que hasta este momento se concibe solo como ciencia ficción.

Los esfuerzos que la WS demandan podrán sobrepasar las expectativas, sin embargo debe tenerse en cuenta que apenas se está empezando parcamente, es una tecnología que se está inventado; para el día que esto esté concretado, cada persona del mundo interactuará con un sistema mundial interconectado de información, no como sucede hoy en día, donde las bases de datos se desarrollan e implementan de forma dispersa, no solo fuera de las organizaciones sino dentro de ellas. Contextualizando un ejemplo: la Universidad Católica de Pereira UCP tiene implementados varios sistemas de información, pero cada uno de ellos es una isla, es decir, no es posible compartir información entre bases de datos de la misma institución.

Lo que se busca con el desarrollo de estas tecnologías es generar una web inteligente con estándares que posibilitan la comunicación entre entes virtuales o software diseñados con propósitos específicos y que necesitan compartir información para brindar a los usuarios una experiencia automatizada y certera gracias a la estructuración de contenidos que hacen posible una representación avanzada de la institución en el mundo virtual.

En el estado del arte propiamente dicho se halló el sistema SABIOS, como una aplicación de la web semántica para la gestión de documentos en la Universidad Nacional sede Medellín, el cual consiste en un marcado semántico de los datos y los documentos, con información estructurada. SABIOS utiliza tecnologías emergentes para la inserción, catalogación y recuperación de documentos digitales; teniendo como objetivo presentar una opción para la migración de un tesauro documental tradicional a una ontología en el entorno de la web semántica, con el fin de permitir su uso en la recuperación de documentos.

En la Universidad Tecnológica de Pereira se desarrolló un buscador semántico aplicado a la búsqueda de libros de ingeniería de sistemas y computación, este buscador semántico hallan los resultados a partir de contextos, permitiendo una exploración más exacta.

"Ontologías, web semántica, metadatos para ver con los oídos, oír con los ojos, hablar para todos" busca permitir a través de la web semántica desarrollar sitios web universales, principalmente con la población discapacitada. En el mismo país ibérico, en la universidad de Madrid se desarrolla el trabajo, "Aplicación de técnicas de la web semántica" el cual busca llenar el vacío en cuanto a herramientas para la interfaz de usuario específicamente orientadas a la manipulación de conocimiento basado en ontologías. En la universidad Autónoma de Madrid, se trabajó en técnicas con web semántica, donde se observó un cierto vacío en cuanto a herramientas para la interfaz de usuario específicamente orientadas a la manipulación de conocimiento basado en ontologías.

91

El doctorado en ingeniería web, plantea que la web semántica es un área pujante nacida en la confluencia de la inteligencia artificial y las tecnologías web, que propone nuevas técnicas y paradigmas para la representación del conocimiento que faciliten la localización, compartición e integración de recursos a través de la web, para ello se sirve de las ontologías.

El Libro Web Semántica y sistemas de información documental, de diversos autores, aborda la web semántica desde el manejo de la información, esto es lograr que las páginas web puedan ser procesadas como datos de entrada de programas de ordenador y no solo como algo destinado a ser mostrados en pantallas para seres humanos, ya no como mera información, sino como meta información. En el mismo sentido desde la Universidad Sonora de México se realizó un trabajo de web semántica como apoyo a la Gestión del conocimiento y al modelado organizacional, lo que busca es conseguir que las páginas que forman la web ya no sean simples cadenas de caracteres, para ser textos consentido, para ello propone un cambio de paradigma den las ciencias de la computación. En la Escuela Politécnica Nacional se desarrolló un agente inteligente para búsqueda de metadatos geográficos, utilizando la arquitectura de la web semántica, representada por un lenguaje ontológico.

Soluciones dadas por la WS

La solución consiste en dotar los contenidos de la web con cierta información que solo competerá a las máquinas, utilizada para brindar una especie de “razonamiento” a la máquina, llevando la automatización de la web a otro nivel, donde buscar información no será un problema tan complejo como lo es hoy en día. Tiene entre sus tareas modificar de manera estructurada la información de la web, esto con el objeto que las máquinas tengan mayor facilidad en el procesamiento de la información, la consecuente integración o estructuración, reutilizando y decantando información contenida en la web. La web semántica debe posibilitar información en formatos y lenguajes comprensibles por las máquinas, con cierto nivel de relación.

Generar una web inteligente con estándares que posibilitan la comunicación entre entes virtuales o software diseñados con propósitos específicos y que necesitan compartir información para brindar a los usuarios una experiencia automatizada y certera gracias a la estructuración de contenidos que hacen posible una representación avanzada de la institución en el mundo virtual. El objetivo de la WS es minimizar el trabajo de digitar código, arduo y "lento", el trabajo de incrustar metadatos en los contenidos de la web duplicaría el esfuerzo de la codificación; además las competencias del programador deben aumentar. En este sentido se puede entonces plantear que por organizar y optimizar la información es importante no desechar esta propuesta de la WS porque los esfuerzos que se dediquen a la

92

organización y relación de la información, puede sobrepasar las expectativas y abrir las puertas a un mundo que hasta este momento solo se ve en ciencia ficción.

Los esfuerzos que la WS demanda podrán sobrepasar las expectativas, pero debe tenerse en cuenta que apenas se está emprendiendo, apenas la estamos inventado. El día que esto esté inventado cada persona del mundo interactuará con un sistema mundial interconectado de información. No como hoy en día, donde las bases de datos se desarrollan e implementan de forma dispersa, tanto afuera como adentro de las organizaciones. Por ejemplo la UCP tiene implementados varios sistemas de información, pero cada uno de ellos es una isla; no es posible compartir información entre bases de datos de la misma institución.

La web semántica pretende construir un robot que controle, maneje y gestione la información de manera eficaz y eficiente, para lograrlo es necesario contar con datos precisos, los cuales deben describir la situación del mundo en tiempo real, en ese sentido, la disciplina que se encarga de modelar dicha información universal es la arquitectura de la información. Una herramienta para modelar la información es el desarrollo de tesauros de información, esto requiere un vocabulario cerrado, concreto, el cual esté orientado en función de una organización, de una estructura, se puede tomar como ejemplo una biblioteca, siendo este un recinto que almacena objetos, como son los libros, revistas, periódicos, videos, audios, mesas, sillas, salas, entre otros, cada uno de ellos con unas cualidades, que en el ambiente de programación se conocen como atributos; tales atributos describen de manera concreta el objeto, los tesauros describen con cierto grado de rigurosidad.

En este orden de ideas, todo lo concerniente a la web semántica está directamente relacionado con la arquitectura de la información; se entiende que todo sistema tiene tres componentes esenciales, entrada, para el ejemplo es toda la información modelada por tesauros, el segundo es el proceso esto es, los datos atributos de los objetos convierten en ontologías, para una salida, es la comunicación entre las máquinas automatizando los procesos informáticos. La web semántica es pues el producto de la información estructurada, es decir, es toda una infraestructura virtual que gestiona la información, comprendiendo que esta se relaciona por un estándar mundial.

93

7. RECOMENDACIONES

Se debe realizar un estudio que visualice a profundidad lo que la arquitectura propuesta por Tim Berners-Lee, representa para el desarrollo tecnológico, además de brindar un concepto académico y regional de la propuesta denominada web semántica, captando criterio certero en el tema de estudio, con el fin de establecer plan de acción en la integración de esta nueva tecnología en el ámbito académico de la entidad.

En ese sentido es de suma importancia que la universidad desarrolle un plan de estudios para una materia de semestre en niveles superiores sobre web semántica y las tecnologías halladas, es decir, nombre un docente en el tema. En el mismo sentido, se deben orientar y trazar líneas investigativas en torno a la web semántica, realizando círculos de estudio y/o semilleros de investigación, dando por resultado informes finales de grado en distintos tópicos de la web semántica.

Las tecnologías encontradas, las ontologías, OWL, Rules, Logic framlworks, proof, Trusted, encryption, HTML, los metadatos y los sistemas de búsqueda son herramientas en constante desarrollo y evolución, el trabajo coordinado de equipos multidisciplinarios, con profesionales y estudiantes a la altura de los retos propuestos por el futuro, son el caldo de cultivo para que estas tecnologías continúen avanzando vertiginosamente por el camino del desarrollo de orden superior. Para ello requiere trabajo arduo, organizado y concienzudo. La universidad es el espacio propicio para que cumpla su función, generar conocimiento. Por ello es importante insistir en el desarrollo de círculos de estudio enfocados en el tema de la web semántica, inclusive se pueden generar espacios para orientar trabajos de grado en torno al estudio y desarrollo de cada una de las tecnologías necesarias para desarrollar la web semantica.

94

8. REFERENCIAS BIBLIOGRAFICAS

Brocos Fernández, L. M., & Salinas Pardo, T. (2006). Selección de recursos de información disponibles en el Web invisible. Acimed.

Gutiérrez, C., & Hurtado, C. (2006). Web Semántica: Realidadesy Perspectivas. Chile: Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile.

Acebedo R., L. F. (2010). Territorios del conocimiento en la Ecoregion del Eje cafetero. Caracas: Uiversidad Central de Venezuela.

Aguillo, I. (2004). INTERNET INVISIBLE. IV Semana de la Ciencia. Madrid.

Alvarez Yupa, R. I. (2013). Analisis y estudio de las aplicaciones Web 3.0, su uso actual y futuro. Quito: Universidad Tecnologica Israel.

Baquero, J. L. (2013). LA WEB SEMÁNTICA.

Barceló Valenzuela, M., Guzmán Sánchez , G. A., & Pérez Soltero, A. (2006). La Web Semántica como apoyo a la Gestión del Conocimiento y al Modelado Organizacional. Revista Ingeniería Informática, 3-7.

Barceló Valenzuela, M., Sanchez Schmitz, G. G., & Perez Soltero, A. (2006). La Web Semántica como apoyo a la Gestión del Conocimiento y al Modelado Organizacional. Revista de Ingenieria informatico, Edicion 12.

Bos, B. (10 de 1 de 2003). World Wide Web Consortium . Recuperado el 6 de 12 de 2013, de http://www.w3.org/XML/1999/XML-in-10-points.es.html

Castells, P. (s.f.). Aplicación de técnicas de la web semántica. Madrid: Escuela Politécnica Superior Universidad Autónoma de Madrid.

Codina, L. (Noviembre de 2003). Internet invisible y web semántica: ¿el futuro de los sistemas de información en línea? Recuperado el 17 de Octubre de 2013, de Revista Tradumática: http://webs2002.uab.es/tradumatica/revista/num2/articles/06/06.PDF

Codina, L. (2009). ¿Web 2.0, Web 3.0 o Web Semántica?: El impacto en los sistemas de información de la Web. I Congreso Internacional de Ciberperiodismo y Web 2.0, (págs. 1-16). Bilbao.

comunicacioninvisible.net. (2013). comunicacioninvisible.net. Recuperado el 10 de 2013, de www.comunicacioninvisible.net

95

Curti, A. N. (2006). "INTERNET INVISIBLE" SU IMPORTANCIA PARA LAS BIBLIOTECAS UNIVERSITARIAS. 4ª Jornada sobre la Biblioteca Digital Universitaria (págs. 1-2). Palermo: JBDU.

España, U. (21 de 01 de 2011). Universia. Recuperado el 30 de 03 de 2013

Flores Vivar, J. M. (2005). Internet en el proceso de globalización y consolidación de los medios de comunicación europeos. Nebrija: Universidad de Nebrija.

Giraldo, J. D., Guzmán, J. A., & Ceballos, J. C. (2006). Desarrollo de un Módulo de Visualización y Navegación de Información Basada en Ontologías para el Sistema de Recuperación Semántica SABIOS. Avances en Sistemas e Informática, Disponible en: http://redalyc.uaemex.mx/src/inicio/ArtPdfRed.jsp?iCve=133114991010.

Hurtado, R. (2007). Establecimiento de las capacidades e inventario analítico de las actividades de ciencia y tecnología del departamento del Eje Cafetero (Caldas, Quindío y Risaralda). Bogotá: Observatorio colombiano de Ciencia y Tecnologia.

Infotecarios. (18 de 10 de 2012). Infotecarios. Recuperado el 26 de 11 de 2013, de http://www.infotecarios.com/una-brevisima-aproximacion-a-la-web-semantica/

Jaramillo A., J. (23 de 01 de 2000). http://docencia.udea.edu.co/biblioteca/formacion-usuarios/guiadelcurso/bibliografiadocumentos/sociedad%20conocimiento.pdf. Recuperado el 02 de 11 de 2000, de http://docencia.udea.edu.co/biblioteca/formacion-usuarios/guiadelcurso/bibliografiadocumentos/sociedad%20conocimiento.pdf: http://docencia.udea.edu.co/biblioteca/formacion-usuarios/guiadelcurso/bibliografiadocumentos/sociedad%20conocimiento.pdf

Luján Mora , S. (s.f.). Universidad de Alicante. Recuperado el 06 de 12 de 2013, de http://rua.ua.es/dspace/bitstream/10045/19111/5/05-XML%20Namespaces.pdf

Mora, S. L. (s.f.). UNIVERSIDAD DE ALICANTE. Recuperado el 13 de 05 de 2013, de http://rua.ua.es/dspace/bitstream/10045/19111/5/05-XML%20Namespaces.pdf

NARANJO DIAZ, E. L., JUAN PABLO , T. R., & BANDA GAMBOA, H. (2007). DESARROLLO DE UN AGENTE BUSCADOR INTELIGENTE DE METADATOS GEOGRAFICOS PARA LA UNISIG. Quito, Ecuador.

Panameños hacia una sociedad del conocimiento. (26 de 06 de 2007). http://caisconectados-bitacora.blogspot.com/2007/06/sociedad-del-conocimiento-antecedentes.html. Recuperado el 02 de 11 de 2012, de http://caisconectados-bitacora.blogspot.com/2007/06/sociedad-del-conocimiento-antecedentes.html: http://caisconectados-bitacora.blogspot.com/2007/06/sociedad-del-conocimiento-antecedentes.html

Pérez-Montoro, M. (2010). Sotfware de prototipado para la arquitectura de la información: funcionalidad y evaluación.

96

Pérez-Montoro, M., & Codina, L. (12 de Julio de 2010). Sotfware de prototipado para la arquitectura de la información: funcionalidad y evaluación. Barcelona, España.

Portal Educativo de las Américas . (s.f.). Recuperado el 30 de 03 de 2013, de http://www.educoas.org/portal/bdigital/contenido/valzacchi/ValzacchiCapitulo-2New.pdf

Red Grupo de Trabajo T. Berners-Lee. (1998). The Internet Engineering Task Force (IETF). Recuperado el 13 de 05 de 2013, de http://www.ietf.org/rfc/rfc2396.txt

Salazar, I. (2005). LAS PROFUNDIDADES DE INTERNET. ESPAÑA: TREA, S. L.

SALAZAR, I. (2005). LAS PROFUNDIDADES DEL INTERNET. ESPAÑA: TREA, S. L.

Sánchez Asín, A., Boix Peinado, J. L., & Jurado de los Santos, P. (1 de 2009). LA SOCIEDAD DEL CONOCIMIENTO Y LAS TICS: UNA INMEJORABLE OPORTUNIDAD PARA EL CAMBIO DOCENTE. Barcelona, España.

Sánchez Jiménez, D. (20 de 8 de 2007). Cibersociedad y Cibercultura de la Sociedad de la Información a la Sociedad del Conocimiento “De la Sociedad de la Información a la Sociedad del Conocimiento”. Santo Domingo, República Dominicana.

Tecnology Tracker Colombia. (01 de Octubre de 2012). Ipsos Media CT. Recuperado el 13 de Octubre de 2013, de Tecnology Tracker Colombia.

Torres, F. (2011). Manual de proyectos web. Recuperado el 20 de octubre de 2013 , de http://www.itconsulting.com: http://www.itconsulting.com.sv/wp-content/uploads/2011/12/Manual-de-Proyectos-Web.pdf

Unicode, E. C. (s.f.). www.unicode.org/. Recuperado el 04 de 05 de 2013, de http://www.unicode.org/standard/principles.html

Vásquez Paulus, C. (s.f.). departamento de ciencias de la computacion universidad de chile. Recuperado el 13 de 05 de 2013, de http://users.dcc.uchile.cl/~cvasquez/introehistoria.pdf

W3C. (2013). W3C Estandares para la web semantica. Recuperado el 05 de diciembre de 2013, de www.w3c.org: http://www.w3.org/standards/semanticweb/data

W3C.ES. (2014). Recuperado el 15 de Mayo de 2014, de http://www.w3c.es/Divulgacion/GuiasBreves/WebSemantica: http://www.w3c.es/Divulgacion/GuiasBreves/WebSemantica

97

9. GLOSARIO24

CLASIFICACIÓN: Un esquema lógico para la ordenación del conocimiento, normalmente por materias. Los esquemas de clasificación son alfabéticos, numéricos o alfanuméricos.

CSS: Hojas de Estilo en Cascada (Cascading Style Sheets). Es un mecanismo para dar estilo a documentos HTML y XML, que consiste en reglas simples a través de las cuales se establece cómo se va a mostrar un documento en la pantalla, o cómo se va a imprimir, o incluso cómo va a ser pronunciada la información presente en ese documento a través de un dispositivo de lectura. Esta forma de descripción de estilos ofrece a los desarrolladores control total sobre el estilo y formato de sus documentos separando contenido y presentación.

DATO: Unidad mínima en que puede ser dividida la información.

DIRECTORIO : Listados de recursos organizados en categorías temáticas. Las categorías temáticas se organizan jerárquicamente en un árbol de materias que permite su consulta descendiendo desde los temas más generales a los más específicos. Las categorías presentan un listado de enlaces a las páginas referenciadas en el buscador. Cada enlace incluye una breve descripción sobre su contenido. Los recursos de Internet que contiene el directorio son seleccionados y clasificados por humanos.

HTML: (HyperText Markup Language- Lenguaje de Marcado de Hipertexto) Lenguaje en el que se escriben las páginas Web a las que se accede a través de navegadores WWW.

HTTP: (HyperText Transfer Protocol- Protocolo de trasferencia de Hipertexto). El más importante protocolo de comunicación entre servidores y navegadores web.

INDIZACIÓN: El proceso de evaluación de entidades de información y de creación de términos que ayuden a encontrar y acceder a esa entidad. Los términos de indización o del índice pueden estar en lenguaje natural o pertenecer a un vocabulario controlado o notación de clasificación.

INFORMACIÓN: Acción y efecto de informar. Comunicación o adquisición de conocimientos que permiten ampliar o precisar los que se poseen sobre una materia determinada.

INTELIGENCIA ARTIFICIAL: Ciencia que intenta la creación de programas para máquinas que imiten el comportamiento y la comprensión humana. La

24 Fuente (http://analisisdocumental2007.wikispaces.com/Glosario+Web+Sem%C3%A1ntica) http://www.w3c.es/Divulgacion/a-z/

98

investigación en el campo de la IA se caracteriza por la producción de máquinas para la automatización de tareas que requieran un comportamiento inteligente.

METADATOS : Atributos de los datos o de un documento, normalmente descritos como autor o contenido, a menudo divididos en categorías o facetas, generalmente mantenidos en un catálogo y grabados a veces, de acuerdo a esquemas como Dublín Core o MARC.

METAETIQUETA (METATAG) : Unidades de información que residen dentro de la cabecera de un documento y que describen algo sobre ese documento. Todos los metadatos de una página html son metaetiquetas, pero no todas las metaetiquetas son metadatos.

ONTOLOGÍA: Estructura jerárquica que define formalmente las relaciones semánticas de un conjunto de conceptos. Se usa para crear vocabularios controlados/estructurados para la recuperación o el intercambio de información.

OWL: Web Ontology Language, Lenguaje de especificación de Ontologías Web. Un lenguaje de marcado para publicar y compartir datos usando ontologías en la WWW. OWL tiene como objetivo facilitar un modelo de marcado construido sobre RDF y codificado en XML. Lenguaje de Ontologías Web (Web Ontology Language). Una ontología define los términos a utilizar para describir y representar un área de conocimiento. Las ontologías son utilizadas por las personas, las bases de datos, y las aplicaciones que necesitan compartir un dominio de información (un dominio es simplemente un área de temática específica o un área de conocimiento, tales como medicina, bienes inmuebles, gestión financiera, etc.). Las ontologías incluyen definiciones de conceptos básicos del dominio, y las relaciones entre ellos, que son útiles para los ordenadores. OWL permite definir una ontología en términos de XML.

PICS: Plataforma para la Selección de Contenido en Internet (Platform for Internet Content Selection). Es un conjunto de especificaciones técnicas que ofrecen al usuario la posibilidad de realizar un acceso selectivo a la información que se puede obtener en la Web; esto se consigue a través de la asociación de etiquetas (metadatos) a contenido de Internet, funcionando como un filtro.

RDF: (Resource Description Framework) es una de las tecnologías claves en el proyecto de la Semantic Web Activity. RDF es la propuesta del W3C para definir metadatos en el Web y la base para el procesamiento de metadatos: proporciona interoperabilidad semántica entre aplicaciones que intercambian información entendible por máquina. RDF es simplemente un modelo de datos que permite crear metadatos legibles y entendibles por máquina. Infraestructura para la Descripción de Recursos (Resource Description Framework). Es un formato universal para representar datos en la Web, que va a permitir intercambiar información a través de diferentes aplicaciones sin que esos datos pierdan significado, lo que facilita la reutilización de los recursos en la Web.

RDFa: RDFa permite incluir datos estructurados (eventos de calendario, datos de contacto, información sobre las licencias o los derechos de autor, etc.)

99

dentro de las páginas Web, de forma que otras aplicaciones puedan transferir y recopilar la información de forma eficiente. Por ejemplo, gracias a RDFa, una aplicación de calendario podría recopilar los datos que aparecen en un sitio web, cuando se navega por él.

RDF SCHEMA : RDFS o RDF Schema o Esquema RDF es una extensión semántica de RDF. Un lenguaje primitivo de ontologías que proporciona los elementos básicos para la descripción de vocabularios.

RIF: El Formato de Intercambio de Reglas (Rule Interchange Format) es un mecanismo que permite la comunicación entre antiguos sistemas basados en reglas de acuerdo con procesos y metodologías basadas en estándares. La finalidad de este formato es asegurar que los sistemas complejos no sólo funcionen en sus entornos locales, sino que puedan hacerse extensibles con la evolución de las tecnologías de reglas y sean interoperables con otras tecnologías.

Servicios Web: Los Servicios Web son un conjunto de aplicaciones o de tecnologías con capacidad para interoperar en la Web y que intercambian datos entre sí con el objetivo de ofrecer servicios. Los proveedores ofrecen sus servicios como procedimientos remotos y los usuarios solicitan un servicio llamando a estos procedimientos a través de la Web. Estos servicios proporcionan mecanismos de comunicación estándares entre diferentes aplicaciones, que interactúan entre sí para presentar información dinámica al usuario.

SPARQL: El Protocolo Simple y Lenguaje de Consulta de RDF (Simple Protocol And RDF Query Language) es una tecnología que permite hacer consultas sobre información expresada en RDF, usando distintas fuentes de datos y permite obtener también los resultados en formato RDF para poder utilizarlos en diversas aplicaciones.

TESAUROS: Lista estructurada de conceptos, destinados a representar de manera unívoca el contenido de los documentos y de las consultas dentro de un sistema documental determinado, y a ayudar al usuario en la indización y en la correcta recuperación de la información consultada.

URI: Uniform Resource Identifier (URI)= Identificador Uniforme de Recurso. La sintaxis para todos los nombres/direcciones que apuntan o se refieren a un recurso en la World Wide Web. Los URI son cadenas que funcionan como identificadores globales que hacen referencia a recursos en la Web tales como documentos, imágenes, archivos descargables, servicios, buzones de correo electrónico y otros.

VOCABULARIOS: Estructuras o conjuntos de elementos normalizados en Internet. En el ámbito de la Web Semántica se ha formalizado la noción de "ontología“, como sinónimo de vocabulario

WEB: La World Wide Web, la Web o WWW, es un sistema de navegador web para extraer elementos de información llamados "documentos" o "páginas web". Puede referirse a "una web" como una página, sitio o conjunto de sitios que

100

proveen información por los medios descritos, o a "la Web", que es la enorme e interconectada red disponible prácticamente en todos los sitios de Internet.

WEB 2.0: Segunda generación de Web basada en comunidades de usuarios y una gama especial de servicios, como las redes sociales, los blogs, los wikis o las folksonomías, que fomentan la colaboración y el intercambio ágil de información entre los usuarios.

WEB SEMÁNTICA : Término acuñado por Tim Berners-Lee que ve el futuro de la Web como una web de datos, como una base de datos global. La infraestructura de la Web semántica permitirá que, tanto las máquinas como los humanos hagan deducciones y organicen la información.

WORDNET: Red/taxonomía semántica/léxica del inglés, formada por conceptos agrupados en conjuntos de sinónimos.Es un diccionario semántico designado como una Red, en parte, porque representa palabras y conceptos como un sistema interrelacionado. Permite la indización conceptual de base léxica.

WSDL: El Lenguaje de Descripción de Servicios Web (Web Services Description Language) permite definir lo que hace un Servicio Web según la funcionalidad que ofrece. Mediante este lenguaje se representa la interfaz de uso del servicio, lo que tendrán que tener en cuenta otros servicios a la hora de acceder a su funcionalidad.

XHTML: Lenguaje de Etiquetado de Hipertexto Extensible (Extensible HyperText Markup Language). Es una versión más estricta y limpia de HTML que nace ante la limitación de uso de éste con las cada vez más abundantes herramientas basadas en XML. XHTML extiende HTML 4.0 combinando la sintaxis de HTML, diseñado para mostrar datos, con la de XML, diseñado para describir los datos. (eXtensible Markup Language- Lenguaje Extensible de Marcado) Lenguaje desarrollado por el W3C para permitir la descripción de información contenida en el WWW a través de estándares y formatos comunes, de manera que tanto los usuarios de Internet como programas específicos (agentes) puedan buscar, comparar y compartir información en la red. El formato de XML es muy parecido al del HTML aunque no es una extensión ni un componente de éste, posee mayor modularidad y flexibilidad. XML no es un lenguaje sino un metalenguaje, esto es, que sirve para crear lenguajes. (XML Binding Language) permite asociar elementos de un documento con scripts, manejadores de eventos, hojas de estilo CSS y otros modelos de contenido complejos que pueden estar almacenados en otro documento. Esto puede ser utilizado, por ejemplo, para reorganizar el contenido de un documento, modificando el etiquetado XHTML para aplicar hojas de estilo CSS complejas sin ensuciar el código con elementos div o span innecesarios.

XML Binario: XML Binario es un formato binario de contenido XML diseñado para reducir el tamaño de transmisión de documentos XML a través de la omisión de elementos y atributos desconocidos, lo que permitirá un uso más efectivo de los datos XML en canales de comunicación de banda estrecha, sin perder así funcionalidad ni información.

101

XForms: XForms es un nuevo lenguaje de etiquetado para formularios Web, diseñado para ser el sustituto de los formularios HTML tradicionales, y que va a permitir a los desarrolladores distinguir entre el propósito del formulario y su presentación. Esta separación clara entre contenido y presentación ofrece grandes ventajas en términos de reutilización, independencia de dispositivo y accesibilidad.

XML SCHEMA: Es un lenguaje de esquema utilizado para describir la estructura y las restricciones de los contenidos de los documentos XML de una forma muy precisa, más allá de las normas sintácticas impuestas por el propio lenguaje XML. Se consigue así, una percepción del tipo de documento con un nivel alto de abstracción.

XML Encryption: Lenguaje de Encriptación XML (XML Encryption). Es un lenguaje cuya función principal es asegurar la confidencialidad de partes de documentos XML a través de la encriptación parcial del documento. Encriptación XML se puede aplicar a cualquier recurso Web, incluyendo contenido que no es XML.

XML Key Management: Gestión de Claves XML (XML Key Management - XKMS). Es un protocolo para distribuir y registrar claves públicas que oculta la complejidad que surge con PKI (Infraestructura de Clave Pública). Está compuesto de dos partes que son: el registro de la clave pública (X-KRSS) y la información de clave pública (X-KISS)

XML Query (XQuery): Lenguaje de Consulta XML (XML Query). Es un lenguaje que ofrece la posibilidad de realizar consultas en infinidad de tipos diferentes de documentos como son documentos estructurados, colecciones de documentos, bases de datos, estructuras DOM, catálogos, etc., para extraer datos en la Web.

XML Schema: Esquema XML (XML Schema). Es un lenguaje cuyo objetivo principal es definir la estructura en bloques de un documento XML, al igual que lo hace un DTD, pero de una forma mucho más precisa. El propósito de un esquema es definir y describir una clase de documentos XML usando estas construcciones para restringir y documentar el significado, uso y relaciones de las partes constituidas: tipo de datos, elementos y su contenido, atributos y sus valores, entidades y su contenido, y anotaciones. Los esquemas documentan su propio significado, uso y función.

XML Signature: Firma XML (XML Signature). Es un sistema que, a través de una firma digital, permite ofrecer autentificación de los datos que se manejan. Con la firma digital se confirma la identidad del emisor, la autenticidad del mensaje y su integridad, sin olvidar que los mensajes no serán repudiados.

XPath: Lenguaje de Rutas XML (XML Path Language). Es un lenguaje para acceder a partes de un documento XML, como pueden ser sus atributos, elementos, etc.

102

XPointer: Lenguaje de Direccionamiento XML (XML Pointer Language). Es un lenguaje que se utiliza para llegar a partes específicas de un documento XML, esto es, a sus elementos, atributos y contenido. XPointer, una vez que XLink ha establecido el enlace con el recurso, va a un punto concreto del documento. Su funcionamiento es muy similar al de los identificadores de fragmentos en un documento HTML ya que se añade al final de una URI y después lo que hace es encontrar el lugar especificado en el documento XML.

XSL: Lenguaje de Hojas de Estilo Extensible (eXtensible Stylesheet Language). Es un lenguaje para crear hojas de estilo a través de las cuales será posible mostrar el contenido estructurado de un documento con un formato determinado. Consiste en dos partes: un lenguaje de transformación de documentos XML y un vocabulario XML para especificar semánticas para el formato (objetos de formato).

XSLT : Transformaciones del Lenguaje de Hojas de Estilo Extensible (Extensible Stylesheet Language Transformations). Es un lenguaje que permite la transformación de la estructura de un documento XML en otro documento XML con estructura diferente.

Documents

ESTUDIO DE LA WEB SEMÁNTICA