36
1 Radar Networks Nova Spivack CEO & Founder Radar Networks Entendiendo La web semántica

Nova Spivack Semantic Web Talk, Entendiendo la web semántica

Embed Size (px)

DESCRIPTION

Traducción de una fantástica presentación de Spivack acerca de la web semántica

Citation preview

Page 1: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

1Radar Networks

Nova SpivackCEO & FounderRadar Networks

Entendiendo La web

semántica

Page 2: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

2Radar Networks

Sobre esta charla

• Entendiendo el sector semántico

•Haciendo la web semántica más usable

• Perspectivas futuras

• Twine.com

• Preguntas y respuestas

Page 3: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

3Radar Networks

La gran oportunidad…

El gráfico social sólo conecta personas

Gente

Grupos

El gráfico semántico lo conecta todo…

EmailsCompañías

Productos

Servicios

Páginas web

Multimedia

Documentos

Eventos

Proyectos

Actividades

Intereses

Lugares

Mejores búsquedas

Anuncios más enfocados, mejores targets

Colaboración más inteligente

Integración más profunda

Contenido enriquecido

Mayor personalización

Page 4: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

4Radar Networks

La tercera década de la web

•Un periodo de tiempo, no una tecnología….

• Enriquece la estructura de la web•Mejora la calidad de las búsquedas, la colaboración, la publicación, la publicidad•Hace las aplicaciones más integradas e inteligentes.

• Transforma la Web desde servidora de archivos a base de datos• Las tecnologías semánticas van a jugar un rol clave

Page 5: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

5Radar Networks

La inteligencia está en las conexiones

Connections between people

Con

nect

ions

bet

wee

n In

form

atio

n

Email

Social Networking

Groupware

JavascriptWeblogs

Databases

File Systems

HTTPKeyword Search

USENET

Wikis

Websites

Directory Portals

2010 - 2020

Web 1.0

2000 - 2010

1990 - 2000

PC Era1980 - 1990

RSSWidgets

PC’s

2020 - 2030

Office 2.0

XML

RDF

SPARQLAJAX

FTP IRC

SOAP

Mashups

File Servers

Social Media Sharing

Lightweight Collaboration

ATOM

Web 3.0

Web 4.0

Semantic SearchSemantic Databases

Distributed Search

Intelligent personal agents

JavaSaaS

Web 2.0 Flash

OWL

HTML

SGML

SQLGopher

P2P

The Web

The PC

Windows

MacOS

SWRL

OpenID

BBS

MMO’s

VR

Semantic Web

Intelligent Web

The Internet

Social Web

Web OS

Page 6: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

6Radar Networks

Más allá de los límites de la búsqueda en base a keywords

Amount of data

Pro

duct

ivity

of S

earc

h

Databases

2010 - 2020

Web 1.0 2000 - 2010

1990 - 2000

PC Era1980 - 1990

2020 - 2030

Web 3.0

Web 4.0

Web 2.0 The World Wide Web

The DesktopKeyword search

Natural language search

Reasoning

Tagging

Semantic Search

The Semantic Web

The Intelligent Web

Directories

The Social Web

Files & Folders

Page 7: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

7Radar Networks

Web de alta resolución

ColdplayBand

Palo AltoCity

JanePerson

IBMCompany

DavePerson

BobPerson

DesignTeamGroup

StanfordAlumnae

Group

IBM.comWeb Site

123.JPGPhotoDave.com

Weblog

SuePerson

JoePerson

Dave.comRSS Feed

Lives in

Publisher of

Friend of

Depiction of

Depiction of

Member of

Married to

Member of

Member of

Member of

Fan of

Lives in

Subscriber to

Source of

Author of

Member of

Employee of

Fan of

Page 8: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

8Radar Networks

Cinco aproximaciones a la web semántica

• Tagging (etiquetado, marcadores sociales)

• Estadísticas

• Lingüísticas

•Web semántica

• Inteligencia artificial

Page 9: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

9Radar Networks

Etiquetado

• Pros• Para el usuario es fácil añadir y leer tags• Los tags son sólo cadenas, sin complicados algoritmos y ontologías.• No es necesario aprender ninguna tecnología

• Contras• Para el usuario es fácil añadir y leer tags• Los tags son sólo cadenas, sin complicados algoritmos y ontologías.• No es necesario aprender ninguna tecnología

• Technorati

• Del.icio.us

• Flickr

• Wikipedia

Page 10: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

10Radar Networks

Aproximación estadística

• Pros: • Algoritmos matemáticos puros• Masivamente escalables• Independientes del lenguaje

• Contras: • No hay comprensión del contenido• Es difícil hacer buenas consultas• Mejores para encontrar tópicos populares, no para encontrar una aguja en un pajar• No son buenos para datos estructurados

• Google

• Lucene (software para búsquedas)

• Autonomía

Page 11: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

11Radar Networks

La aproximación lingüística

• Pros:• Entienden el lenguaje natural• Extraen conocimiento del texto• Los mejores para encontrar hechos particulares o relaciones.• Consultas más precisas

• Contras:• Necesitan muchos recursos computacionales• De difícil escalabilidad• Bastante erráticos• Dependientes del lenguaje

• Powerset

• Hakia

• Inxight, Attensity, y otros…

Page 12: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

12Radar Networks

Enfoque semántico

• Pros:• Consultas más precisas• Aplicaciones más inteligentes con menos trabajo• No requieren de tantos recursos computacionales• Compartir y enlazar datos entre aplicaciones.• Funciona en datos estructurados y desestructurados

• Cons:• Ausencia de herramientas• Difíciles de escalar• ¿Quien crea todos los metadatos?

• Radar Networks (Twine)

• DBpedia Project

• Metaweb

Page 13: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

13Radar Networks

Enfoque de la Inteligencia artificial

• Pros:• Inteligencia en dominios restringidos• Contestar cuestiones de forma inteligente• Razonamiento y aprendizaje

• Contras:• Computacionalmente intensivo• Difícil de escalar• Extremadamente difícil de programar• No funciona bien fuera de dominios restringidos• El entrenamiento es difícil, requiere mucho trabajo

• Cycorp

Page 14: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

14Radar Networks

Los acercamientos, comparados

Crear software más inteligente

Crear o hacer datos más inteligentes

Estadístico

Lingüistico

Web semántica

InteligenciaArtificial

Tagging-Etiquetado

Page 15: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

15Radar Networks

Dos formas de añadir “significado semántico”

• “De abajo-arriba” (Clásico)• Añadir metadatos semánticos a páginas y bases de datos en la web• Cada website se hace semántico•Hay que aprender RDF/OWL

• “De arriba-Abajo” (Contemporáneo)•Generar de forma automática metadatos semánticos para dominios verticales.• Crear servicios que proporcionen semantización como una capa sobre la web no semántica•Nadie tiene que aprender RDF/OWL

-- Alex Iskold

Page 16: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

16Radar Networks

En la práctica lo que mejor funciona es un enfoque híbrido

EtiquetadoWeb semánticaDe arriba abajoestadísticasLingüísticoDe abajo arribaInteligencia artificial

Page 17: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

17Radar Networks

La web semántica establece claves

• La inteligencia está fuera de las aplicaciones, en los propios datos

• Los datos se convierten en auto-descriptores; El significado de los datos se convierte en parte de los mismos

• Las aplicaciones se convierten en más inteligentes con menos trabajo porque los datos conllevan conocimiento sobre que son y cómo usarlos.

• Los datos pueden ser compartidos y enlazados más fácilmente

Page 18: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

18Radar Networks

Web semántica = Base de datos abierta, como una capa sobre la web

Perfiles de

usuarioContenido

webRegistrode datos

Apps &Servicios

AnunciosY listas

Mapeado abierto de datos

Registro abierto de datos

Reglas abiertas

Ontologías abiertas

Interfaces consulta abierta

Page 19: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

19Radar Networks

Los estándares abiertos en la web

•RDF – Almacena los datos como “triples”

•OWL – Define sistemas de conceptos denominados “ontologías”

• Sparql – Consultas en RDF

• SWRL – Define reglas

•GRDDL – Transforma datos a RDF

Page 20: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

20Radar Networks

RDF “Triples”

• El sujeto, que es una referencia RDF URI o un nodo vacío

• El predicado, que es una referencia RDF URI

• El objeto, que es una referencia RDF URI, un literal o un nodo vacío

Source: http://www.w3.org/TR/rdf-concepts/#section-triples

Sujeto ObjetoPredicado

Page 21: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

21Radar Networks

Los datos de la web semántica describen en sí mismos datos enlazados

Data Record ID

Field 1 Value

Field 2 Value

Field 3 Value

Field 4 Value

Definition

Definition

Definition

Definition

Definition

Definition

Definition

Ontologías

Page 22: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

22Radar Networks

RDBMS vs Triplestore

S P OPerson Table

f_namejimnovachrislew

ID001002003004

l_namewissnerspivackjonestucker

Colleagues Table

SRC-ID001001001001002002002002003003003003004004004004

TGT-ID001002003004001002003004001002003004001002003004

Subject Predicate Object001 isA Person001 firstName Jim001 lastName Wissner001 hasColleague 002002 isA Person002 firstName Nova002 lastName Spivack002 hasColleague 003003 isA Person003 firstName Chris003 lastName Jones003 hasColleague 004004 isA Person004 firstName Lew004 lastName Tucker

Page 23: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

23Radar Networks

Mezclar bases de datos en RDF es fácil

S P OS P O S P O

Page 24: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

24Radar Networks

La web es la base de datos!

Application A Application B

ColdplayBand

Palo AltoCity

JanePerson

IBMCompany

DavePerson

BobPerson

DesignTeamGroup

StanfordAlumnae

Group

IBM.comWeb Site

123.JPGPhotoDave.com

Weblog

SuePerson

JoePerson

Dave.comRSS Feed

Lives in

Publisher of

Friend of

Depiction of

Depiction of

Member of

Married to

Member of

Member of

Member of

Fan of

Lives in

Subscriber to

Source of

Author of

Member of

Employee of

Fan of

Page 25: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

25Radar Networks

¿Son los RDF/OWL la única forma de expresar la semantización?

•Otras formas:•Cadenas de etiquetas•Taxonomías y vocabularios controlados•Microformatos•Ad hoc [nombre, valor] pares•Notación semántica de metadatos alternativa

Page 26: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

26Radar Networks

¿Una o varias web semánticas?

•Ambas cosas.

• La web semántica es una web de webs semánticas

•Cada uno de nosotros tiene su propia web semántica…

Page 27: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

27Radar Networks

¿Porque está tardando tanto?

• El sueño de la web semántica está tardando en llegar

• La visión original estuvo demasiado focalizada en la Inteligencia Artificial.

• Las tecnologías y herramientas eran insuficientes.

• La necesidad de datos abiertos no era lo suficientemente fuerte.

• La bísqueda por palabras clave y el etiquetado no eran lo suficientemente buenos.

• Ausencia de aplicaciones para el usuario final.

• Muchas confusiones que aclarar.

Page 28: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

28Radar Networks

Cruzando la brecha…

• Comunicando la vision• El foco está en los datos abiertos, no en la I.A (Inteligencia artificial).

• Progreso tecnológico• Los estándares y herramientas finalmente maduran

• Las necesidades no eran lo suficientemente fuertes• La búsqueda por keywords y etiquetas no es ya tan productiva• Las aplicaciones necesitan formas mejores de compartir datos

• Aplicaciones y contenidos• Varias empresas empiezan a exponer daots a la web semántica. Pronto habrá muchos datos.

• Educar al mercado• Mostrar los beneficios de la web semántica al mercado

Page 29: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

29Radar Networks

Futuro, perspectivas:

• 2007 – 2009• Inicio incipiente• Emergen algunas killer apps (aplicaciones)•Otras aplicaciones inician el proceso de integración

• 2010 – 2020• Adopción mayoritaria• Los contenidos semánticos son usados de forma mayoritaria en webs y herramientas

• 2020 +• El próximo gran ciclo: Razonamiento y Inteligencia Artificial. • La web inteligente• La web aprende y piensa de forma colectiva

Page 30: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

30Radar Networks

El futuro de la plataforma….

• 1980’s -- El escritorio es la plataforma

• 1990’s -- El explorador es la plataforma

• 2000’s -- La web es la plataforma

• 2010’s -- El gráfico es la plataforma

• 2020’s -- La red es la plataforma

• 2030’s -- ¿El cuerpo es la plataforma…?

Page 31: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

31Radar Networks

Una de las principales aplicaciones de la web semántica…

Page 32: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

32Radar Networks

¿Qué es Twine?

• Twine es un nuevo servicio de gestión compartida de información en la web

• Trabaja con contenido, conocimiento, datos o cualquier otro tipo de información.

•Diseñado para individuos y grupos que quieran organizar, buscar, compartir y ser informados de su información de una forma más efectiva.

Page 33: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

33Radar Networks

Funcionamiento de Twine

1. Colección de información estructurada o desestructurada sobre el autor en Twine via email, Web o escritorio

2. Twine crea automáticamente conocimiento en web • Entiende los tags & links de forma automática• Busca de forma automática en la Web• Organiza de forma automática la información

3. Proporciona búsquedas semánticas, descubrimientos y registro de términos de interés

4. Ayuda a conectar con otra gente y grupos para hacer crecer el conocimiento compartiendo lugares con intereses comunes

Page 34: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

34Radar Networks

Casos de uso

•Individuales•Información colectiva y de autor para distintos intereses.•Compartir con colegas y amigos•Encontrar y descubrir cosas más relevantes

•Groups & Teams•Gestionar contenido & conocimiento relativos a intereses comundes, objetivos o actividades.•Aumentar, contribuir a la inteligencia colectiva•Colaboracíon más productiva

Page 35: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

35Radar Networks

Información de contacto

•Visita www.twine.com para solicitar una invitación.

• Email: [email protected]

•Blog del autor: http://www.mindingtheplanet.net

• Traducción al castellano: http://elcaparazon.net

•Gracias!

Page 36: Nova Spivack Semantic Web Talk, Entendiendo la web semántica

36Radar Networks

Derechos

• This presentation is licensed under the Creative Commons Attribution License.• Details: This work is licensed under the Creative Commons Attribution 3.0 Unported

License. To view a copy of this license, visit http://creativecommons.org/licenses/by/3.0/ or send a letter to Creative Commons, 171 Second Street, Suite 300, San Francisco, California, 94105, USA.

• If you reproduce or redistribute in whole or in part, please give attribution to Nova Spivack, with a link to http://www.mindingtheplanet.net