15
Rafael Polo UNIRIO/PPGI

Rafael Polo UNIRIO/PPGI. Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

Embed Size (px)

Citation preview

Page 1: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

Rafael Polo UNIRIO/PPGI

Page 2: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web fornece apenas mais uma tecnologia intelectual numa longa lista que temos desenvolvido para navegar através deste espaço.

No entanto, estamos começando a experimentar buscas com a linguagem, sem restrições - frases e diálogos. Estas tecnologias de linguagem natural não só têm o potencial de proporcionar uma melhor maneira de navegar no espaço do conhecimento global, mas também proporcionar uma rica representação do conhecimento, porque eles permitem que as pessoas interajam com o conhecimento da forma mais natural possível, como fazemos uns com os outros.

Page 3: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

um chatterbot exige que você navegue através de um espaço social ou psicológico para extrair conhecimento sobre a extensão dessa ontologia, permitindo às pessoas interagirem com ricas representações de conhecimento.

pró-ativo + memória: exige ontologia dos interlocutores (pessoa e agente)

Page 4: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

Arquitetura de software que resolve o problema de processamento de linguagem

Pode ser completamente separado e independente de um domínio específico, organização e conteúdo do repositório de dados, utilizando acesso direto à sua estrutura e conteúdo.

A proposta de processamento da linguagem envolve cinco etapas

1. rótulo semântico2. rótulo da linguagem3. análise4. interpretação semântica abstrata5. interpretação semãntica concreta

Page 5: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

marca todas as palavras (tokens) na questão que correspondem com valores do repositório de dados

“Rafael” seria rotulado como Pessoa.nome (se houver no repositório)

“semana passada”, “ontem”, “hoje”, seriam traduzidos em intervalos de data.

Uma questão pode ter diferentes tipos de rótulos.

Page 6: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

- Rotula categorias identificando referencias potenciais no repositório de entidades como classes e propriedades.

- plural, singular. contatos=>contato

- Para tornar isso possível, alguma gramática léxica também deve ser associada as entidades.

- empresa => compania => corporação

Page 7: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

Tokens que não possuem rótulos são descartados.

Repositórios que incluem pesos semânticos seriam calculados nessa etapa.

ontology design: if a subject is related to two different properties that share a language tag, the weight of the edges leading from the subject to these properties should be such that the property that corresponds to the better semantic interpretation of the query binding the property tag to a value would have smaller weight (or shorter path if we assume that all edges have the same weight).

Page 8: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

Quais os nomes dos meus contatos na PUC do Rio?

supondo uma simples ontologia que convenha ao caso

1. “Rio” é o valor de uma categoria em Localidade.nome

2. “PUC” é o valor de uma categoria Faculdade.nome 3. “contatos” é a referência para a classe Contato 4. “nomes” é a referência a um dos muitos atributos

anexados na análise à classe Contato

Page 9: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

“Who is the director of ABC?”.

“Who” is a language tag of the properties “first name” and “last name” of the class Person, “director” is a value of the property “title” of the class Affiliation. “ABC” is a value of the property “name” of the class Organization. With this information we generate the following meaning representation:

(x firstName ?) (x lastName ?) (x type Person) (x Affiliation.title director) (x Organization.name ABC)

Page 10: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

Consulta define subgrafo

(x name ?v) (x type Contact) (x Organization.name IBM) (x Locality.name Ulm)

A consulta RDF requerendo a ligação de variáveis usando os fatos no repositório não iria funcionar porque as instâncias Contato no nosso repositório não tem tais propriedades, como Locality.name ou Organization.name (mas estão relacionadas a essas categorias através de outras propriedades)

Page 11: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

A interpretação apropriada do significado desta representação está sobre a noção de semântica de entidades afins. Um banco de dados RDF ou repositório é comumente conceituada como um gráfo.

É considerado dois nós n1 e n2 de um repositório RDF semanticamente relacionadas sobre a classe selecionada e predicado domínio D se existe um caminho de predicados de D que liga esses nós.

Especificando um domínio de predicado permite excluir as relações semânticas sobre meta domínios estabelecidos, por exemplo, predicados RDFS ou simplesmente domínios de interesse separados.

Page 12: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

a representação abtsrata anterior só define os nós e arestas do subgrafo, que podem estar desconectados – não são concretos.

Dado um conjunto de elementos na represenatção abstrata é possível geral um conjunto de representações concretas.

Elimina muitas interpretações.

Impor voz –ativa ao modelo ontológico◦ evita problema n-n (tel-pessoa), (pessoa-tel)

um subgrafo compacto que abrange todos os nós é considerado como uma melhor interpretação semântico de uma determinada questão

Page 13: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

gerar repositório.rdf em português gerar RDFS explorar SPARQL para consultar

◦ estrutura◦ conteúdo

realizar etapas da arquitetura proposta avaliar resultados da consulta implementar simples agente inteligente

reativo

Page 14: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

<?xml version="1.0"?>

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:album="http://www.baixogavea.com/rdf/album#">

<rdf:Description rdf:about="The White Album"> <album:banda>The Beatles</album:banda> <album:ano>1969</album:ano> <album:usuario>joe</album:usuario> <album:ultimo_link>http://mupload.com/ds42f</album:ultimo_link> <album:criado>joe</album:criado> </rdf:Description>

</rdf:RDF>

Page 15: Rafael Polo UNIRIO/PPGI.  Os seres humanos, como criadores e consumidores de conhecimento, criaram um espaço de conhecimento global. A World Wide Web

proposta: Quem adicionou a banda <#banda>? Quando a banda <#banda> foi adicionada? Quando o album <#album> foi adicionado? Quais os albuns da banda <#banda>? Quem adicionou o album <#album>? O album <#album> é de que ano? Quais os albuns adicionados semana passada?