View
1.407
Download
0
Category
Preview:
Citation preview
XML y Web Semántica en parlamentos:Caso BCN
15 de mayo de 2012Christian Sifaqui
Congreso Nacional de Chile
Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país
Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país
Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria
Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país
Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria
Rol público, ser el espacio de conocimiento y comprensión de los ámbitos de interés social prioritarios para el país con énfasis en lo político y lo jurídico
Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país
Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria
Rol público, ser el espacio de conocimiento y comprensión de los ámbitos de interés social prioritarios para el país con énfasis en lo político y lo jurídico
Atendemos y entregamos servicios
BCN: fábrica y repositorio decontenidos
Énfasis en administrar contenidos y datos: CMS
Énfasis en administrar contenidos y datos: CMS
Búsqueda y relacionamiento de los contenidos: Autonomy
Énfasis en administrar contenidos y datos: CMS
Búsqueda y relacionamiento de los contenidos: Autonomy
Relacionamiento y apertura de los datos: web semántica
XML
XML
XML (Extensible Markup Language)es un lenguaje de marcación (markup)estándar abiertopromovido por el W3C adoptado ampliamente a nivel mundial
para representar datos y documentos
XML
<preface><subdivision>
<docProponent>República de Panamá</docProponent><docProponent>Ministerio de Desarrolo
Agropecuario</docProponent><docType>Decreto Ejecutivo</docType><docNumber>n. 223</docNumber><docDate date="2010-06-29">(De 29 de 06 de
2010)</docDate><docTitle>Que reglamenta la Ley 72 de 2008, que establece el
procedimento especial para la adjudicación de la propiedad colectiva de tierras de los pueblo indígenas que no están dentro de las comarcas.</docTitle></subdivision>
</preface>
No XML
XML
XML
XML
• formato abierto para datos y documentos• independiente de la tecnología• separa la información de presentación de la de
representación• comprensible para máquinas• jerárquico, riguroso, extensible, preciso y flexible• constituye una inversión a largo plazo para
archivo
XML
1. colocación de marcadores (tags) entorno al texto
2. se debe definir un vocabulario de tags y reglas de cómo deben relacionarse los tags entre sí
3. estas reglas se definen mediante esquemas denominados DTD (Document Type Definition) o esquemas XML
XML
• Legible por la máquina
• interconexión de los documentos• mejor búsqueda• múltiples plataformas• dialogar sistemas informáticos• aplicaciones heterogéneas (blog, wiki, redes sociales,
RSS, etc.)• reutilizar la información• comparativa entre diferentes versiones
XML en ámbito legislativo
Al representar documentos jurídicos – legislativos o parlamentarios – (proyectos de ley, leyes, debates, actos administrativos, etc.) se requieren atenciones especiales:
• contiene información que contribuye a la dirección del workflow (flujo de trabajo)
• apoya la redacción legislativa nacional (mejores prácticas)• interoperable con otras instituciones y otros recursos• se enriquece con las contribuciones de los ciudadanos• preserva (en el tiempo) el valor jurídico en largos intervalos de tiempo• accesible a todos por vía multi-canal (accesibilidad y brecha digital)• abierto a todo el mundo para su inspección• distribuido sin discriminación (usabilidad) • utilizable con herramientas comunes y sistemas de gestión documental
Algunos estándares XML en ámbito legislativo
Muchos de ellos fueron creados en el pasado sólo para la publicación web y no distinguen entre representación del contenido y la presentación (Formex)
Otros son específicos para una nación y difícilmente se adaptan a otros sistemas jurídicos (LexDania, NormeInRete)
Otros no distinguen la parte procedural-aplicativa de la mera representación del documento (House of Representative XML standard)
Algunos estándares XML en ámbito legislativo
Estándares que cumplen las características mencionadas más arriba: Akoma Ntoso
Una personalización de dicho estándar: LexML Brazil, (se utiliza en el Senado de Brasil)
Chile ha adoptado en la BCN un estándar XML similar en algunos aspectos a Akoma Ntoso, pero que realiza la modelación del documento normativo ya en su fase conclusiva (promulgado) sin ocuparse de todo el íter legislativo
Estado del arte: XML en ámbito legislativo
Primera generación del estándar de documento legal XML , se orientó sobre todo a describir el texto legal y su estructura con un enfoque cercano a las entidades de base de datos o el procesamiento tipográfico de paradigmas
Estado del arte: XML en ámbito legislativo
Segunda generación empleó una mayor atención en la modelización del documento y la descripción del texto, la estructura y los metadatos . Sin embargo, el carácter descriptivo de los elementos no fue precedido por un análisis abstracto de las clases de datos y el resultado es una lista demasiado larga de tags, una compleja inclusión de esquemas XML o DTD, con una frecuente superposición entre los metadatos y la definición de texto y unos instrumentos demasiado débiles para unir el texto con diferentes niveles (layers)
Estado del arte: XML en ámbito legislativo
Tercera generación se basa en el patrón (pattern). El patrón define las propiedades de la clase y su gramática, el modelo del contenido, el comportamiento y el respeto a la jerarquía de otras clases, por lo que cualquier tag adicional pertenece a una clase abstracta ya existente y de esta manera se preserva la coherencia a través del tiempo. Dedica especial atención a dividir el texto, la estructura y los metadatos. Mira a la ontología como un principio fundamental para realizar un seguimiento en firme de cualquier nuevo nivel (layer) colocado en la parte superior del texto puro. Debido a que el patrón define unas reglas generales que ya no están sujetas a limitaciones reales en la acción de mark-up, la claridad del diseño favorece su carácter prescriptivo
Estado del arte: XML en ámbito legislativo
Cuarta generación utiliza el patrón (pattern) junto con una co-restricción a modo gramatical, con, entre otros, RELAX NG, Schematron, DSD, etc. para resolver el problema anteriormente mencionado de la falta de carácter prescriptivo
www.leychile.cl
Ley 22000
Artículo 1. abc.Artículo 2. def.Artículo 3. ghi.
Y por cuanto he tenido a bienaprobarlo y sancionarlo…
Ley 22000
Artículo 1. abc.Artículo 2. def.Artículo 3. ghi.
Y por cuanto he tenido a bienaprobarlo y sancionarlo…
Ley 25345
1.- Modifica ley 22000 de la siguienteforma:a)reemplázase en el Artículo 1 laspalabras “a” por “xyz”.
Y por cuanto he tenido a bienaprobarlo y sancionarlo…
Ley 25345
1.- Modifica ley 22000 de la siguienteforma:a)reemplázase en el Artículo 1 laspalabras “a” por “xyz”.
Y por cuanto he tenido a bienaprobarlo y sancionarlo…
Ley 22000
Artículo 1. abc.Artículo 2. def.Artículo 3. ghi.
Ley 22000
Artículo 1. abc.Artículo 2. def.Artículo 3. ghi.
Ley 22000
Artículo 1. xyzbc.Artículo 2. def.Artículo 3. ghi.
Ley 22000
Artículo 1. xyzbc.Artículo 2. def.Artículo 3. ghi.
t0 t1
Modelar “vida” de una norma
Ley Chile
Modelar “estructura” de una norma
Ley Chile
Modelar la “visualización” de una norma
Ley Chile
www.leychile.cl
Acceder a ley 19628http://www.leychile.cl/Navegar?idNorma=141599 http://www.leychile.cl/Navegar?idLey=19628
Obtener el XML de la normahttp://www.leychile.cl/Consulta/obtxml?opt=7&idLey=19628
http://www.leychile.cl/Consulta/obtxml?opt=7&idNorma=141599
www.leychile.cl
www.leychile.cl
Otra opción es mediante un webservice http://www.leychile.cl/Consulta/obtxml?opt=61&cadena=[texto_a_buscar][&exacta=[1|]&cantidad=[5]]
www.leychile.cl
Web ServicesÚltimas leyes publicadas
http://www.leychile.cl/Consulta/obtxml?opt=3
Dada una norma, obtener sus metadatoshttp://www.leychile.cl/Consulta/obtxml?opt=50&strBusqueda=117%23normal%23on||48%23normal%23on||53%23normal%23[idNorma]
Vista “plana”http://www.leychile.cl/Consulta/obtxml?opt=63&idNorma=[idNorma]
Para GLINhttp://www.leychile.cl/Consulta/obtxml?opt=4546&idLey=[idLey]
...
www.leychile.cl
Web Semántica
Web Semántica
WebRepleta de información
Orientada al ser humano:para comprender el contenido de una páginapara relacionar contenidos dentro de una página (textos, imágenes, videos, etc.)
Web Semántica
WebDificultad en localización de la información
(adaptar a una región específica, por ejemplo, traducir)
Buscadores actuales funcionan bien, pero orientados al keyword
Por ejemplo: “constitución”¿la de Chile?¿ciudad del sur?
Web Semántica
WebPodría pensarse en una búsqueda semántica de
información
Web Semántica
http://www.hakia.com/ http://www.sensebot.net/ http://www.deepdyve.com/ http://www.cognition.com/ http://www.dogpile.com/ http://www.standle.com/ http://www.swingly.com/ http://www.semager.com/ http://www.truevert.com/ http://duckduckgo.com/ http://www.evri.com/ http://www.mahalo.com/ http://www.yebol.com/ https://gfi.goldfire.com/ http://kngine.com/ http://www.ixquick.com/ http://www.kosmix.com/ http://www.exalead.com/search/ http://www.lexxe.com/ http://www.factbites.com/ ...
Web Semántica
Pero el problema es la heterogeneidad de la información incluso en diferentes capas
• Codificación (ASCII, UNICODE, etc.)• Lenguaje natural utilizado• Disposición de la información en la página
web
Web Semántica
¿Cómo integrar la información?
• La información está implícita (se puede extraer de la combinación de los datos existentes)
• Se requieren métodos de lógica formal
Razonamiento automático
Web Semántica
Soluciones
• ad hoc: usar métodos de IA para analizar la información no estructurada existente en la Web
• a priori: estructurar la información en la Web para facilitar el análisis automático Web Semántica
Web Semántica
Dos condiciones esenciales para realizar lo anterior:
1. Usar estándares abiertos para describir la información:• claramente definidos• flexibles• ampliables
2. Métodos para extraer información de estas descripciones
Web Semántica
Estándares:
Web Semántica
Open Data: es un idea que impulsa la publicación de datos de forma libre y asequible a cualquier persona para usar y republicar sin restricciones de ningún tipo
Linked Data: es usar la web para conectar datos relacionados que no estaban enlazados previamente. Usa algunas de las mejores prácticas de la Web Semántica
http://datos.bcn.cl
Open/Linked data
LeyChileLeyChile datos.bcn.cldatos.bcn.cl
Tripletas RDFOntologías OWL – RDF Schema
Endpoint Sparql – Interfaz Web WS - SOAP
Normas XML
Herramientas de generaciónde mashup del grafo
Internet
etc.etc.Linked data desde consultas
Web Semántica
Caso BCN¿Cómo definir las URI?
Modelo documental
Cada documento bibliográfico debe ser pensado bajo tres puntos de vista siguiendo el estándar FRBR adoptado por el Grupo de Estudio IFLA sobre Requisitos Funcionales para Registros Bibliográficos:Trabajo: una creación intelectual o artística, la obra original
producida por un autor, por ejemplo el Hamlet de Shakespeare
Expresión: una clara realización intelectual o artística de una obra, por ejemplo la película de Hamlet en 1990 por Zeffirelli
Manifestación: la encarnación física de una expresión concreta, por ejemplo, el formato DVD de la película
Modelo documental
En nuestro caso, el documento legal es interpretado como una fuente bibliográfica y por esta razón tiene diferentes nombres:
• Trabajo: el nombre de la ley en sí, por ejemplo, la Ley 34
Modelo documental
Por lo tanto, es importante definir en esta fase qué partes de todo el documento deberían ser convertidas en una manifestación XML y qué partes es mejor preservar en otros formatos (PDF, TIFF, etc.)
El documento principal, los anexos y la tabla deben ser objeto de control y para cada uno de ellos se identifica una tipología de documento
URI
Para cada uno se debe identificar el URI en cualquiera de los tres aspectos principales: Trabajo, Expresión, Manifestación.
URI
HTML + RDFahttp://datos.bcn.cl/recurso/cl/LEY/20000/datos.html n3http://datos.bcn.cl/recurso/cl/LEY/20000/datos.n3RDFhttp://datos.bcn.cl/recurso/cl/LEY/20000/datos.rdf JSONhttp://datos.bcn.cl/recurso/cl/LEY/20000/datos.json ntripleshttp://datos.bcn.cl/recurso/cl/LEY/20000/datos.ntriples
Otro ejemplo:http://datos.bcn.cl/recurso/cl/DTO/ministerio-de-educacion/
2004-09-21/173/es@2009-11-19/datos.html
URI
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341Decreto 341 del 11 de noviembre de 2008 del Ministerio de Educación
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2008-11-07http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2008-11-07
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2010-07-20http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2010-07-20
Versión original
Última versión
Enlaces
Consulta compleja
Encontrar todas las normas emitidas por una municipalidad entre los años 1995 y 2000, pero que fueron modificadas después del año 2005
PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?Fecha_modificacionWHERE { ?norm n:createdBy ?creator . ?creator n:hasName ?creatorName . ?norm dc:title ?normTitle . ?norm n:publishDate ?pubDate . ?norm n:isModifiedBy ?otherNorm . ?otherNorm n:publishDate ?pubDateOther . FILTER (regex(?creatorName,"MUNICIPALIDAD","i")) FILTER (?pubDate > xsd:date("1995") && ?pubDate < xsd:date("2000") && ?pubDateOther > xsd:date("2005"))}ORDER BY (?pubDate)
PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?Fecha_modificacionWHERE { ?norm n:createdBy ?creator . ?creator n:hasName ?creatorName . ?norm dc:title ?normTitle . ?norm n:publishDate ?pubDate . ?norm n:isModifiedBy ?otherNorm . ?otherNorm n:publishDate ?pubDateOther . FILTER (regex(?creatorName,"MUNICIPALIDAD","i")) FILTER (?pubDate > xsd:date("1995") && ?pubDate < xsd:date("2000") && ?pubDateOther > xsd:date("2005"))}ORDER BY (?pubDate)
Endpoint Sparql
Listado de organismos:
PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX norms: <http://datos.bcn.cl/ontologies/bcn-norms#>
SELECT distinct ?nombre WHERE { ?org norms:creatorOf ?o . ?org norms:hasName ?nombre}
PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX norms: <http://datos.bcn.cl/ontologies/bcn-norms#>
SELECT distinct ?nombre WHERE { ?org norms:creatorOf ?o . ?org norms:hasName ?nombre}
Endpoint Sparql
Versiones de una norma:
PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX norms: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT ?n ?id_norma ?tipo ?prDate ?pbDate ?titulo ?lang ?htmlWHERE { ?n dc:identifier "484478"^^xsd:integer . ?n norms:hasNumber ?id_norma . ?n dc:title ?titulo . ?n dc:language ?lang . ?n norms:type ?tipo . ?n norms:promulgationDate ?prDate . ?n norms:publishDate ?pbDate . ?n norms:hasHtmlDocument ?html .}
PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX norms: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT ?n ?id_norma ?tipo ?prDate ?pbDate ?titulo ?lang ?htmlWHERE { ?n dc:identifier "484478"^^xsd:integer . ?n norms:hasNumber ?id_norma . ?n dc:title ?titulo . ?n dc:language ?lang . ?n norms:type ?tipo . ?n norms:promulgationDate ?prDate . ?n norms:publishDate ?pbDate . ?n norms:hasHtmlDocument ?html .}
Endpoint Sparql
Grafo de una norma:
PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>SELECT ?n ?p ?o WHERE { ?n ?p ?o . Filter (?n=<http://datos.bcn.cl/recurso/cl/ley/ministerio-secretaria-general-de-gobierno/2003-01-04/19846>).}
PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>SELECT ?n ?p ?o WHERE { ?n ?p ?o . Filter (?n=<http://datos.bcn.cl/recurso/cl/ley/ministerio-secretaria-general-de-gobierno/2003-01-04/19846>).}
Endpoint Sparql
Grafo de una norma:
http://datos.bcn.cl/recurso/cl/ley/ministerio-secretaria-general-de-gobierno/2003-01-04/19846/datos.html
Endpoint Sparql
Vinculaciones de modificatorias:
PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX norms: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT distinct ?n ?p ?modificatoriaWHERE { ?n ?p ?modificatoria . ?n norms:isModifiedBy ?modificatoria .Filter (?n=<http://datos.bcn.cl/recurso/cl/ley/ministerio-secretaria-general-
de-gobierno/2003-01-04/19846> ) . }
Actualmente
Actualmente
Otra ontología
Reseñas biográficas
no tenemos todos los años de nacimiento, ni fallecimiento, ni los lugarespor ejemplo, Salvador de la Cavareda Trucios diputado
suplente por Valparaíso 1824 a 1825 (hermano de Salvador y José Joaquín)
Pero sabemos lo que nos faltaPREFIX bcnbio: <http://datos.bcn.cl/ontologies/bcn-biographies#> select * where { ?a a foaf:Person . OPTIONAL {?a bcnbio:hasBorn ?ap } . FILTER (!bound(?ap)) . }
PREFIX bcnbio: <http://datos.bcn.cl/ontologies/bcn-biographies#> select * where { ?a a foaf:Person . OPTIONAL {?a bcnbio:hasBorn ?ap } . FILTER (!bound(?ap)) . }
Uso
Acceso
- datos.bcn.cl- leer documentación de la ontología- acceder a endpoint sparql
select ?p as ?Uri str(?n) as ?Nombre_Completo ?pa as ?Apellido_Paterno ?mo as ?Apellido_Materno where { ?p a foaf:Person . ?p rdfs:label ?n. ?p bcnbio:surnameOfFather ?pa. ?p bcnbio:surnameOfMother ?mo.}
select ?p as ?Uri str(?n) as ?Nombre_Completo ?pa as ?Apellido_Paterno ?mo as ?Apellido_Materno where { ?p a foaf:Person . ?p rdfs:label ?n. ?p bcnbio:surnameOfFather ?pa. ?p bcnbio:surnameOfMother ?mo.}
Visualizaciones
Actualmente
Exponer partes de la norma y su metadataIncorporar más datasets
Reseñas biográficasDatos geográficosTransparenciaHistoria de la LeyCongreso y Recursos legislativos (modelan los
documentos del Congreso Nacional)
Nuevas visualizaciones
Referencias
1. Carlos Iglesias (ed.), “Open Government Data: Feasibility Study in Chile”, 2011. https://public.webfoundation.org/2011/05/OGD_Chile.pdf
2. Cirsfid - Università di Bologna, “XML Legislativo: Principios e instrumentos técnicos”, documento interno BID, 2011
3. Harth, Rudolph & ul Mehdi, “Semantic Web Technologies I”, 2010, http://semantic-web-grundlagen.de/w/images/3/3b/WS1011-1-Einleitung_und_XML.pdf
Recommended