25
HERRAMIENTAS DIGITALES PARA LA EDICIÓN: TEI V Seminario de Investigación del Departamento de Literatura Española y Teoría de la Literatura: “La edición literaria: perspectivas y retos” Elena González-Blanco Clara Isabel Martínez Cantón María Dolores Martos Pérez

Herramientas digitales para la edición

Embed Size (px)

Citation preview

Page 1: Herramientas digitales para la edición

HERRAMIENTAS DIGITALES PARA LA EDICIÓN: TEI

V Seminario de Investigación del Departamento de Literatura Española y Teoría de la Literatura:

“La edición literaria: perspectivas y retos”

Elena González-BlancoClara Isabel Martínez CantónMaría Dolores Martos Pérez

Page 2: Herramientas digitales para la edición

¿Qué son las tecnologías de marcado?Digitalización Transcripción Codificación

Paz a España, paz segura.Canten abiertos los camposdichosos de Extremadura. Lean los niños, las flores,y entre las negras encinastodos los trabajadores. ¡Lejos tanta noche oscura!¡Para siempre en primavera,la tierra de Extremadura!Yo os traigo en este pregón,el libro, fuente de gracia,que ilumina el corazón. Agua tranquila, agua pura,agua que riegue la sangredel alma de Extremadura.Libros de amor, luz, ensueño.Alta vida y viento en calmaen todo el pueblo extremeño

Material cedido por el Prof. Fradejas Rueda, UVA y Archivo Iberoamericano de Cetrería

Page 3: Herramientas digitales para la edición

SAINT-EXUPÉRY, Antoine de (1996). El principito. Madrid, Alianza

Un ejemplo

<bibref><autor> Saint-Exupéry, Antoine de </autor> <titulo> El principito </titulo><imprint>

<editorial> Alianza </editorial><fecha año=“1996”> 1996 </fecha><extension unidad=“paginas”> 116 </extension>

</imprint><ISBN> 8420613487</ISBN>

Page 4: Herramientas digitales para la edición

Marcado, etiquetado o codificación

Page 5: Herramientas digitales para la edición

Ventajas1. Trata con documentos (textos).2. No está ligado a la representación formal.3. Facilita el procesamiento del texto por

programas informáticos ejecutados desde diferentes máquinas

4. Es un estándar abierto, reutilizable e interpretable.

5. Perdurabilidad.6. Diálogo (son lenguajes).

Page 6: Herramientas digitales para la edición

Lenguajes de marcado • Describen las partes lógicas (estructura lógica y semántica)

de un tipo de documento (o conjunto de datos) particular, sin límite en el nivel de profundidad o detalle

Paz a España, paz segura.Canten abiertos los camposdichosos de Extremadura. Lean los niños, las flores,y entre las negras encinastodos los trabajadores.

Page 7: Herramientas digitales para la edición

Lenguajes de marcado

• Son lenguajes porque tienen• Vocabulario: Para denominar a cada elemento estructural

del documento de cualquier nivel de profundidad, a cada atributo de estos elementos, a cada valor de estos atributos (para cierto tipo de atributo), etc.<poema><estrofa><verso>

• Sintaxis (o gramática): Para indicar qué construcciones estructurales están permitidas: qué debe o puede contener cada elemento, si un elemento o atributo es obligatorio, si un elemento puede o no repetirse, qué tipo de valor admite un atributo, etc.

Page 8: Herramientas digitales para la edición

El estándar

XML

TEI

Lengua

Español

Page 9: Herramientas digitales para la edición

• Text Encoding Initiative: Iniciativa de codificación de textos, especialmente en

Humanidades, Ciencias Sociales y Lingüística.

• Mantenida hoy por el Consorcio TEI "organización internacional cuya misión es

el desarrollo y mantenimiento de directrices para la codificación digital de textos

literarios y lingüísticos que publica las TEI Guidelines for Electronic Text

Encoding and Interchange, un estándar internacional e interdisciplinar

ampliamente usado por bibliotecas, museos, editores y eruditos para representar

todo tipo de material textual para la investigación y la enseñanza en línea"

• Se describe en las TEI Guidelines: el manual de uso

• Tiene un carácter modular y es personalizable

Page 10: Herramientas digitales para la edición

Objetivos- Promover la creación, el intercambio y la integración de los datos textuales informatizados.

- Editar textos de cualquier tipología, género y disciplina (Ciencias Humanas y Sociales), en cualquier lengua y de cualquier período cronológico.

Page 11: Herramientas digitales para la edición

TEI Consortium: http://www.tei-c.org- Guidelines- Lista de proyectos que utilizan TEI- Wiki- Herramientas- Lista de discusión

Page 12: Herramientas digitales para la edición

Módulos de TEI1. Infraestructura TEI2. TEI Header (encabezado) = header3. Elementos disponibles en todos los docs TEI =

core4. Estructura del texto por defecto = textstructure5. Caracteres no estándares y Glyph = gaiji6. Verso = verse7. Drama = drama8. Transcripción de discurso = spoken9. Diccionarios = dictionaries10. Descripción de manuscritos = msdescription11. Representación de fuentes primarias= transcr

Page 13: Herramientas digitales para la edición

FUNDAMENTOS DE MARCADO XML-TEI

Page 14: Herramientas digitales para la edición

Etiquetas del documento (tags)• Aíslan una porción de texto con un significado semántico específico:

<etiqueta>concepto</etiqueta><titulo>Taller de TEI</titulo><autor>Clara Martínez</autor><fecha>10/11/2015</fecha>

• La estructura consiste en la anidación sin límites de unos elementos en el interior de otros, construyendo así una estructura arborescente. Por eso, necesitamos siempre un solo elemento raíz del que cuelguen todos los otros.

• Una de apertura <titulo> y una de cierre </titulo>

• Hay elementos vacios <lb/>: insertan algo como un salto de línea, o de página

Page 15: Herramientas digitales para la edición

Tipos de etiquetas: elementos, atributos y valores

<verso rima=“A”>Cuando yo veo la gentil criatura</verso>

• Elemento: son las unidades de información semántica compuestas de una marca de abertura <verso> y de cierre </verso>. El nombre del elemento constituye su identificador general.

• Atributo: añaden una característica adicional al elemento; su orden no es relevante; deben siempre llevar un valor.

• Valor: rellena el valor o contenido del atributo.

Elemento Atributo Valor

Page 16: Herramientas digitales para la edición

Tipos de elementosUn elemento puede contener, según se especifique en la DTD o esquema (si existe):1. Otros elementos, subelementos o elementos hijos .Ej.: <text><body><lg><l>2. Texto. Ej.: <author>Prescod, Paul</author> 3. Contenido mixto, o sea, una mezcla de elementos hijos y texto. Ej.: <titulo>Charles F. Goldfarb's<enfasis>XML</enfasis> Handbook</titulo> 4. Nada, si es un elemento vacío. Ej.:<Cartel fuente="laentrega.jpg"/>

Page 17: Herramientas digitales para la edición

Tipos de elementosUn elemento puede ser según se especifique en la DTD o esquema (si existe):

1. Obligatorio2. Opcional 3. Prohibido

Page 18: Herramientas digitales para la edición

Un doc XML-TEI• Tiene que estar bien formado, es decir estar expresado correctamente según la gramática de XML

• Tiene que ser válido - Para ello, necesita un modelo que fije la estructura básica y las posibilidades de anidación del documento. Las DTD o esquemas (RelaxNG, W3CSchema) establecen la sintaxis que debe tener el documento XML.

Page 19: Herramientas digitales para la edición

¿Qué significa bien formado?1. Tiene que existir un único elemento raíz que contenga todo el documento2. Cada subárbol debe estar correctamente anidado, es decir, no se pueden solapar3. Los nombres de las etiquetas son case/sensitive: <de> ≠ <De> ≠ <DE>4. Una etiqueta de apertura <p> debe tener siempre una etiqueta de cierre </p> (salvo en los casos de etiquetas vacías <vacia/> )5. No debe haber espacios en blanco tras < o antes de </ <p>párrafo</p>Y no < p>párrafo</ p> ni <p >párrafo</p >6. El valor de los atributos ha de estar siempre entrecomillado<p type="text">algo de texto</p>

Page 20: Herramientas digitales para la edición

ESTRUCTURA DE UN DOCUMENTO TEI

Page 21: Herramientas digitales para la edición

Estructura de un documento TEI• <TEI>: Elemento raíz habitual. Tiene dos hijos:

1. <teiHeader> Metadatos sobre el texto codificado (autoría y responsabilidad, información bibliográfica, descripción del manuscrito, historial de revisiones, etc.)

2. <text> Características estructurales del documento (secciones, encabezados, párrafos, citas, resaltado, etc.)

Page 22: Herramientas digitales para la edición

Estructura de un documento TEI

Page 23: Herramientas digitales para la edición

TEI Header<teiHeader>: Tiene cuatro hijos y numerosos descendientes

<fileDesc> (obligatorio): descripción bibliográfica del archivo electrónico<titleStmt> (obligatorio): título de la obra y responsables de su contenido intelectual<editionStmt>: edición de un texto<extent>: tamaño del texto electrónico, en unidades adecuadas<publicationStmt> (obligatorio): publicación y distribución del texto electrónico<seriesStmt>: serie, en su caso, a la que pertenece la publicación<notesStmt>: notas que informan sobre un texto adicional al indicado en otras partes de la descripción bibliográfica<sourceDesc> (obligatorio): descripción bibliográfica del o los textos fuente a partir de los cuales se ha generado el texto electrónico.

<encodingDesc>: documenta la relación entre un texto electrónico y la fuente original, y las prácticas de codificación y transcripción seguidas<profileDesc>: descripción de aspectos no bibliográficos de un texto (idiomas usados, materia, género, etc.)<revisionDesc>: historia de las revisiones, control de cambios

Page 24: Herramientas digitales para la edición

TEI Text<text>: texto de la obra, individual (una única obra) o compuesto (una colección de obras, p.ej. una antología). Tiene tres hijos:

<front> (opcional): materia inicial (portada, dedicatoria, tabla de contenidos, prólogo, prefacio, agradecimientos, resumen, etc.)<body>: cuerpo de la obra. <back> (opcional): materia final (apéndice, glosario, notas, bibliografía, índice, colofón, etc.). En realidad se distingue de la inicial sólo por su situación; pueden contener exactamente los mismos tipos de componentes)

Page 25: Herramientas digitales para la edición

<text> <body> módulo verso