Upload
hoanghanh
View
218
Download
0
Embed Size (px)
Citation preview
1Tema 2. Modelo relacional de datos
2. Modelo relacional de datos
Objetivos• Comprender los principios estructurales del modelo de
datos relacional formal• Entender los conceptos integridad de entidad e
integridad referencial, y apreciar su importancia• Entender los significados e implicaciones del concepto
nulo en el modelo relacional• Comprender el concepto vista relacional, y la
problemática asociada a la modificación de datos a través de vistas
• Conocer los lenguajes formales álgebra relacional y cálculo relacional de tuplas, así como el lenguaje relacional estándar SQL-92
2Tema 2. Modelo relacional de datos
2. Modelo relacional de datos
Contenidos2.1 Presentación y orígenes del modelo relacional2.2 Estructura de datos relacional2.3 Características generales de integridad de datos2.4 Manipulación de datos: lenguajes relacionales
2.4.1 Álgebra relacional2.4.2 Cálculo relacional de tuplas2.4.3 SQL-92
3Tema 2. Modelo relacional de datos
2. Modelo relacional de datos
Bibliografía
[CO 2003] Connoly, T., Begg, C: Sistemas de Bases de Datos. 4ª Edición. Addison Wesley (Cap. 3)
[EN 2002] Elmasri, R.; Navathe, S.B.: Fundamentos de Sistemas de Bases de Datos. 3ª Edición. Addison-Wesley. (Cap. 7, 8 y 9)
[EN 1997] Elmasri, R.; Navathe, S.B.: Sistemas de bases de datos. Conceptos fundamentales. 2ª Edición. Addison-WesleyIberoamericana. (Cap. 6 y 7)
[D 2001] Date, C.J.: Introducción a los sistemas de bases de datos. 7ª Edición. Prentice-Hall. (Cap. 3 al 9)
[SKS 1998] Korth, H; Silberschatz, A., Sudarshan, S.: Fundamentos de bases de datos. 3ª Edición. McGraw-Hill. (Cap. 3 y 4)
...
4Tema 2. Modelo relacional de datos
• Introducido por Codd, 1970
• Es un Modelo de Datos Lógico - de Representación -(basado en registros)
• El modelo más usado en las aplicaciones comerciales de procesamiento de datos convencional
• Dividido en 3 partes:
1. Estructura de Datos2. Integridad de Datos (características generales)3. Manipulación de Datos
2.1 Presentación y orígenes del MR
5Tema 2. Modelo relacional de datos
Base de Datos = Conjunto de Relaciones
• Relación– Estructura de datos fundamental del modelo– Tiene un nombre y representa una entidad genérica– Conjunto de tuplas
• Cada tupla representa una entidad concreta– Compuesta de atributos con nombre (y dominio)
• Cada atributo representa un atributo de la entidad
– Representada mediante una tabla con filas y columnas
• Modelo basado en Teoría matemática– Analogía entre “Relación” (concepto matemático) y “Tabla”– Teoría de Conjuntos y Lógica de Predicados de 1er orden» Sólida Base Formal
2.2 Estructura de datos relacional
6Tema 2. Modelo relacional de datos
2.2 Estructura de datos relacional
duraciónnacionalidadrodajegénerodirectortítulo
117122118110138145
EspañaFranciaEspañaEspañaEEUUMéxico
200220012001199719992000
DramaComediaPoliciacoComedia
Ciencia-ficciónDrama
F. LeónJ. P. Jeunet
N. LópezS. Segura
A. WachowskyA. González
Los lunes al solAmelie
Nos miranTorrente
The MatrixAmores Perros
tuplas
card
inal
idad
gradoatributos
La relación PELICULA
--- ------ ---
Ciencia-ficción,Drama,Thriller,
Comedia... --- ------ ---
2002, 1997, 1999, 2001,
1994, 1972...
Italia,Argentina, España, EEUU, Francia,Japón..
--- ------ ---
dom
inio
s Títulos NombresGéneros Años Países
Tiempo
7Tema 2. Modelo relacional de datos
Términos básicos
2.2 Estructura de datos relacional
SQL-92Formal
Procesamiento de FicherosModelo Relacional
=
=
=
cabecera deColumna
Fila
Tabla
Nombre deCampo de registro
Registro concreto
Fichero
colección de valores permitidos para ciertos atributos
nº atributos en una relación
nº de tuplas en una relación
Debe tener un nombre único dentro de cada relación
Si la tupla t está en la relación R, entonces t∈R
Dominio
Grado
Cardinalidad
Atributo
Tupla
Relación
8Tema 2. Modelo relacional de datos
• Conjunto de valores atómicos del mismo tipo, donde toman su valor los atributos
– La definición de dominios forma parte de la definición de la BD– Cada atributo definido sobre un ÚNICO dominio OBLIGATORIO– Si A, B representan un mismo concepto, A y B con mismo dominio– Dominio D puede contener valores no tomados por ningún atributo
{valores de A} ⊆ Dominio(A)
• Comparaciones Restringidas a Dominio– La comparación de dos atributos sólo tiene sentido si ambos toman
valores del mismo dominio– Si el SGBD soporta dominios, podrá detectar este tipo de errores
Definiciones formales: DOMINIO
2.2 Estructura de datos relacional
9Tema 2. Modelo relacional de datos
Una relación R, sobre conjunto de dominios D1, D2 ... Dn
se compone de dos partes:
• Esquema o CabeceraConjunto de pares Atributo:Dominio
{ (A1:D1), (A2:D2) ... (An:Dn) }– Cada Aj tiene asociado sólo un Dj
– Los Di no tienen por qué ser distintos entre sí
• Estado, Cuerpo o Instancia– Conjunto de tuplas que contiene en un instante concreto– tupla = conjunto de pares Atributo:Valor
{ { (A1:vi1), (A2:vi2) ... (An:vin) } }, donde i=1..m
Definiciones formales: RELACIÓN (1)
2.2 Estructura de datos relacional
10Tema 2. Modelo relacional de datos
Un esquema de relación:PELICULA (titulo:Titulos, duracion:Tiempo, director:Nombres, estreno:Fechas)
Un estado de la relación:{ { (titulo:Torrente), (duracion:110), (director:S.Segura), (estreno:1997) }
{ (titulo:The Matrix), (duracion:138), (director:A.Wachowski), (estreno:1999) }... }
• El estado de una relación es variable en el tiempo– nuevas tuplas, modificación o borrado de existentes
• El esquema no suele variarcostoso:
· reescritura de “miles” de tuplas· ¿valores de nuevos atributos para tuplas ya existentes?
– Suele incluir un conjunto de Reglas de Integridad (se verá)
Definiciones formales: RELACIÓN (2)
2.2 Estructura de datos relacional
11Tema 2. Modelo relacional de datos
• Propiedades de una Relación
1. No existen tuplas repetidas
2. Las tuplas no están ordenadas
3. Los atributos no están ordenadosesquema = conjunto de pares Atributo:Dominio
4. Los valores de atributos son Atómicosdominio = conjunto de valores atómicos
Intersección fila/columna = un solo valor (no lista de valores)
Si R cumple esta propiedad, R está en 1FN
estado = conjunto matemático de tuplas
Definiciones formales: RELACIÓN (3)
2.2 Estructura de datos relacional
12Tema 2. Modelo relacional de datos
• FORMAS NORMALESR está en <determinada> FN si
cumple <cierto> conjunto de condiciones o restricciones
necesarias para estar bien diseñada
de acuerdo con el modelo relacional de datos.
• Toda relación ha de estar en 1FN (estructura de datos simple)
Definiciones formales: RELACIÓN (4)
2.2 Estructura de datos relacional
13Tema 2. Modelo relacional de datos
• Relación vs. Tabla– Relación: Representación abstracta de un elemento de datos
– Tabla: Representación concreta de tal elemento abstracto
– Ventajas
Representación muy sencilla (tabla) del elemento abstracto básico (relación) del Modelo Relacional
Fácil de utilizar, entender, razonar...
– Inconveniente
Aparente orden entre filas y entre columnas de la tabla
Definiciones formales: RELACIÓN (5)
2.2 Estructura de datos relacional
14Tema 2. Modelo relacional de datos
• Percibida por usuarios como una colección de relaciones– de diversos grados (nº de atributos)– que varían con el tiempo (nº de tuplas, estado)
• Las relaciones (tablas) son la estructura lógica de la BD– Niveles externo y conceptual ANSI/X3/SPARC
• Toda BDR cumple el Principio de Información:Todo contenido de información de la BD está representado
de una y sólo una forma: como valores explícitos dentro de posiciones de columnas dentro de filas dentro de tablas
• Conexión lógica entre Relaciones (vínculo o interrelación)– Representada mediante valores– No existen punteros (visibles al usuario)
Definiciones formales: BD RELACIONAL (1)
2.2 Estructura de datos relacional
15Tema 2. Modelo relacional de datos
• En una BDR distinguimos...– Esquema de base de datos
Descripción de la base de datosConjunto de esquemas de relación
PELICULA ( titulo:Títulos, director:Nombres, género:Géneros, rodaje:Años, nacionalidad:Países, duración:Tiempo )
ACTOR ( nombre:Nombres, nombreArtistico: Nombres, agente:Nombres, cache:Dinero )
DIRECTOR ( nombre:Nombres, nacionalidad:Países, operaPrima:Títulos )...
– Estado o instancia de base de datosVisión del contenido de la base de datos en cierto instanteConjunto de estados de relación
Definiciones formales: BD RELACIONAL (2)
2.2 Estructura de datos relacional
16Tema 2. Modelo relacional de datos
• Todo estado de BD refleja la realidad– es un modelo de una porción del mundo real (minimundo)
• Algunas configuraciones de valores NO tienen SENTIDO– pues no representan ningún estado posible del minimundo
2 personas distintas con el mismo DNIUn empleado sin NSSUn alumno con -29 añosUna película sin director
Definición de la BD (esquema) necesita incluir
REGLAS DE INTEGRIDAD
2.3 Características generales deintegridad de datos
17Tema 2. Modelo relacional de datos
Claves Candidatas y PrimariasClaves Ajenas (o foráneas o externas)
• Informan al SGBD de restricciones del mundo real• Así, el SGBD evita configuraciones de datos imposibles• Aumentan la capacidad expresiva del modelo relacional• Cumplen que:
• Forman parte de la base de datos• Se cumplen para cualquier estado de la BD• No varían con el tiempo
• Son específicas de cada BD particular, pero elModelo Relacional incluye...
características generales de integridadimportantes y necesarias en toda BD
2.3 Características generales deintegridad de datos
Reglas de integridad
18Tema 2. Modelo relacional de datos
Sea R una relación R(A1:D1 , A2:D2 ,... An:Dn )• Una superclave de R es un subconjunto SK de atributos
tal que cumple la restricción de Unicidad:
No existen dos tuplas distintas con la misma combinación de valores para SK
• Una clave de R es una superclave tal que cumple la restricción de Irreductibilidad:
Ningún subconjunto de CK cumple la r. Unicidad
• Clave Simple (1 atributo) o Compuesta (varios atributos)
• Cada clave es una restricción de integridad
2.3 Características generales deintegridad de datos
Superclave y Clave de una relación
19Tema 2. Modelo relacional de datos
• Claves como restricción de integridadCLIENTE (codCliente, nombre, ciudad, telefono,...)
¿Qué implicaciones tiene establecer como clave...a) CK = {codCliente, ciudad}b) CK = {codCliente} …?
• Varias claves en una relación«Relación para registrar las visitas de pacientes a sus médicos de familia. Un mismo paciente puede visitar a su médico varias veces en un mismo día»VISITAMEDICA (nssPaciente, historial, fecha, hora, numVisita, medico, observ)Claves (VISITAMEDICA)={ {nssPaciente, numVisita}, {nssPaciente, fecha, hora},
{historial, numVisita}, {historial, fecha, hora} }
2.3 Características generales deintegridad de datos
Superclave y Clave: Ejemplos
20Tema 2. Modelo relacional de datos
• Si R tiene varias claves Claves CandidatasClaves (ACTOR) = { {nombre}, {nombreArtistico} }Claves (EMPLEADO) = { {dni}, {nombre, fechaNac}, {nss} }
• La Clave Primaria (Primary Key, PK ) es la clave candidata elegida para identificar las tuplas de RClave Primaria (ACTOR) = {nombreArtistico}Clave Primaria (EMPLEADO) = {nss}
• Las Claves Alternativas (Alternative Keys, AK) son el resto de claves candidatasClaves Alternativas (ACTOR) = {nombre}Claves Alternativas (EMPLEADO) = { {dni}, {nombre, fechaNac} }
2.3 Características generales deintegridad de datos
Clave Candidata, Primaria y Alternativa
21Tema 2. Modelo relacional de datos
• Conjunto de atributos FK de una relación R2, tal que:1. Existe otra relación R1 con clave primaria PK , y2. Cada valor de FK en R2 es idéntico al de PK en alguna tupla de R1
Conjunto de atributos de una relación que hace referencia a la clave primaria de otra relación (o la misma)
• PELICULA (título, género, duración, director, ...)DIRECTOR (nombre, nacionalidad, ...)
• EMPLEADO (codEmp, nombre, jefe, nss, ...)
• LIBRO (título, isbn, autor, editorial, edición, año, ...)ESCRITOR (dni, nombre, ...)ARTICULO (título, tema, autor, revista, página, ...)
2.3 Características generales deintegridad de datos
Clave Ajena (Externa o Foránea)
22Tema 2. Modelo relacional de datos
• Cada componente de una FK debe estar definido sobre el mismo dominio que el correspondiente atributo de la PK a la que referencia
PACIENTE (nss, nombre, dirección, ...)HISTORIAL (nss, especialidad, fechaApert, ...)VISITA (nss, especialidad, numVisita, fecha, ...)
• Clave Ajena Simple o Compuesta• El uso de Claves Ajenas facilita...
– Eliminación de la Redundancia: Integridad entre ficheros– Mecanismo del Modelo Relacional de datos para establecer
VÍNCULOS ENTRE RELACIONES
2.3 Características generales deintegridad de datos
Clave Ajena (Externa o Foránea) (2)
23Tema 2. Modelo relacional de datos
CLIENTE
CUENTA
2.3 Características generales deintegridad de datos
Clave Ajena (Externa o Foránea) (3)
...
505ValenciaPlaza Mayor, 2Pérez, C
821MurciaRonda Norte, 3López, B505ValenciaPaseo Nuevo, 9Azorín, C
200MurciaGran Vía, 6García, Acuentaciudaddirecciónnombre
...500004000035000saldo
821505200
...númeroCada cliente sólo puede tener una cuenta a su nombre.Una cuenta puede tener más de un cliente como titular.
Vínculo Cliente-Cuenta
24Tema 2. Modelo relacional de datos
• Restricción de Integridad ReferencialTodo valor de una FK debe coincidir
con un valor en la correspondiente PK– La BD no debe contener claves ajenas sin correspondencia:
Si una tupla en una relación hace referencia a otra relación, debe referirse a una tupla existente en esa relación
• Puede existir algún valor de PK al que NO haga referencia ningún valor de la FK
– ESCRITOR que no haya escrito artículos: ninguna tupla de ARTICULOhará referencia a la tupla correspondiente a dicho escritor
2.3 Características generales deintegridad de datos
Clave Ajena (Externa o Foránea) (4)
ESCRITORARTICULO FK
25Tema 2. Modelo relacional de datos
• Diagrama Referencial– Expresión de la existencia de Claves Ajenas
• Camino Referencial
2.3 Características generales deintegridad de datos
Clave Ajena (Externa o Foránea) (y 5)
... editorialnombredniESCRITOR
editorial ...autorisbntítuloLIBRO
revista pág ...autortematítuloARTICULO
...direcciónnombreEDITORIAL
• Ciclo Referencial– Camino que empieza y acaba en la misma relación– Caso especial: Autorreferencia jefe...codEmpEMPLEADO
dep...codEmpEMPL dire...codDepDEPTO
26Tema 2. Modelo relacional de datos
• Las operaciones que no satisfacen –violan– la Integridad Referencial, dejan la BD en un estado incorrectoEjemplo de un Hotel:
– ¿Qué pasaría si se eliminara la tupla (501, D, ...) en HABITACIÓN?– ¿Y si se eliminara la tupla (100, D, ...)?– ¿Y si se anotara la ocupación de la habitación 900?
2.3 Características generales deintegridad de datos
Mantenimiento de la Integridad Referencial
...OCUPACIÓN habitcodClie
100115420100
CLI10CLI05CLI02CLI04
HABITACIÓN
D501I405
304100420115
numHabit ...tipo
DDII
27Tema 2. Modelo relacional de datos
• ¿Cómo evita el SGBD esos estados incorrectos?El SGBD puede...
Rechazar toda operación que pueda provocar un estado ilegal, o
Aceptar (y ejecutar) tales operaciones, pero
realizar acciones que restauren la integridad de los datos
Diseñador de la BD puede especificar al SGBDAcciones de Mantenimientode la Integridad Referencial
para que la BD SIEMPRE alcance un estado final legal
2.3 Características generales deintegridad de datos
Mantenimiento de la Integridad Referencial (2)
28Tema 2. Modelo relacional de datos
R2 ⎯→ R1Operación: Eliminar una tupla t de R1 que es referenciada
por otras de R2Ejemplo: Eliminar la tupla (100, D, ...) de HABITACIÓNAcciones posibles:
1. Rechazar la operación (acción por defecto) Sólo permite borrar t si ninguna otra tupla hace referencia a t
2. Cascada. Propagar la eliminación1º Borrar todas las tuplas de R2 que referencian a t2º Eliminar t
3. Establecer nulos – (* se verá después *)
2.3 Características generales deintegridad de datos
Mantenimiento de la Integridad Referencial (3)
29Tema 2. Modelo relacional de datos
R2 ⎯→ R1Operación: Modificar el valor de una FK a un valor no
existente en la PK de R1Ejemplo: Modificar (CLI02, 420,...) a (CLI02, 900,...) en OCUPACIÓNAcción:
1. Rechazar la operación (SIEMPRE)
Intento de violación de la restricción de Integridad Referencial
2.3 Características generales deintegridad de datos
Mantenimiento de la Integridad Referencial (4)
30Tema 2. Modelo relacional de datos
Operación: Modificar el valor de la PK de una tupla t de R1que es referenciada por otras tuplas de R2
Ejemplo: Modificar la tupla (100, D,...) a (130, D,...) en HABITACIÓNAcciones posibles:
1. Rechazar la operación (acción por defecto) Sólo permite modificar la PK de t si ninguna tupla referencia a t
2. Cascada. Propagar la modificación- Toda tupla de R2 que referencia a t seguirá haciendolo:
modificar su valor de FK al nuevo valor de la PK de t- Modificar el valor de la clave primaria de t
3. Establecer nulos – (* se verá después *)
2.3 Características generales deintegridad de datos
Mantenimiento de la Integridad Referencial (5)
31Tema 2. Modelo relacional de datos
R2 ⎯→ R1Operación: Inserción de una tupla t en R2 cuyo valor de FK
no se corresponde con ningún valor de la PK en ninguna tupla de R1
Ejemplo: Insertar una tupla (CLI03, 555, ...) en OCUPACIÓNAcciones posibles:
- Rechazar la operación (SIEMPRE)
Intento de violación de la restricción de Integridad Referencial
2.3 Características generales deintegridad de datos
Mantenimiento de la Integridad Referencial (6)
32Tema 2. Modelo relacional de datos
• Encadenamiento de eliminaciones (análogo para Modificación)R2 → R1, Acción de Eliminación en CascadaR3 → R2, Acción de Eliminación XX- Eliminar una tupla de R1 eliminar tuplas de R2 que la referencian- Pero existen tuplas en R3 que referencian esas tuplas de R2...
¿cómo afecta la Acción de Eliminación XX en esta operación?Si X X = en CASCADA, no-problemo! eliminar esas tuplas de R3 Si X X = RECHAZAR La operación completa fallará
• Las operaciones de actualización en una BD son siempre atómicas: se realiza “TODO o NADA”PROFESOR → ÁREA → DEPARTAMENTOASIGNATURA → TITULACIÓN → UNIVERSIDAD
2.3 Características generales deintegridad de datos
Mantenimiento de la Integridad Referencial (y 7)
R3 → R2 → R1
33Tema 2. Modelo relacional de datos
• En el mundo real existe...– información perdida fechaNacimiento desconocida– ausencia de información ¿tiene teléfono?– valores no aplicables a ciertos atributos fechJubilac a empleado activo
• Para representar estas situaciones en los sistemas de BD se utiliza el NULO (null)– Si una tupla tiene un atributo que contiene un nulo,
significa que el valor real de tal atributo es desconocido– Es posible especificar si un atributo puede o no contener nulo
nulo no es un valor en sí mismo,sino un indicador de ausencia de información
No hay dos nulos iguales (num_telefono NULL ≠ edad NULL)
2.3 Características generales deintegridad de datos
Nulos
34Tema 2. Modelo relacional de datos
• Nulo y Claves Primarias
Restricción de Integridad de Entidad:Ningún atributo componente de unaclave primaria puede contener nulo
EMPLEADO (codEmp, nss, nombre, telefono, depto, jefe...)¿Qué pasaría si codEmp pudiera contener NULO?
• Nulo y Claves AjenasEl Modelo Relacional permite nulocomo valor de clave ajena
depto = null empleados no asignados a ningún departamentojefe = null empleados sin jefe
2.3 Características generales deintegridad de datos
Implicaciones de los nulos en la integridad
35Tema 2. Modelo relacional de datos
• Hemos de extender la definición de clave ajenaSea R2 una relación. FK es una clave ajena en R2 si es un
subconjunto de sus atributos tal que:1. Existe otra relación R1 con clave primaria PK y2. En todo momento, cada valor de FK en R2
a) es NULO, ob) es idéntico a un valor de PK en alguna tupla de R1
• Restricción de Integridad ReferencialLa Base de Datos no debe contener valores no nulosde clave ajena sin correspondencia
2.3 Características generales deintegridad de datos
Implicaciones de los nulos en la integridad (2)
36Tema 2. Modelo relacional de datos
• Hay que extender algunas acciones de mantenimiento de la Integridad Referencial: R2 ⎯→ R1
Operación: Eliminar una tupla t de R1 que es referenciada por otras de R2
Acciones posibles:1. Rechazar la operación (acción por defecto) 2. Cascada. Propagar la eliminación
3. Establecer nulosSólo si la FK de R2 permite NULO- Toda tupla de R2 que referencia a t pasa a contener NULL en FK- Eliminar la tupla t
2.3 Características generales deintegridad de datos
Implicaciones de los nulos en la integridad (3)
37Tema 2. Modelo relacional de datos
R2 ⎯→ R1Operación: Modificar el valor de la PK de una tupla t de R1
que es referenciada por otras tuplas de R2Acciones posibles:
1. Rechazar la operación (acción por defecto) 2. Cascada. Propagar la modificación
3. Establecer nulosSólo si la FK de R2 permite NULO
- Toda tupla de R2 que referencia a t pasa a contener NULL en FK- Modificar el valor de la PK de t
2.3 Características generales deintegridad de datos
Implicaciones de los nulos en la integridad (y 4)
38Tema 2. Modelo relacional de datos
• Comprobar las claves candidatas (primaria y alternativas):No existen dos tuplas distintas con igual valor para una clave
Definición de BD : indicar los Atributos Componentes de las Claves Candidatas• Comprobar la restricción de Integridad de entidad
Ningún atributo componente de una clave primaria contiene nuloDefinición de BD : indicar los Atributos Componentes de la Clave Primaria
• Comprobar la restricción de Integridad Referencial...El valor de la clave ajena en cualquier tupla, o es nulo, o coincide con un valor de clave primaria de alguna tupla en la relación referenciada
Definición de BD : indicar los Atributos Componentes de las Claves Ajenas• ... y mantenerla frente operaciones que puedan violar la integridad
Definición de BD : indicar Acciones de Mantenimiento de la Integridad Referencial
2.3 Características generales deintegridad de datos
Resumiendo, el SGBD se encarga de...
39Tema 2. Modelo relacional de datos
Dominio Definición del DominioCODPEL enteros(3)CODGUI enteros(3)CODDIR enteros(3)CODDIS enteros(2)CODACT enteros(4)CODAGE enteros(2)SEXOS { M, F }TEXTO cadena caracteres variable (500)PORCENT enteros (2)DINERO enteros(9)NIF cadena caracteres fija (12)TITULOS cadena caracteres variable (120)GENEROS {comedia,drama,terror,suspense,accion,romantica,gore,pulp,roadmovie}PAISES {españa,francia,gran_bretaña,eeuu,australia,alemania,la_india,argentina}AÑOS AÑOFECHAS FECHANOMBRES cadena caracteres variable (35)APELLIDOS cadena caracteres variable (80)DOMICILIOS cadena caracteres variable (50)TELEFONOS cadena caracteres variable (15)TIPO_PAPEL {protagonista, secundario, reparto, figuracion}
40Tema 2. Modelo relacional de datos
Esquema “PRODUCTORA”
PELICULA (codP:CODPEL, titulo:TITULOS, año:AÑO, genero:GENEROS, guion:CODGUI, director:CODDIR, directorFotog:CODDIR, distrib:CODDIS, nacio:PAISES, estreno:FECHA, numOscar:enteros(2), taquilla:DINERO)
DIRECTOR (codDir:CODDIR, nombre:NOMBRES, apellidos:APELLIDOS, nacio:PAISES, fechaNacim:FECHA, operaPrima:CODPEL)
DIREC_FOTOG (codDF:CODDIR, nombre:NOMBRES, apellidos:APELLIDOS, nacionalidad:PAISES, fechaNacim:FECHA, ultTrabajo:CODPEL)
GUION (codG:CODGUI, titulo: TITULOS, resumen: TEXTO, nomAutorPpal:NOMBRES, fechaFin:FECHA, fechaEntrega:FECHA)
DISTRIBUIDORA (codDis:CODDIS, nombre:NOMBRES, cif:NIF, direccion:DOMICILIO, telefono:TELEFONOS, porcentaje:PORCENT)
ACTOR (codA:CODACT, nombre:NOMBRES, nomReal:NOMBRES, nacionalidad:PAISES, fechaNacim:FECHA, sexo:SEXOS, agencia:CODAGE, cache:DINERO)
AGENCIA (codAg:CODAGE, nombre:NOMBRES, direccion:DOMICILIO, telefono:TELEFONOS)
ACTUA_EN (actor:CODACT, film:CODPEL, papel:TIPO_PAPEL, paga:DINERO)
41Tema 2. Modelo relacional de datos
• Definida por Codd, 1972• Colección de operadores que toman relaciones como
operandos y devuelven relaciones como resultado
– Operadores tradicionales sobre conjuntosunióninterseccióndiferenciaproducto cartesianoLos operandos son relaciones, y NO conjuntos arbitrariosoperaciones adaptadas a relaciones (tipo especial de conjuntos)
– Operadores relacionales especialesrestricciónproyecciónreunión ( join )división
2.4 Manipulación de datos2.4.1. Álgebra Relacional
42Tema 2. Modelo relacional de datos
El resultado de cualquier operación del álgebrarelacional es otra relación
☺ la salida de una operación puede ser entrada (operando) de otra
Expresiones AnidadasSus operandos son otras expresiones del álgebra(en lugar de nombres de relación)
2.4 Manip. de datos: Álgebra RelacionalClausura relacional
43Tema 2. Modelo relacional de datos
• En matemáticas, A∪B = { e / e∈A y-o e∈B }• Relación = conjunto de tuplas
es posible hacer la unión de dos relaciones R y S• R∪S = { t / t∈R y-o t∈S }
– Conjunto de todas las tuplas que están en R y/o en S– Sin embargo...
PELICULA ∪ DIRECTOR es un conjunto, pero no es una relación
Las relaciones deben ser homogéneas: no pueden contener mezcla de tuplas de distintos tipos– Ha de mantenerse la Propiedad de Clausura:
el resultado de la operación DEBE ser una relación» Las relaciones de entrada deben ser de tipos compatibles
2.4 Manip. de datos: Álgebra RelacionalCompatibilidad de tipos (o con la unión)
44Tema 2. Modelo relacional de datos
Sean R ( r1, r2,..., rn ), S ( s1, s2, ..., sn )• Relaciones R y S compatibles en tipo si tienen el
“mismo” esquema, es decir:1. Igual número de atributos:
grado(R) = grado(S) = n2. Atributos correspondientes definidos sobre el mismo dominio:
dom(ri) = dom(si) ,, i = 1, 2, ..., n
Ejemplo: DIRECTOR y DIR_FOTOG son de tipos compatibles
UNIÓN, INTERSECCIÓN, DIFERENCIA necesitan operandoscompatibles en tipoPRODUCTO CARTESIANO no necesita compatibilidad de tipo en sus operandos
2.4 Manip. de datos: Álgebra RelacionalCompatibilidad de tipos (y 2)
45Tema 2. Modelo relacional de datos
R∪S, con R y S compatibles en tipo, es una relación tal que:Esquema: el de R (o S)
Estado: conjunto de tuplas que están en R, en S o en ambas
Las tuplas repetidas se eliminan (por definición)Ejemplo: DIRECTOR ∪ DIR_FOTOG
2.4 Manip. de datos: Álgebra RelacionalUnión de relaciones
R∩S, con R y S compatibles en tipo, es una relación tal que:Esquema: el de R (o S)
Estado: conjunto de tuplas que están a la vez en R y en S
Ejemplo: DIRECTOR ∩ DIR_FOTOG
Intersección de relaciones
46Tema 2. Modelo relacional de datos
R―S, con R y S compatibles en tipo, es una relación tal que:Esquema: el de R (o S)Estado: conjunto de tuplas que están en R, pero NO en S
operación con «cierta direccionalidad», como la resta aritméticaEjemplo: DIRECTOR ― DIR_FOTOG
2.4 Manip. de datos: Álgebra RelacionalDiferencia entre relaciones
• La propiedad de clausura relacional permite aplicar una operación tras otraSean R, S, T relaciones de tipos compatibles,
– Única expresión: expresiones anidadas R ∩ ( S ∪ T )– Varias expresiones: relaciones intermedias con nombre
A ← S ∪ TB ← R ∩ A
Secuencias de operaciones
47Tema 2. Modelo relacional de datos
2.4 Manip. de datos: Álgebra Relacional
• Por defecto, los atributos de la relación resultado de una operación heredan los nombres de los del operando más a la izquierda
DIR ← DIRECTOR ∪ DIR_FOTOGLos atributos de DIR tienen los mismos nombres que los de DIRECTOR
• Se puede indicar una lista con nuevos nombres para los atributos de la relación resultado:
DIR(codDir,nomDir,apeDir,nacDir,fechaNac,pelic) ← DIRECTOR ∪ DIR_FOTOG
Renombramiento de atributos
48Tema 2. Modelo relacional de datos
• En matemáticas, A Χ B = { (a,b) / a∈A y b∈B }• Relación = conjunto de tuplas,
es posible el producto cartesiano entre relaciones R y S
• R Χ S = { (tR,tS) / tR∈R y tS∈S }– Conjunto de pares ordenados de tuplas de R y S– Pero ha de conservarse la Propiedad de Clausura:
» El resultado debe ser un conjunto de tuplas (no de pares de)
Producto Cartesiano Ampliado, pues cada par ordenado es sustituido por la tupla resultantede la combinación de las dos tuplas origen
2.4 Manip. de datos: Álgebra RelacionalProducto Cartesiano entre relaciones
49Tema 2. Modelo relacional de datos
• R Χ S, con R y S cualesquiera, es una relación tal que:Esquema: combinación (unión) de los esquemas de R y SEstado: conjunto de todas las tuplas formadas por las posibles
combinaciones de cada tupla de R con cada tupla de S
Ejemplo: PELICULA Χ DIRECTORObtiene un conjunto de tuplas tales que cada una es la combinación de una tupla de
PELICULA y otra de DIRECTOR
• Operación sin demasiada importancia práctica– No se tiene más información a la salida que a la entrada
– pero es necesaria para definir la operación REUNIÓN (JOIN)
2.4 Manip. de datos: Álgebra RelacionalProducto Cartesiano entre relaciones (2)
50Tema 2. Modelo relacional de datos
• El esquema de la relación resultante de R Χ Sdebe estar bien formado (nombres de atributos únicos)
• Si R y S tienen atributos con igual nombre, R Χ S tendría ¡dos atributos nombrados igual! ko!
ACTOR Χ AGENCIA “colisión” de nombres en atributo “nombre”• Soluciones posibles:
1. Renombrar atributos de una relación, antes del productoAGENCIA_2(codAge, nomAge, direccion, telefono) ← AGENCIARESULTADO ← ACTOR Χ AGENCIA_2
2. Prefijar atributos con el nombre de su tabla, en la tabla resultadoRESULTADO(codA, ACTOR.nombre, nomreal,..., codAg, AGENCIA.nombre, ...) ← ACTOR Χ AGENCIA
2.4 Manip. de datos: Álgebra RelacionalProducto Cartesiano entre relaciones (y 3)
51Tema 2. Modelo relacional de datos
R, S, T relaciones de tipos compatibles
• Asociativa( R ∪ S ) ∪ T ≡ R ∪ ( S ∪ T ) ≡ R ∪ S ∪ T( R ∩ S ) ∩ T ≡ R ∩ ( S ∩ T ) ≡ R ∩ S ∩ T( R Χ S ) Χ T ≡ R Χ ( S Χ T) ≡ R Χ S Χ T
• ConmutativaR ∪ S ≡ S ∪ RR ∩ S ≡ S ∩ RR Χ S ≡ S Χ R
• La diferencia no cumple ninguna de estas propiedades
El producto cartesiano “normal” no las cumple, pero sí el “ampliado”
2.4 Manip. de datos: Álgebra RelacionalPropiedades de los operadores relacionales
52Tema 2. Modelo relacional de datos
• Obtener un subconjunto de las tuplas de una relaciónpara las cuales se satisface una condición de selección
σ<condición> (<relación>)
• Resultado: Relación (conjunto de tuplas) con atributos de <relación>• <condición> es una expresión booleana…
– Especificada en términos de atributos de <relación>
– Compuesta por una o más cláusulas, del tipo:<nomAtrib> <opComp> <cte> o bien <nomAtrib> <opComp> <nomAtrib>
• <opComp> operador de comparación ∈ {=, <, ≤, >, ≥, ≠}• <cte> valor constante ∈ dominio del atributo <nomAtrib>• Cláusulas conectadas por operadores booleanos AND, OR, NOT
2.4 Manip. de datos: Álgebra RelacionalRestricción de una relación σ
53Tema 2. Modelo relacional de datos
• Ejemplos:* Tuplas de actores representados por la agencia número 2
σagencia=2 (ACTOR)
* Actores cuyo caché rebasa los 30.000€
σcache>30000 (ACTOR)
* Actores representados por la agencia número 2, cuyo cache no llega a los 22.000€, o bien por la agencia 4 y con caché superior a 32.000€
σ(agencia=2 AND cache<25000) OR (agencia=4 AND cache>35000) (ACTOR)
2.4 Manip. de datos: Álgebra RelacionalRestricción de una relación (2)
54Tema 2. Modelo relacional de datos
• Mecanismo de selección del sistema– Aplica <condición> a cada tupla individual de <relación>, sustituyendo
cada atributo por su valor en la tupla– Si <condición> es TRUE, la tupla se selecciona para el resultado
• Operador Restricción: Unario– Sólo se aplica a UNA relación
Nunca puede seleccionar tuplas de más de una relación– Se aplica a UNA sola tupla a la vez
<condición> nunca se refiere a más de una tupla• Grado(Relación Resultado) = Grado(Relación Origen)
– Tienen los mismos atributos
• Nº Tuplas(Relación Resultado) ≤ Nº Tuplas(Relación Origen)
2.4 Manip. de datos: Álgebra RelacionalRestricción de una relación (3)
55Tema 2. Modelo relacional de datos
• La operación restricción es conmutativa
σcond1(σ cond2 (R) )≡ σcond2(σcond1 (R) )Esto permite …
Secuencia de restricciones (selecciones) en cualquier orden Combinación de una secuencia de restricciones en una
única restricción con una condición conjuntiva:
σcond1(σcond2(...(σcondn(R))...))≡σcond1 AND cond2 AND...AND condn(R)
2.4 Manip. de datos: Álgebra RelacionalRestricción de una relación (y 4)
56Tema 2. Modelo relacional de datos
• Sólo interesan algunos atributos de una relación• Se proyecta la relación sobre esos atributos• Restricción vs. Proyección :
– σ selecciona algunas tuplas de la relación y desecha otras– ∏ selecciona ciertos atributos y desecha los demás
∏<listAtrib>(<relación>)• Resultado: Relación (conjunto de tuplas) cuyos atributos son
sólo los de <listAtrib> y en ese orden• <listAtrib> lista de nombres de atributos de <relación>
* Obtener el código, nombre y el caché de todos los actores∏codA, nombre, cache(ACTOR)
2.4 Manip. de datos: Álgebra RelacionalProyección de una relación ∏
57Tema 2. Modelo relacional de datos
• Si <listAtrib> no contiene atributos clave ¡tuplas repetidas!
* Obtener la agencia y la nacionalidad de todos los actores
∏agencia, nacionalidad(ACTOR)» Eliminación implícita de duplicados
– Resultado ≡ relación válida
• Grado(Relación Resultado) = Nº atributos(<listAtrib>)
• Nº Tuplas(Relación Resultado) ≤ Nº Tuplas(Relación Origen)y es igual (=) si <listAtrib> contiene una clave candidata
2.4 Manip. de datos: Álgebra RelacionalProyección de una relación (2)
58Tema 2. Modelo relacional de datos
• La operación proyección no es conmutativa
∏lista1 (∏ lista2 (R) )≠ ∏lista2 (∏lista1 (R) )• Además, siempre que lista1 ⊆ lista2, entonces...
∏lista1 (∏ lista2 (R) )= ∏lista1 (R)
2.4 Manip. de datos: Álgebra RelacionalProyección de una relación (y 3)
59Tema 2. Modelo relacional de datos
• Combina las tuplas relacionadas de dos relacionesen una sola tupla
• Permite procesar vínculos entre relaciones
* Datos de películas junto con los de su director correspondiente– Es necesario combinar cada tupla de PELÍCULA, p, con la tupla
DIRECTOR, d, tal que el valor de codDir en d coincida con el de director en p
– Se consigue aplicando la operación REUNIÓN a las dos relaciones
R1 ← PELICULA director=codDir DIRECTOR
2.4 Manip. de datos: Álgebra RelacionalReunión o Join entre dos relaciones
60Tema 2. Modelo relacional de datos
PELICULA ( codP, título, año, genero, guión, director, directorFotog, distrib, nacio, estreno, numOscar, taquilla )
DIRECTOR ( codDir, nombre, apellido, nacio, fechaNacim, óperaPrima )
* Títulos de películas junto con nombre y apellido de su director– Se consigue aplicando la operación REUNIÓN a las dos relaciones
– Y proyectando el resultado sobre los atributos requeridos
R2←∏titulo,nombre,apellido (PELICULA director=codDir DIRECTOR)
2.4 Manip. de datos: Álgebra RelacionalReunión o Join entre dos relaciones (2)
R2UrbizuEnriqueLa caja 507
Bajo UlloaJuanmaAirbagUribeImanolEl viaje de CarolGª RuizSalvadorMensaka
apellidonombretitulo
61Tema 2. Modelo relacional de datos
• Forma General para relaciones A(a1, a2, ... an) y B(b1, b2, ... bm):
A <condición de reunión>B
• Resultado: Relación con n+m atributos (a1, a2, ... an, b1, b2, ... bm)Esquema: unión de las cabeceras de A y BEstado: conjunto de tuplas, una por cada combinación de tuplas
(una de A y otra de B) que satisface <condición de reunión>
• Reunión vs. Producto Cartesiano– En el Producto Cartesiano aparecen todas las combinaciones
posibles de tuplas de A y de B
2.4 Manip. de datos: Álgebra RelacionalReunión o Join entre dos relaciones (3)
62Tema 2. Modelo relacional de datos
• <condición de reunión>– Expresión booleana especificada en términos de atributos de A y B– Evaluada para cada combinación (par) de tuplas:
Si la cumplen, forman una nueva tupla de la relación resultado– Es de la forma:
<condición> AND <condición> AND... AND <condición>donde:
<condición> tiene la forma ai θ bj (condición de reunión general), y · ai es un atributo de A; bj es un atributo de B,· Dominio(ai) = Dominio(bj),· θ (theta) cumple que θ ∈ {=, <, ≤, >, ≥, ≠}
• Reunión con condición de reunión general ≡ REUNIÓN THETA
2.4 Manip. de datos: Álgebra RelacionalReunión o Join entre dos relaciones (4)
63Tema 2. Modelo relacional de datos
• La reunión más común es la que implica comparación de igualdad ( θ ≡ = ) EQUI-REUNIÓN (o REUNIÓN, a secas)
* Actores y agencias que los representanACTOR agencia=codAg AGENCIA
• Problema: colisión de nombres de atributos– Existen atributos nombrados igual en ACTOR y AGENCIA– Resultado con varios atributos de igual nombre ko!– Dos soluciones alternativas posibles:
1. Previo renombramiento de atributos de una relaciónAGENC(codAg, nomAg, dirAg, tel) ← AGENCIAR←∏nombre, nomAg (ACTOR agencia=codAg AGENC)
2. Prefijar atributos con el nombre de su tablaR←∏ACTOR.nombre,AGENCIA.nombre(ACTOR agencia=codAg AGENCIA)
2.4 Manip. de datos: Álgebra RelacionalReunión o Join entre dos relaciones (5)
64Tema 2. Modelo relacional de datos
• Las tuplas cuyos atributos de reunión son nulos,NO aparecen en la relación resultado– Los actores que se auto-representan tienen NULL en atributo agencia– Sus tuplas no aparecen en ACTOR agencia=codAg AGENC
• Las tuplas de una relación que no encuentran correspondencia en la otra, tampoco aparecen en la relación resultado– Los actores que no han actuado en ninguna película, no aparecen
en ninguna tupla de la tabla ACTUA_EN– Sus tuplas no aparecen en ACTOR codA=actor ACTUA_EN
2.4 Manip. de datos: Álgebra RelacionalReunión o Join entre dos relaciones (6)
65Tema 2. Modelo relacional de datos
• En general, sea A con nA tuplas y B con nB tuplas, entonces
R ← A <condición de reunión> B cumple que 0 ≤ nR ≤ nA *nB
• Si ninguna combinación de tuplas de A y B cumple la <condición de reunión>, entonces– Relación Resultado = Relación vacía (cero tuplas)
• Si NO se especifica <condición de reunión>, entonces– la <condición de reunión> es TRUE para todas las tuplas, y
– ≡ Χ (REUNIÓN ≡ PROD. CARTESIANO ≡ REUNIÓN CRUZADA)
2.4 Manip. de datos: Álgebra RelacionalReunión o Join entre dos relaciones (y 7)
66Tema 2. Modelo relacional de datos
A B• Caso particular de reunión, quizá el más importante• No «necesita» especificar condición de reunión, pues...• ... iguala todos los pares de atributos con igual
nombre en A y B– Es una EQUI-REUNIÓN + eliminación de atributos superfluos
Sólo conserva un atributo de reunión– La definición estándar de reunión natural exige que los
atributos de reunión deben tener nombre idéntico en ambas relaciones operando
– Si no es así, aplicar antes un renombramiento de atributos– deben tener el mismo dominio
2.4 Manip. de datos: Álgebra RelacionalReunión natural entre relaciones
67Tema 2. Modelo relacional de datos
R(a, b, c) S(b, d)
T1 ← R R.b=S.b S, tiene el esquema T1 ( a, R.b, c, S.b, d )
T2 ← R S, tiene el esquema T2 ( a, b, c, d )
2.4 Manip. de datos: Álgebra RelacionalReunión natural entre relaciones (2)
S-43-51
db
100100
c
-4-5dT1
11103320
S.bR.ba
R100110
300530100320
cba
100100
c
-4-5dT2
110320
ba
68Tema 2. Modelo relacional de datos
• Ejemplos:1. Título de todas las películas junto con el título y resumen de su guión
GUIO(guion, titGuion, resumen, nomAutorPpal, fechaFin, fechaEntrega) ← GUION
RESUMEN ←∏titulo, titGuion, resumen (PELICULA GUIO)
2. Títulos de películas junto con el nombre y apellidos de su directorDIREC(director, nombre, apellidos, nacio, fechaNacim, operaPrima) ← DIRECTOR
PELI_DIRE ←∏titulo, nombre, apellidos (PELICULA DIREC)
3. Nombre de actores y de las agencias que los representanAGENC(agencia, nomAg, direccion, telefono) ← AGENCIA
ACT_AGEN ←∏nombre, nomAg (ACTOR AGENC)
¿A qué se debe el renombramiento en cada caso?
2.4 Manip. de datos: Álgebra RelacionalReunión natural entre relaciones (y 3)
69Tema 2. Modelo relacional de datos
Sean las relaciones A(a1, a2, ... an, b1, b2, ... bm) y B(b1, b2, ...bm)• A÷B es una relación tal que:
Esquema: Relación con los atributos no comunes R( a1, a2, ... an )Estado: Conjunto de tuplas { (ai1, ai2, ... ain) } tal que existe
en A una tupla (ai1, ai2, ... ain, bj1, bj2, ... bjm) paraTODAS las tuplas (bj1, bj2, ... bjm ) de B
• Poco común. Útil para consultas especiales ocasionalesNombres de los actores que trabajan en todas las películas dirigidas por los
hermanos Cohen• Para que una tupla t aparezca en el resultado, los valores
de t deben aparecer en A en combinación con todas las tuplas de B
2.4 Manip. de datos: Álgebra RelacionalDivisión entre relaciones ÷
70Tema 2. Modelo relacional de datos
y1, y4 aparecen en A en combinación con las 3 tuplas de B, por eso están en el resultado R = A ÷ B
El resto de valores de y en A, no aparecen con todas las tuplas de B y no son seleccionadas: y2 no aparece con x2, e y3 no aparece con x1
A a b y1 x1 y1 x2 y1 x3 y1 x4 y2 x1 y2 x3 y3 x2 y3 x3 y3 x4 y4 x1 y4 x2 y4 x3
B b x1 x2 x3
R a y1 y4
2.4 Manip. de datos: Álgebra RelacionalDivisión entre relaciones (y 2)
71Tema 2. Modelo relacional de datos
• Algunas consultas comunes no pueden expresarse con las operaciones estándar del Álgebra Relacional– Ampliación de su poder expresivo con operaciones adicionales– Incluidas en la mayoría de los lenguajes de consulta relacionales
comerciales
• Funciones de agregados– Funciones matemáticas de agregados sobre colecciones de valores de
la base de datosValor medio del caché de todos los actoresNúmero de películas (almacenadas en la BD)Máximo porcentaje de comisión de las distribuidoras de películasMínima recaudación en taquillaCantidad total pagada a los actores de cierta película
2.4 Manip. de datos: Álgebra RelacionalOtras operaciones del Álgebra Relacional
72Tema 2. Modelo relacional de datos
• Funciones aplicadas a un conjunto de tuplas– SUMA– PROMEDIO– MÁXIMO– MÍNIMO– CUENTA (número de tuplas en una relación)
• Agrupación de tuplas según valor de ciertos atributos– Puede aplicarse una función agregada a cada grupo por separado* Media del caché de los actores agrupados por agencias ¿Solución?
Agrupar actores según su agencia representante (valor de atributo agencia) » Cada grupo incluye tuplas de actores representados por la misma agencia
Cálculo del caché medio de cada grupo (función PROMEDIO)• El resultado es una relación R(agencia, PROMEDIO_caché)
2.4 Manip. de datos: Álgebra RelacionalFunciones de agregados
73Tema 2. Modelo relacional de datos
2.4 Manip. de datos: Álgebra RelacionalFunciones de agregados (2)
ACTOR
a1
a10
a2
a3a4
a9a5
a8a7
a6
AG1
AG2AG3
AG8
Media del cache de a8 y a10AG2Media del cache de a7, a1 y a4AG1
RMedia del cache de a9 y a2AG8
Media del cache de a5, a6 y a3AG3
PROMEDIO_cacheagencia
RMedia del cache de a1... a10
PROMEDIO_cache
74Tema 2. Modelo relacional de datos
<atributos de agrupación> F <lista funciones>(<relación>)
• <atributos de agrupación> – Lista de nombres de atributos de <relación>– Indican atributos con los que construir los grupos– Puede estar vacía la relación es un (único) grupo
• <lista funciones> – Lista de pares <función> <atributo>
donde <función> ∈ {SUMA, PROMEDIO, MÁXIMO, MÍNIMO, CUENTA}y <atributo> es uno de los atributos de <relación>
• Resultado: una relación R, tal queEsquema: atributos de <atributos de agrupación> +
un atributo por cada elemento de <lista funciones>Cuerpo: conjunto de tuplas tal que existe una por cada grupo
2.4 Manip. de datos: Álgebra RelacionalFunciones de agregados (3)
75Tema 2. Modelo relacional de datos
• Ejemplos:1. Códigos de Películas, número de actores en cada película y su paga mediaR(codpeli, numActores, pagaMedia)← film F CUENTA actor,PROMEDIO paga(ACTUA_EN)2. Códigos de agencias, número de actores en cada agencia y caché medioR(codAg, numActores, cacheMedio)←agencia F CUENTA codA,PROMEDIO cache(ACTOR)
• Si no se indican nombres para los atributos de la relación resultado R, dicha relación incluirá...– un atributo por cada atributo incluido en <atributos de agrupación>,
con el mismo nombre, y– un atributo por cada función incluida en <lista funciones>,
denominado FUNCIÓN_atributoLos esquemas de las relaciones resultado de los ejemplos anteriores serían:1. R(film,CUENTA_actor, PROMEDIO_paga)2. R(agencia, CUENTA_codA, PROMEDIO_cache)
2.4 Manip. de datos: Álgebra RelacionalFunciones de agregados (4)
76Tema 2. Modelo relacional de datos
• Si no se especifican atributos de agrupación– Toda la relación es un único grupo– Las funciones se aplican a todas las tuplas– La relación resultado tendrá una sola tupla
* Número de películas y recaudación mediaF CUENTA codP,PROMEDIO taquilla(PELICULA)
• El resultado de aplicar una función agregada siempre es una relación, no un nº escalar, aunque tenga un único valor* Recaudación máxima obtenidaF MÁXIMO taquilla(PELICULA)
2.4 Manip. de datos: Álgebra RelacionalFunciones de agregados (y 5)
R232.850
MAXIMO_taquilla
77Tema 2. Modelo relacional de datos
• No pueden expresarse en el Álgebra Relacional• Se aplican a una referencia recursiva entre tuplas del mismo
tipo (empleado y jefe en la relación EMPLEADO)
* Códigos de los empleados que tienen como superior a “e”, en todos los niveles
_________________Nivel 1
_________________Nivel 2
_________________Nivel 3
etc.
e
e11 e12 ... e1n
e21... e2 m ... ... ... e2p
e31... e3q ... e3r ... ... ... e3t...
2.4 Manip. de datos: Álgebra RelacionalOperaciones de cierre recursivo
78Tema 2. Modelo relacional de datos
• En Álgebra Relacional es sencillo especificar empleados cuyo jefe es “e” en cierto nivel conocido, pero no en todos los niveles
Ejemplo para el nivel 2: código de los empleados cuyo jefe directo es “e” o bien su jefe es un empleado cuyo jefe es “e”
EMP_JEF(codE, codJ) ←∏codemp, codjefe (EMPLEADO)
EMP_1(cod) ←∏codE (σcodJ=“e” (EMP_JEF)) Empleados de nivel 1
EMP_2(cod) ←∏codE (EMP_JEF codJ=cod (EMP_1)) Empleados de nivel 2
RESULTADO ← EMP_1 ∪ EMP_2
2.4 Manip. de datos: Álgebra RelacionalOperaciones de cierre recursivo (y 2)
79Tema 2. Modelo relacional de datos
• Extensión de la operación REUNIÓN• Permiten conservar todas las tuplas en A o B o ambas,
aunque...– No tengan tuplas coincidentes– Contengan nulos en los atributos de reunión
* Nombres de actores y de sus agencias representantes, si tienenAGEN(codAg, nomAg, direccion,telefono) ← AGENCIA
TEMP ← (ACTOR agencia=codAg AGEN)
RESULTADO ←∏nombre, nomAg (TEMP)
2.4 Manip. de datos: Álgebra RelacionalReunión externa (Outer-join) entre relaciones
80Tema 2. Modelo relacional de datos
• REUNIÓN EXTERNA IZQUIERDA R = A B– Conserva en R todas las tuplas de A– Si no encuentra una tupla coincidente en B, cada atributo de R
(correspondiente a B) es NULO
• REUNIÓN EXTERNA DERECHA R = A B– Conserva en R todas las tuplas de B– Si no encuentra una tupla coincidente en A, cada atributo de R
(correspondiente a A) es NULO
• REUNIÓN EXTERNA COMPLETA R = A B– Conserva en R todas las tuplas de A y de B– Cuando no encuentra tuplas coincidentes, rellena con NULO
2.4 Manip. de datos: Álgebra RelacionalReunión externa entre relaciones (2)
81Tema 2. Modelo relacional de datos
* Nombres de agencias y de los actores a los que representan, incluyendo... 1.- las agencias que no representan a ningún actor
R1= πnomAc, nomAg (ACTOR agencia=codAg AGENCIA)2.- los actores que no tienen agencia de representación
R2 = πnomAc, nomAg ( ACTOR agencia=codAg AGENCIA3.- tanto las agencias que no representan a ningún actor, como los actores que no
tienen agenciaR3 = πnomAc, nomAg ( ACTOR agencia=codAg AGENCIA
2.4 Manip. de datos: Álgebra RelacionalReunión externa entre relaciones (3)
...ACTORA23Carmelo Gómez
NULLJavier BardemA10Pere PonceA03María Pujalte
...agencianomAc AGENCIAAgeRepA10
ARAA23ActorsMngrA03ReprActorsA30
...nomAgcodAg
82Tema 2. Modelo relacional de datos
2.4 Manip. de datos: Álgebra RelacionalReunión externa entre relaciones (y 4)
ACTOR AGENCIAARACarmelo Gómez
ReprActorsNULLAgeRepPere PonceActorsMngrMaría Pujalte
nomAgnomAc
ACTOR AGENCIAARACarmelo Gómez
NULLJavier BardemAgeRepPere PonceActorsMngrMaría Pujalte
nomAgnomAc
ACTOR AGENCIA
ReprActorsNULL
ARACarmelo Gómez
NULLJavier BardemAgeRepPere PonceActorsMngrMaría Pujalte
nomAgnomAc
83Tema 2. Modelo relacional de datos
• Lenguaje formal para BD Relacionales• Basado en Cálculo de Predicados de Primer Orden (rama
de Lógica Matemática)
2.4 Manipulación de datos2.4.2. Cálculo Relacional
- Expresiones Declarativas(lenguaje no procedimental)
» Aunque se anidan para formar una sola expresión, siempre se indica explícitamente cierto ordende las operaciones
» Estrategia parcial de evaluación de la consulta (≈ lenguaje procedimental de alto nivel )
» No se indica CÓMO evaluar la consulta, sino QUÉ se desea obtener
» Describe la información deseada sin dar un procedimiento específico para obtenerla
- Secuencias de Operaciones
Cálculo Relacional vs. Álgebra Relacional
84Tema 2. Modelo relacional de datos
• Poder expresivo idéntico de álgebra y cálculo relacionalesCualquier obtención de datos especificada en el Álgebra
Relacional puede expresarse en el Cálculo Relacional (restringido a expresiones seguras) y viceversa
• Definición: Lenguaje Relacionalmente CompletoLenguaje en el que es posible expresar cualquier consulta
que pueda especificarse en el Cálculo Relacional– Cálculo Relacional como medida del poder selectivo de lenguajes
relacionales
• Formas de adaptar el Cálculo de Predicados de 1er Ordenpara crear un Lenguaje de Consultas para BDR: Cálculo Relacional de Tuplas (CRT) –– Codd, 1972
Cálculo Relacional de Dominios –– Lacroix y Pirotte, 1977
2.4 Manip. de datos: Cálculo Relacional
85Tema 2. Modelo relacional de datos
• CRT basado en la especificación de variables de tupla• Toda variable de tupla «abarca» o recorre una relación
puede tomar como valor cualquier tupla de esa relación
{ t | COND(t) }• Resultado: conjunto de tuplas t que satisfacen la condición COND(t)• COND(t): expresión condicional en la que interviene la var. de tupla t
* Actores cuyo caché rebasa los 2.000€{ t | ACTOR(t) and t.cache>2000 }
– ACTOR(t) indica que ACTOR es la Relación de Intervalo que t recorre– t.cache hace referencia al atributo caché de la variable de tupla t
2.4 Manip. de datos: Cálculo RelacionalExpresiones de consulta
86Tema 2. Modelo relacional de datos
• Obtención de algunos atributos de las tuplas seleccionadas{ <lista atributos> | COND(t) }
• Ejemplos:
* Nombre y nacionalidad de los actores cuyo caché rebasa los 2.000€{ t.nombre, t.nacionalidad | ACTOR(t) and t.cache>5000 }
* Fecha de nacimiento y nombre real del actor “Javier Bardem”{ t.fechaNacim, t.nombreReal | ACTOR(t) and t.nombre = “Javier Bardem” }
2.4 Manip. de datos: Cálculo RelacionalExpresiones de consulta (y 2)
87Tema 2. Modelo relacional de datos
Una expresión del Cálculo Relacional contiene:
• Para cada variable de tupla t, su relación de intervalo R: R(t)
• Condición de selección de combinaciones de tuplasConforme las variables de tupla recorren sus relaciones, la condición se evalúa para cada combinación de tuplasLas combinaciones que dan TRUE se seleccionan para el resultado
• Lista de atributos solicitadosSe obtienen sus valores para cada combinación seleccionada
2.4 Manip. de datos: Cálculo RelacionalExpresión del CRT: punto de vista informal
88Tema 2. Modelo relacional de datos
• Expresión General
{ t1.a1, t2.a2, ... , tn.ap | COND(t1, t2, ..., tn, tn+1,tn+2,...tn+m) }
donde:
– t1, t2, ..., tn, tn+1, tn+2, ... tn+m son variables de tupla
– ai es un atributo de la relación que tj recorre
– COND(..): fórmula (bien formada) del Cálculo Relacional de Tuplas
constituida por átomos del Cálculo de Predicados
2.4 Manip. de datos: Cálculo RelacionalExpresión del CRT: punto de vista formal
89Tema 2. Modelo relacional de datos
• Átomos– R(ti) el intervalo de la variable de tupla ti es la relación R– ti.a op tj.b ,, op ∈ { =, ≠, <, ≤, >, ≥ }
ti y tj variables de tuplaa atributo de la relación que ti abarcab atributo de la relación que tj abarca
– ti.a op c ,, c op tj.b ,, op ∈ { =, ≠, <, ≤, >, ≥ }ti y tj variables de tuplaa atributo de la relación que ti abarcab atributo de la relación que tj abarcac valor constante
Los átomos están ligados mediante operadores and, or, not y →
2.4 Manip. de datos: Cálculo RelacionalExpresión del CRT: punto de vista formal (2)
90Tema 2. Modelo relacional de datos
• Valor lógico de un átomoEvaluación del átomo para una combinación específica de tuplas
valor TRUE o FALSE– R(ti)
TRUE si se asigna una tupla de R a tiSi no, es FALSE
– ti.a op tj.b ,, ti.a op c ,, c op tj.bTRUE si ti y tj se asignan a tuplas tales que los atributos especificados (a y b) satisfacen la condición
Si no es así, será FALSE
2.4 Manip. de datos: Cálculo RelacionalExpresión del CRT: punto de vista formal (3)
91Tema 2. Modelo relacional de datos
• Fórmula bien formada (fbf)– Definición recursiva
D1. Todo átomo es una fórmula bien formadaR(ti) ,, ti.a op tj.b ,, ti.a op c ,, c op tj.b
D2. Si F1 y F2 son fbf, también lo son...(F1 and F2), (F1 or F2), not(F1), not(F2) y (F1 → F2)y los valores lógicos de estas fórmulas
se derivan de F1 y F2, según la Lógica BooleanaNota: (F1 → F2) ≡ (not(F1) or F2)
continuará...
2.4 Manip. de datos: Cálculo RelacionalExpresión del CRT: punto de vista formal (4)
92Tema 2. Modelo relacional de datos
• Cuantificadores– Universal ∀ (∀t) (BANCO(t) and not(t.ciudad = ‘Londres’))– Existencial ∃ (∃t) (BANCO(t) and t.ciudad = ‘Amsterdam’)
• Variable de tupla libre y ligada en una fbfinformal
t está ligada si está cuantificada ( aparece en cláusulas (∀t) o (∃t) )si no, está libre
2.4 Manip. de datos: Cálculo RelacionalExpresión del CRT: punto de vista formal (5)
93Tema 2. Modelo relacional de datos
• Variable de tupla libre y ligada en una fbfformal
– Si F ≡ átomo, cualquier ocurrencia de una variable de tupla t, está libre
– En (F1 and F2), (F1 or F2), not(F1), not(F2) y (F1 → F2),una ocurrencia de t está libre o ligada según lo esté en F1 o F2
– Toda ocurrencia libre de t en F está ligada en F’, si F’=(∃t)F o bien F’=(∀t)Fy t estará ligada al cuantificador especificado en F’
F1 : d.nombre = “Carmelo Gómez”F2 : (∃t) (d.agencia = t.codAg)
La variable de tupla d está libre en F1 y en F2t está ligada al cuantificador ∃ en F2
2.4 Manip. de datos: Cálculo RelacionalExpresión del CRT: punto de vista formal (6)
94Tema 2. Modelo relacional de datos
• Fórmula bien formada (continuación)
D3. Si F es una fbf, también lo es (∃t)F, donde t es una variable de tupla
(∃t)F es TRUE si F es TRUE para al menos una tupla asignada a ocurrencias libres de t en Fde lo contrario es FALSE
D4. Si F es una fbf, también lo es (∀t)F, donde t es una variable de tupla
(∀t)F es TRUE si F es TRUE para toda tupla (en el universo)asignada a ocurrencias libres de t en Fde lo contrario es FALSE
2.4 Manip. de datos: Cálculo RelacionalExpresión del CRT: punto de vista formal (7)
95Tema 2. Modelo relacional de datos
• Fórmula bien formada (continuación)
– Si la fórmula es cerrada (toda variable ligada a cuantificadores), entonces representa una expresión que será TRUE o FALSE
F3 : (∃a) (ACTOR(a) and a.nombre = “Javier Cámara”)F4 : (∀p) (PELICULA(p) (∃d) (DIRECTOR(d) and d.coddir=p.director)
– Si la fórmula es abierta (tiene variables libres), entonces representa una consulta cuya evaluación devolverá los valores de sus variables libres que hacen TRUE la fórmula
F5 : ACTOR(a) and a.fechaNacim > 31/12/1971sirve para preguntar por los actores/actrices que nacieron en 1972 o después
2.4 Manip. de datos: Cálculo RelacionalExpresión del CRT: punto de vista formal (8)
96Tema 2. Modelo relacional de datos
• Expresión segura– Su resultado es un número finito de tuplas– Al usar cuantificadores (∃,∀) o negación (not), la expresión ha de tener
sentido: ser segura y no generar una relación infinita
E= {t | not(ACTOR(t))} tuplas del universo que NO son de ACTOR ¡¡∞!!
• Dominio de una expresión del CRT– Valores constantes en la expresión o que existen en cualquier
tupla de las relaciones a las que se referencia en la expresiónDominio ( E={t | not(ACTOR(t))} )= todos los valores de atributos de tuplas ACTOR
Una expresión es segura si todo valor del resultado ∈ dominio de la expresiónE es insegura, ya que el resultado incluye tuplas (y, por tanto, valores) que no están en la relación ACTOR (es decir, que ∉ su dominio)
2.4 Manip. de datos: Cálculo RelacionalExpresión del CRT: punto de vista formal (y 9)